3.4.
Адаптивный байесов подход
Сущность
этого подхода состоит в следующем. Пусть имеется существенная априорная
неопределенность в описании параметров и/или наблюдений z.
Эта неопределенность не позволяет применить обычный байесов формализм: найти
для каждого правила u(z)
величину среднего риска R(u(z)), величину апостериорного риска R(u,z) и определить положение
минимума R(u,z) по u для каждого z, что и дает оптимальное байесово решение u = u0(z).
Отметим, что
невозможность применения этого формализма связана именно с незнанием, а
не с существованием: на самом деле в любых конкретных условиях
существуют вполне определенные (хотя и неизвестные) истинные значения R(u(z))=Rист(u(z)) для всех u(z), а следовательно, существует и оптимальное решение u0(z),
обращающее Rист(u(z)) в минимум.
Попытаемся
применить этот байесов формализм в условиях априорной неопределенности,
используя сведения, содержащиеся в наблюдениях z для
оценки истинного значения апостериорного риска, чтобы получить его приближенное
значение .
После нахождения оценки остается воспользоваться стандартным
байесовым подходом, используя вместо Rист(u,z).
Таким
образом, адаптивный байесов подход в своей основе ничем не отличается от неадаптивного:
главным остается минимизация среднего (апостериорного) риска. Различие только в
способе достижения этой цели. При наличии априорной неопределенности приходится
модифицировать обычный байесов формализм, вводя в него дополнительные
процедуры. При этом повышается роль наблюдений z
– они уже не просто аргументы известной функции R(u,z), но еще используются
для ее восстановления.
Процесс
восстановления функции R(u,z) называется адаптацией, а полученные
таким способом правила называются адаптивными байесовыми решающими
правилами.
Итак,
адаптивный байесов подход основан на замене точной меры ожидаемых потерь ее
оценкой на основе имеющихся данных. В этом аспекте различные способы адаптации
есть различные способы оценки меры потерь.
Продолжение примера 3. Правило (3.11) нельзя применить, так как неизвестно
значение a. Используем наблюдения z1,….,zn для нахождения
оценки .
Можно, в частности, взять оценку ММП a*, определяемую в нашем случае соотношением
.
Подставляя
это значение a* в (3.11),
получим адаптивное правило
. (3.12)
Если
ошибка мала,
то можно ожидать, что правило (3.12) будет для подавляющего большинства
значений zn+1
давать то же решение, что и (3.11).
Для иллюстрации конкретизируем этот пример, взяв a>0 и
нормальные распределения
и
Тогда
(3.11) приводится к виду
(3.13)
а
правило (3.12) – к виду
(3.14)
Оценкой ММП параметра a в нашем случае будет . При этом ошибка e=a*-a нормальна с
нулевым средним и дисперсией s2/n. Таким образом, вместо области принятия решения u=1 в правиле (3.13) имеем область в правиле (3.14). Эти области
различаются на интервал (a/2;a/2+e/2] или (a/2+e/2; a/2].
При этом e/2 имеет СКО
, стремящееся
к нулю при ,
поэтому разница между правилами тоже сходит на нет.
Найдем средний риск для правил (3.13) и (3.14).
Средний риск для (3.13):
Средний
риск для (3.14):
Величина
нормальна.
При =0 она
имеет среднее значение a/2 и дисперсию (1+1/4n)s2, а
при =1 имеет
среднее -a/2 и ту же
дисперсию. Поэтому
.
Естественно,
что R*>R0, но разница стремится к нулю при и мала уже при относительно
небольших n. Таким образом, адаптивное правило (3.14) асимптотически
оптимально: при увеличении объема данных средний риск R*стремится к
минимальному байесову риску R0 ,
который мы имели бы при отсутствии априорной неопределенности, т. е. при известном
a.
Пример 4.
Имеется И Z = {zij}. На нем, возможно, есть области, отличающиеся от
своего окружения большей средней яркостью. Требуется обнаружить эти области.
Такая задача возникает, в частности, при поиске акваторий, перспективных для
рыбного промысла – таковыми являются участки моря с более высокой средней
температурой, для такого поиска используются тепловизионные И моря.
Зададимся формой области W и ее
окружением R, например, квадрат и рамка, показанные на рис. 3.4.
Если mW и
mR –
математические ожидания отсчетов изображения по W
и по R, то нам нужно выбрать одну из двух альтернатив или. При известных mW и mR решающее правило элементарно:
. (3.15)
Это
правило нужно применить ко всевозможным положениям W
на Z.
Однако mW
и mR неизвестны. Построим адаптивное правило. Для этого
применим в качестве оценок неизвестных mW и mR средние арифметические
наблюдений:
, ,
Рис. 3.4.
где nW и
nR –
количество элементов в W и R. Эти оценки
состоятельны. Но теперь не обязательно влечет
за собой .
Поэтому гипотезу следует
принимать только при >m. Более того, порог m может быть различным для разных положений W, так как
изображение Z может быть неоднородным. Поэтому отнормируем
разность оценкой
СКО в рамке R, т. е. величиной . В результате получим адаптивное правило
. (3.16)
Если все отсчеты изображения имеют
ограниченные дисперсии и постоянные средние в W и R,
то правило (3.16) сходится к правилу (3.15), когда nW и nR стремятся к
бесконечности. При этом порог L0 стремится к нулю.