§ 12.12. Функциональное уравнение
Рассмотрим теперь некоторые общие методы получения приближений и оценок для риска
оптимальной процедуры в произвольной задаче последовательного решения.
Предположим, что на данном шаге процедуры распределение параметра
есть
и проводится наблюдение X. Тогда апостериорным распределением для
является
а риск от оптимального продолжения выбора после наблюдения X по определению равен
Общий риск от проведения наблюдения и последующего оптимального продолжения равняется
где с — цена наблюдения X, а математическое ожидание вычисляется согласна маргинальному распределению X, индуцируемому распределением
параметра
Статистик может либо проводить наблюдение X, либо выбирать решение без этого наблюдения. Во втором варианте риск равен
Так как оптимальному варианту отвечает наименьший риск, то для любого распределения
параметра
должно выполняться следующее соотношение:
Эта формула является основным функциональным уравнением, которому должен удовлетворять байесовский риск
Она связана с принципом оптимальности из § 12.4, который может быть переформулирован здесь следующим образом: для оптимальной процедуры продолжение процесса после сделанного наблюдения должно быть само оптимальной процедурой, если рассматривать апостериорное распределение
как новое априорное распределение.
Пусть В обозначает множество всех распределений
параметра
со свойством
Оптимальную процедуру последовательного решения можно охарактеризовать следующим образом. Первое наблюдение надо проводить в том и только в том случае, когда априорное распределение
не принадлежит множеству В. На каждом последующем шаге процедуры процесс выбора продолжается тогда и только тогда, когда апостериорное распределение
параметра
на этом шаге не принадлежит множеству В. Выбор заканчивается, как только распределение
попадает в множество В.
Функция
может быть вычислена статистиком. Следовательно, если ему известна и функция
то могут быть построены множество В и оптимальная процедура
Например, если бы функцию
можно было найти непосредственно из соотношения (1), то была бы известна и процедура
Вопросам существования и единственности решений функциональных уравнений такого типа посвящено большое количество работ [см., например, Беллман (1957а), гл. 4]. Мы приведем здесь некоторые относящиеся сюда результаты. В конкретных задачах определить
из соотношения (1), как правило, не удается. Однако существуют общие методы аппроксимации решения
которые мы также рассмотрим достаточно подробно.
Обозначим через S некоторое множество распределений
параметра
включающее в себя как априорное распределение, так и все распределения, которые могут появиться в процессе выбора. В примере § 12.11, где априорное распределение для
нормальное со средним
и мерой точности
в качестве множества S удобно выбрать множество всех нормальных законов с мерой точности, не меньшей
. В задаче решения, где
может принимать только к различных значений, удобно считать, что S - множество всех распределений, сосредоточенных в к точках. Вообще, в каждой задаче последовательного решения, допускающей сопряженное семейство распределений
типа, указанного в гл.
задать подходящее множество S несложно.
Будем говорить, что задача последовательного решения стабильна, если для каждого распределения
выполнено следующее соотношение:
Для всякого априорного распределения
параметра
обозначим через
риск процедуры, оптимальной в классе всех процедур, требующих не более
наблюдений, и через
риск процедуры, оптимальной в А, Из следствий 1 и 2 § 12.10 следуетг что в стабильной задаче решения при всех распределениях
Рассмотрим теперь такое функциональное уравнение:
Входящее сюда математическое ожидание определено формулой (1) § 12.5, в которой функцию
надо заменить на произвольную функцию у. Нашей целью является отыскание всех функций у, заданных на множестве
удовлетворяющих уравнению (4) при всяком распределении
Из (1) видно, что
есть решение этого уравнения. Согласно следующей теореме, в стабильной задаче решения байесовский риск
является единственным неотрицательным решением уравнения (4).
Теорема 1. В стабильной задаче решения байесовский риск
является единственной неотрицательной функцией, удовлетворяющей уравнению (4).
Доказательство. Поскольку нам уже известно, что
решение уравнения (4), достаточно показать, что это уравнение не может иметь более одного решения. Предположим, что две неотрицательные функции
удовлетворяют уравнению (4).