§ 12.5. Оптимальные ограниченные процедуры последовательного решения
Мы дадим теперь точное построение оптимальной процедуры последовательного решения, основанное на методе индукции назад. Предположим, что каждое наблюдение стоит с единиц. Если
- о. в. п. параметра
и значение
дается формулой (3) § 12.3, то математическое ожидание
определяется по формуле
Предположим теперь, что были наблюдены значения
и статистик должен решить, выбирать ли решение из
без очередного наблюдения или наблюдать
Если
есть апостериорная о. в.
параметра
то риск от принятия решения из
без дальнейших наблюдений павен
Если наблюдается значение
после чего выбираегся решение из
то риск будет равен
Следовательно, средний общий риск от наблюдения
и последующего принятия решения из
есть
Здесь к среднему ущербу байесовского решения прибавляется цена с наблюдения
Таким образом, если значения
хпбыли уже наблюдены, то оптимальная процедура решения предписывает на последнем шаге поступить следующим образом. Если
то выбор заканчивается и
не наблюдается. Если в (2) имеет место противоположное неравенство, то надо наблюдать
Если же обе части (2) совпадают, то риски и от продолжения и от окончания выбора одинаковы и мы предположим для удобства, что в этом случае выбор заканчивается.
Пусть
обозначает риск оптимальной процедуры, в которой производится не более одного наблюдения, и о. в.
параметра
есть ф. Значение
удовлетворяет соотношению
В частности, из предыдущих рассуждений следует, что
это риск, отвечающий оптимальному продолжению выбора после наблюдения значений
Сделаем теперь еще один шаг назад. Предположим, что были наблюдены значения
— апостериорная о. в. п. параметра
Риск от принятия решения из
без дальнейших наблюдений равен
. С другой стороны, если наблюдается
и полученное
значение оказалось х, то апостериорная о. в. п. становится равной
и риск от оптимального продолжения процесса на этом шаге равен
Если учесть цену с наблюдения
то общий риск от проведения этого наблюдения с последующим оптимальным продолжением примет вид
Следовательно, после наблюдения значений
оптимальная процедура может быть задана следующим образом. Если
то следует окончить выбор, не наблюдая
Если же (4) не имеет места, то надо наблюдать
Пусть теперь
риск оптимальной процедуры, согласно которой проводится не более двух наблюдений, причем о. в.
параметра
есть ф. Тогда
удовлетворяет соотношению
В частности, из предыдущего следует, что
совпадает с риском от оптимального продолжения процесса выбора при наблюденных значениях
Вообще, пусть для произвольной о. в. п.
параметра
определено посредством формулы (3) § 12.3 и
определяются следующим рекуррентным соотношением:
(Мы считаем, что все математические ожидания, фигурирующие в (6), существуют.)
Полученные нами результаты можно подытожить в виде следующей теоремы.
Теорема 1. Если априорная о. в. п. параметра
есть то
общий риск оптимальной процедуры последовательного решения, в которой производится не более
наблюдений. Для
если были наблюдены значения
и апостериорная о. в. п. параметра
есть то риск, отвечающий оптимальному продолжению выбора, равен
Следует отметить, что в выражение для риска
не входит стоимость
с первых
наблюдений. Как уже было замечено, для решения о том, продолжать или нет процесс выбора, эта стоимость несущественна.
Мы можем также сформулировать теорему, описывающую вид оптимальной процедуры.
Теорема 2. В классе всех процедур последовательного решения, требующих не более
наблюдений, оптимальная процедура имеет следующий вид. Если
решение из
принимается без дальнейших наблюдений. В противном случае наблюдается
Далее, при наблюденных значениях
для
и апостериорной о. в. п. параметра
равной решение из
выбирается без последующих наблюдений, если
Иначе же наблюдается
Если процесс выбора не оборвался ранее, то он заканчивается после наблюдения
Эту оптимальную процедуру можно кратко охарактеризовать следующим образом. Предположим, что на данном шаге процесса выбора статистик не может проводить более
наблюдений и его о. в. п. для
в текущий момент есть
Тогда следующее наблюдение проводится в том и только в том случае, когда
Следующая теорема устанавливает простое, но важное свойство последовательности функций
Теорема 3. Для всякой о. в. п.
параметра
Доказательство. Неравенство (7) получается рассуждением по индукции, основанным на соотношении (6). Это неравенство следует также из того факта, что риск
минимальный среди рисков всех процедур, требующих не более
наблюдений, а
минимальный риск для более широкого, класса всех процедур, заканчивающихся после проведения не более
наблюдений.