§ 13.8. Существование оптимальных правил остановки

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

§ 13.8. Существование оптимальных правил остановки

В этом и следующем параграфах мы установим существование оптимального правила остановки для широкого класса задач, включающего в себя как задачи § 13.5 —13.7, так и задачи последовательного статистического решения из гл. 12. Мы будем основываться на рассуждениях § 12.8 и 12.9, где было доказано существование оптимальной процедуры последовательного решения, и сделаем здесь две вещи: (1) распространим результаты § 12.9 на случай более общих задач об оптимальной остановке и (2) найдем дополнительные условия, при которых это распространение законно.

Пусть последовательность наблюдений с заданным совместным распределением, и при пусть случайная величина, зависящая лишь от первых наблюдений Предположим, что если статистик заканчивает выбор после наблюдения значений то его выигрыш равен Нас будет интересовать вопрос о существовании правила остановки, максимизирующего средний выигрыш

При заданном правиле остановки среднее существует тогда и только тогда, когда

В частности, существует, если найдется число такое, что выполнено любое из следующих условий:

Предположение о том, что известно совместное распределение наблюдений последовательной выборки, достаточно общо для того, чтобы охватить задачи выбора как из заданного распределения, так и из распределения с параметрами, для которых указано априорное распределение. Основное различие между этими двумя случаями видно из следующего. Если последовательная повторная выборка из известного распределения, то наблюдения независимы и одинаково распределены. Если последовательная повторная выборка из распределения с неизвестным параметром для которого задано априорное распределение, то наблюдения по-прежнему одинаково распределены, но в силу их зависимости от они уже не независимы. В обоих случаях, однако, определено совместное распределение наблюдений.

Относительно последовательности сделаем два предположения. Во-первых, пусть случайная величина определена равенством для каждой последовательности наблюдений значение есть супремум значений последовательности Мы будем считать, что

Из (5) следует, что даже если статистик может наблюдать всю последовательность и затем выбирать любое из значений в качестве выигрыша, то средний выигрыш будет конечен.

Во-вторых, для того чтобы быть уверенным в том, что статистику не следует продолжать наблюдения бесконечно долго, никогда не оканчивая процесс выбора, мы предположим, что с вероятностью 1

В соответствии со сказанным в § 12.7 будем употреблять один и тот же символ для обозначения заданного правила остановки, соответствующего момента остановки и случайного числа наблюдений, требуемых этим правилом остановки. Через А обозначим множества правил остановки для которых Для всякой процедуры пусть означает средний выигрыш Положим также

Так как для каждой процедуры то из (5) видно, что Мы покажем сейчас, что существует оптимальное правило остановки т. е. правило остановки со свойством и Как уже отмечалось, наше изложение существенно опирается на рассуждения § 12.8 и 12.9.

Теорема 1. Если выполнены условия (5) и (6), то найдется правило остановки такое, что

Доказательство. Назовем правило остановки регулярным, если для каждого множества наблюденных значений со свойством выполнено соотношение

Это определение вполне аналогично определению (1) § 12.8. Как и там, мы можем рассматривать только регулярные правила остановки.

Пусть последовательность регулярных правил остановки из А, для которых

При пусть обозначает правило остановки, предписывающее проводить очередное наблюдение на данном шаге тогда и только тогда, когда его надо проводить согласно хотя бы одному из правил остановки Пусть, далее, правило остановки, согласно которому наблюдение на данном шаге надо делать, если этого требует хотя бы одна из процедур Тогда так же, как и в лемме 2 § 12.9, можно показать, что и при

Из соотношений (9) и (10) видно, что при

Следовательно, оптимальность правила остановки будет доказана, если мы покажем, что и

Как и раньше, для последовательности наблюденных значений имеем

С другой стороны, если то положим Тогда из (6) видно, что и в этом случае (12) также имеет место.

Так как то из (5) и теоремы Фату — Лебега следует, что

Значит,

Покажем теперь, что Если то что противоречит неравенству (14). Таким образом,

Из (7) вытекает теперь, что Отсюда и из (14) выводим оптимальность

Теорема 1 — достаточно общая и охватывает весьма широкий класс задач об оптимальной остановке. Если положить

при то она будет применима к задачам последовательного статистического решения, рассмотренным в гл. 12. Если в некоторой задаче статистик может делать не более наблюдений, то можно считать, что при

Приведем теперь простой пример, в котором оптимальное правило остановки отсутствует.

ПРИМЕР. Предположим, что статистик участвует в последовательности выгодных для него пари следующим образом. При каждом пари его капитал либо удваивается с вероятностью либо теряется с вероятностью При заданном начальном капитале пусть обозначает сумму, которой располагает статистик после пари Тогда для каждой конечной последовательности его состояний распределение таково, что с вероятностью с вероятностью Покажем, что не существует правила остановки, максимизирующего

Если на некотором шаге состояние статистика равно то, поскольку его среднии капитал после одного пари есть Поэтому, если только статистик на потерял весь свой капитал, ему есть смысл проводить очередное пари. Но во всяком пари вероятность его проигрыша равна значит, если играть каждый раз, пока есть деньги, рано или поздно все состояние будет потеряно. Оптимальное правило остановки, таким образом, отсутствует.

В этом примере разумной процедурой представляется следующая: выбрать некоторое целое и закончить игру с выигрышем после пари, если только не разоришься на первых пари. Конечно, правилу, рекомендующему остановку после пари, отвечает больший выигрыш.

<< Предыдущий параграф

Следующий параграф >>

Оглавление