момент. Таким образом,
является выигрышем статистика, без учета стоимости наблюдений, если он решает окончить процесс выбора. Если процедура продолжается, исходя из этой точки, и значение следующего наблюдения есть х, то состояние
переходит в
где
определено формулой (1) § 13.6.
Пусть, как и раньше,
обозначает средний выигрыш оптимальной процедуры, начинающейся с
. Если
то
удовлетворяет функциональному уравнению
Далее, так как для V выполняется соотношение инвариантности (3) § 13.6, то можно опять положить
Функция
является решением функционального уравнения из следующей леммы.
Лемма 1. Если случайная величина
то для всех
Доказательство этой леммы аналогично доказательству леммы 1 § 13.6 и здесь не приводится. Отметим, однако, что соотношение (2) имеет более сложный вид, чем соотношение (4) § 13.6, поскольку математическое ожидание в правой части (2) зависит как от
так и от
Несмотря на это, как показывает наша следующая лемма, проведение очередного наблюдения оптимально тогда и только тогда, когда
при некотором
Лемма 2. Предположим, что
при заданных
Тогда
для всех
Доказательство. Так как
то найдется процедура, требующая хотя бы одного наблюдения, средний риск которой при выходе из состояния
больше
Пусть
максимальное из значений наблюдений при этой процедуре до окончания выбора. Пусть, далее,
функция распределения для
число проведенных наблюдений. Средний выигрыш процедуры равен тогда
и условие того, что он больше
можно записать в виде
Так как функция
убывает, то (3) имеет место при всех
Значит, если процесс выбора стоит продолжать из точки
то его стоит продолжать и из состояния
откуда видно, что
Таким образом, как и в задаче выбора с отбрасыванием, функция
имеет следующий вид:
Важным различием между задачей выбора с отбрасыванием и настоящей задачей, усложняющим эту последнюю задачу, является то, что при заданном
функция
не является постоянной при
а строго возрастает вместе с
Отметим, что явный вид функции
нам пока не известен. При всех
положим
Здесь
Соотношение (2) можно тогда записать так:
Из (6) видно, что
при всех
Значит,
Гтах
Последнее неравенство в (7) является следствием соотношений (3) § 13.4 и (3) § 11.9, а также того факта, что
Предположим теперь, что для заданной точки
Тогда в силу (6) и
Это неравенство показывает, что средний выигрыш
оптимальной процедуры больше выигрыша
от окончания процесса выбора. Следовательно, согласно оптимальной процедуре, когда имеет место (8), надо проводить дальнейшее наблюдение. Из (4) видно, что если справедливо (8), то
Поэтому из (8) следует, что при всех
Неравенство (9) дает нижнюю границу для функции
Мы покажем, что на самом деле при всех с их, превосходящих некоторые минимальные значения, в (9) имеет место знак равенства.
Лемма 3. Если
то в соотношении (9) имеет место равенство.
Доказательство. Неравенство (9) было выведено из того соображения, что, согласно оптимальной процедуре, при выполнении неравенства (8) стоит делать очередное наблюдение. Для доказательства леммы нам надо показать, что если (8) не имеет места, а (10) справедливо, то, согласно оптимальной процедуре, выбор надо прекратить.
Обозначим через S множество всех точек
для которых выполнены соотношения (10) и
Для доказательства леммы надо проверить, что
при всех
Для всякой пары
и всякого числа х положим
Покажем сначала, что
Поскольку
удовлетворяет неравенству (10), то, как нетрудно видеть, (10) справедливо и при
замененном на
Покажем теперь, что для точки
выполняется соотношение (11).
При любых фиксированных
минимум
по х равен
Для каждого фиксированного
левая часть неравенства
является убывающей функцией от
Если положить
то достаточно показать, что
Соотношение (13) равносильно тому, что
а (11) эквивалентно неравенству
Таким образом, достаточно показать, что если имеет место (10), то правая часть (15) не меньше правой части (14). Так как
то из упр. 17 следует, что
Далее, поскольку
в том и только в том случае, когда
то из (10) видно, что правая часть неравенства (16) не может быть положительной и, значит, она не меньше правой части (14). Искомое неравенство доказано.
Мы показали, таким образом, что если точка
принадлежит множеству
то каждое состояние
в которое можно перейти после нового наблюдения, а также состояния, отвечающие всем дальнейшим наблюдениям, также принадлежат Стало быть, в условиях нашей леммы, при отыскании функции
удовлетворяющей соотношению (2), мы можем ограничиться рассмотрением значений
на множестве
Покажем теперь, что при
значения
удовлетворяют соотношению (2). Из (5) видно, что при этих значениях
в (7) имеет место знак равенства. Поэтому, согласно (11),
и из (6) следует, что
удовлетворяет соотношению (2).
Равенство
означает, что, согласно оптимальной процедуре, при
процесс выбора надо закончить.
Мы можем подытожить полученные результаты для задачи выбора без отбрасывания следующим образом.
Теорема 1. Для каждого состояния
где
удовлетворяет соотношению (10), согласно оптимальной процедуре процесс выбора надо заканчивать тогда и только тогда, когда
Для всякого состояния
не удовлетворяющим соотношению (10), все еще верно то, что продолжать процесс выбора является оптимальным решением, если неравенство (17) не имеет места.
Если с
то неравенство (10) будет выполняться при всех значениях
. В этом случае оптимальная процедура полностью описывается теоремой 1. Если с
то неравенство (10) будет иметь место при всех достаточно больших значениях
Однако если с
то неравенство (10) не выполняется ни при каких
Рассмотрим теперь недальновидную процедуру, при которой смотрят вперед каждый раз лишь на один шаг. Согласно этой процедуре, в каждом состоянии процесс выбора продолжается тогда и только тогда, когда исходящее из этой точки продолжение является оптимальным при условии, что до обязательного окончания выбора остается только один шаг. При такой процедуре процесс выбора заканчивается в состоянии
в том и только в том случае, когда выполняется (17). Далее, при
т. е. при увеличении информации статистика о значении
предельное значение правой части неравенства (17) равно
Этот предел характеризует оптимальную процедуру при известном
(см. § 13.5 и упр. 14). Следовательно, процедура, определяемая неравенством (17) и являющаяся оптимальной при выполнении неравенства (10), доставляет хорошую аппроксимацию для оптимальной процедуры при достаточно больших