Доказательство. Процедура
совпадает с
за тем исключением, что могут наблюдаться значения
для которых
предписывает окончить выбор, а
велит продолжать наблюдение согласно
. В таких точках
выполняется следующее соотношение:
Первое равенство здесь следует из того факта, что процедуры
и
согласуются после наблюдений
Неравенство в (1) вытекает из того, что регулярная процедура
требует продолжения процесса выбора. Последнее равенство в (1) означает, что при процедуре 64 выбор оканчивается. Следовательно,
Аналогичные рассуждения показывают, что и
Лемма 2. Пусть
последовательность регулярных процедур решения и
Тогда процедура
регулярна для всех
и выполнены следующие неравенства.
Доказательство. Так как
то из леммы 1 следует регулярность процедур
а также справедливость соотношения (2) при
соотношения (3) при
Далее, так как
то опять-таки из леммы 1 и доказанных свойств процедуры
вытекает регулярность процедуры
и справедливость соотношения (2) при
и соотношения (3) при
Доказательство завершается рассуждением по индукции.
Используя то обстоятельство, что каждая из процедур
принадлежит классу А, нетрудно показать, что и каждая из процедур
также лежит в этом классе. Таким образом,
при
Согласно следующей лемме, процедура
также принадлежит классу А.
Лемма 3. Пусть процедуры решения
определены, как в лемме 2 и
Тогда
Доказательство. Для всякой процедуры решения или момента остановки
и каждого натурального числа
имеем
Следовательно, из (3) и соотношения (1) § 12.7 вытекает, что при всех натуральных
Поэтому
Из определения процедур
следует, что для всякого натурального
при
Таким, образом,
Теперь ясно что
Соотношение (7) равносильно тому, что
Мы покажем теперь, что риск процедуры у не превосходит риска каждой из процедур исходной последовательности. Нам понадобится следующий результат, известный как теорема фату — Лебега, доказательство которого имеется, например, у Лоэва (1963), стр. 135, и у Крикеберга (1965), стр. 43.
Теорема Фату — Лебега. Пусть
последовательность неотрицательных функций, заданных на пространстве
-функция на
равная
Тогда
Лемма 4. Пусть процедуры решения
определены, как в леммах 2 и 3. Тогда при
Доказательство. Для каждой процедуры
как момент остановки
так и риск
могут рассматриваться как функции на пространстве
Из определения процедуры у видно, что
Далее, согласно лемме 3, с вероятностью 1 выполняется соотношение
Поэтому с вероятностью 1 верно равенство
Из соотношения (1) § 12.7 и теоремы Фату — Лебега вытекает теперь, что
Из соотношений (13), (2) и (3) следует (10).
Теперь мы можем доказать наш основной результат.
Теорема 1. В классе А существует оптимальная процедура последовательного решения.
Доказательство. Пусть
последовательность процедур из А, для которой
Можно считать, что каждая из процедур
регулярна. Положим
Из лемм 3 и 4 видно, что
и
Поэтому из (14) следует, что
Так как
то в (16) должен иметь место знак равенства; тем самым процедура
оптимальна.
Дальнейшие замечания и ссылки на литературу. Общая теория оптимальных процедур последовательного решения была создана Вальдом (1950). Дальнейшие исследования в этой области проводились Эрроу, Блекуэллом и Гиршиком (1949), Вальдом и Вольфовицем (1950) и
Камом (1955). При доказательстве существования оптимальной процедуры мы следовали в основном работам Чжоу и Роббинса (1963, 1967b).