§ 13.5. Дальнейшие задачи выбора с отбрасыванием и выбора без отбрасывания
Рассмотрим теперь задачу выбора с отбрасыванием из известного распределения, в которой нет верхней границы для числа наблюдений, но задана цена с каждого наблюдения. Более точно, пусть
последовательная повторная выборка из распределения с некоторой известной
и предположим, что если статистик заканчивает процесс выбора по наблюдении значений
то его выигрыш равен
Задача, следовательно, состоит в отыскании правила остановки, максимизирующего
Так как число» наблюдений не ограничено сверху, то мы априори не можем быть уверенными в том, что оптимальное правило остановки существует. Однако, как будет показано в § 13.9, если дисперсия
конечна, то максимальный средний выигрыш
в классе всех правил остановки конечен и существует процедура, средний выигрыш которой равен
Поэтому мы предположим здесь, что оптимальная процедура существует, и дадим метод ее построения и определения значения
После проведения первого наблюдения X статистик либо останавливает процесс выбора, либо продолжает делать наблюдения. В случае остановки его выигрыш равен значению X минус цена наблюдения с. Предположим, что он продолжает процесс выбора. Тогда, так как выбор проводится с отбрасыванием, положение статистика то же, что и перед началом наблюдений, за исключением уплаченной за первое наблюдение цены с. Следовательно, при продолжении выбора средний выигрыш от оптимального продолжения равен
минус цена с уже проведенного наблюдения.
Отсюда следует, что после первого наблюдения X оптимальна» процедура предписывает продолжать выбор, если
и закон чить его, если
. Средний выигрыш от этой оптимальной
процедуры равен
Но, с другой стороны, средний выигрыш оптимальной процедуры по предположению есть
Поэтому
Ввиду равенства (3) § 13.4 соотношение (1) можно записать следующим образом:
Так как с
то из свойств функции
указанных в § 11.8, вытекает существование единственного числа
удовлетворяющего соотношению (2).
Оптимальное правило остановки и его средний выигрыш определяются этим единственным значением
Согласно этому оптимальному правилу, выбор продолжается, если наблюденное значение
и прекращается, если
Средний выигрыш такой процедуры равен у.
В частности, если выборка извлекается из нормального распределения со средним
и стандартным отклонением
то с учетом соотношения (3) § 11.9 получаем
Выбор без отбрасывания. Рассмотрим теперь задачу выбора без отбрасывания. Пусть
последовательная повторная выборка из распределения с
причем каждое наблюдение стоит с единиц. Предположим, что если статистик прекращает выбор после наблюдения значений
то его выигрыш равен
Другими словами, статистик может прекратить выбор на произвольном шаге, взять значение любого из предыдущих наблюдений и получить выигрыш, равный этому значению минус полная стоимость наблюдений.
Основным здесь является тот факт, что, поскольку наблюдения независимы и одинаково распределены, выбор без отбрасывания не дает дополнительных преимуществ статистику сравнительно с выбором с отбрасыванием, и вот по какой причине. При выборе без отбрасывания или с отбрасыванием статистик продолжает процесс наблюдения, пока значения наблюдений меньше, чем выигрыш, ожидаемый от дальнейшего выбора. Более того, этот средний выигрыш остается постоянным от шага к шагу, независимо от числа проведенных наблюдений и их значений. Таким образом статистик не получает от последующих наблюдений никакой новой информации, которая могла бы заставить его закончить процесс выбора и взять в качестве выигрыша значение предыдущего наблюдения, которое было отвергнуто из-за его малости. Даже когда статистик может проводить выбор без отбрасывания, согласно оптимальной процедуре надо продолжать процесс выбора,
покуда наблюденное значение
не превысит у, где у — единственное число, удовлетворяющее соотношению (2). Средний риск такой процедуры равен у.
Если распределение, из которого извлекается последовательная выборка, зависит от неизвестных параметров с заданным априорным распределением, то ситуация резко меняется. В этих случаях средние выигрыши от выбора с отбрасыванием и выбора без отбрасывания различны. Наблюдение, которое было отвергнуто в силу его малости на одном из начальных шагов, когда статистик считает распределение весьма благоприятным для себя, может быть впоследствии сочтено приемлемым, если проведенные наблюдения показали, что распределение не так уж благоприятно, как вначале казалось статистику. В случае выбора без отбрасывания статистик закончит процесс выбора и получит значение одного из предыдущих наблюдений в качестве выигрыша. Мы проиллюстрируем эти замечания в следующих двух параграфах, где будет рассмотрена задача выбора из нормального распределения с неизвестным средним.
Дальнейшие замечания и ссылки на литературу. Задачи рассмотренного в этом параграфе типа изучались Маккином и Миллером (1960), Дермэном и Сэксом (1960), Чжоу и Роббинсом (1961, 1963). Другие варианты задач такого рода исследовали Макколл (1965) и Эльвинг (1967).
Задачи выбора из неизвестного распределения, аналогичные тем, которыми мы будем заниматься в следующих двух параграфах, рассматривал Сакагути (1961).
Задача нахождения правила остановки, максимизирующего
и связанные с ней задачи обсуждались Чжоу и Роббинсом (1965, 1967а), Тейчером и Вольфовицем (1956), Дьюбинсом и Тейчером (1967) и Дворецким (1967).