Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше
Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике
§ 13.3. Выбор функции полезности
Рассмотрим теперь детально один специальный выбор функции полезности
связанной с вознаграждением статистика. Предположим, что
и
при
Согласна такой функции полезности, статистик должен максимизировать вероятность выбора предмета ранга 1 среди всех
предметов. Из формулы (3) § 13.2 видно, что при
Так как
при
то
для
Другими словами, статистику нада продолжать наблюдения, если ранг а только что просмотренного предмета отличен от 1. Отсюда следует, что значение
при каждом фиксированном значении
одинаково» для всех
Обозначим это значение через
Из соотношения (5) § 13.2 следует, что
При
формулу (5) § 13.2 можно записать в виде
Из соотношения (2) получаем
Далее, согласно соотношению (1) §
и
Поэтому уравнения (3) и (4) можно решать последовательно начиная с последнего шага. После осмотра
предмета оптимальная процедура предписывает поступать следующим образом. Если ранг а этого предмета среди просмотренных не равен 1, то наблюдения надо продолжать. Если же ранг предмета среди
просмотренных есть 1, то наблюдения следует прекратить при
и продолжать при
Мы найдем сейчас удобное выражение для
Лемма 1. Предположим, что для некоторого значения
Тогда
Доказательство. Предположим, что
Тогда, заменяя в (3) и
на
получаем, что
Таким образом, ввиду (3),
Но это неравенство противоречит предположению о том, что
Предположим, что при оптимальной процедуре наблюдения надо останавливаться, если наблюденный ранг
предмета равен 1. Тогда по лемме 1 осмотр надо закончить также, если наблюденный ранг какого-либо последующего предмета равен 1. Поэтому задача состоит в определении наименьшего значения
которого
Лемма 2. Если
для некоторого
то
Доказательство. Докажем эту лемму методом индукции назад но
При
она справедлива в силу равенств
последнее из которых следует из (4). Предположим, что наше утверждение верно при
и докажем его для
k. В силу (4) и предположения о том, что
получаем
Далее, из леммы 1 выводим:
Следовательно, по предположению индукции
Из (3) и (4) вытекает, что
Пусть
наименьшее значение
для которого
Из равенства (9) и лемм 1 и 2 следует, что при
выполнено соотношение
Далее, согласно лемме
равняется правой части неравенства (10) для
Таким образом, из (9) и из определения
видно, что (10) не имеет места при
Наконец, ясно, что если соотношение (10) (в котором можно произвести сокращение на множитель
не выполнено для заданного значения
то оно нарушается и при меньших значениях
Следовательно,
наименьшее значение
при котором справедливо соотношение (10), или, что то же самое, соотношение
Оптимальную процедуру можно теперь описать следующим образом.
Рис. 13.1. Верхняя граница для
Пусть
наименьшее натуральное число, удовлетворяющее неравенству (11). Осмотр заведомо продолжается до наблюдения
предметов. Если
предмет имеет ранг 1, то процесс осмотра прекращается и выбирается этот предмет. В противном случае осмотр продолжается до наблюдения предмета ранга 1.
Если ранг
предмета среди уже просмотренных равен 1 и, следовательно, статистик выбирает его, то вероятность того, что ранг этого предмета среди всех
предметов также равен 1, есть
Если ранг
предмета отличен от 1 и осмотр продолжается, то вероятность того, что статистик выберет предмет, имеющий ранг 1 среди всех
предметов, равна
Согласно (11), это значение
близко к
Итак, в каждом случае вероятность выбрать предмет ранга 1 равна приблизительно
Для значения
можно указать простую приближенную формулу. На рис. 13.1 площадь под кривой между прямыми
и
равна
а сумма площадей прямоугольников совпадает с суммой в левой части соотношения (11). На рис. 13.2 площадь под кривой между прямыми
равняется
сумма площадей прямоугольников опять-таки есть сумма из левой части
Рис. 13.2. Верхняя граница
Поэтому
Из (13) видно, что для больших значений
значение
приблизительно равно 1, так что
Значит, согласно оптимальной процедуре надо просмотреть приблизительно
часть предметов и затем выбрать первый предмет ранга 1. При этом вероятность выбрать предмет, имеющий ранг 1 среди всех
предметов, приближенно равна
, даже для произвольно больших значений
Дальнейшие замечания и ссылки на литературу. Изложение настоящего параграфа в основном следует Линдли (1961а). Последний рассмотрел, кроме того, вариант задачи (представленный в упр. 3), где статистик должен минимизировать средний ранг выбираемого предмета. Этот вариант изучали также Чжоу, Моригути, Роббинс и Сэмюэлс (1964). Они показали, что при
средний ранг для оптимальной процедуры стремится к
Обширное исследование задачи этого параграфа и некоторых связанных с ней провели Гилберт и Мостеллер (1966). В частности, они рассмотрели случай (представленный в упр. 1), в котором статистик должен максимизировать вероятность выбора одного из к лучших предметов. В их работе приведен список работ, посвященных задачам такого типа.