Главная > Оптимальные статистические решения
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

§ 12.6. Примеры

Несмотря на теоретическую простоту построенной оптимальной процедуры, вычисление функций для значений больших 4 или 5, во многих задачах является весьма трудоемким процессом. Мы приведем здесь четыре примера разной степени вычислительной сложности. Эти примеры помогут глубже раскрыть природу оптимальной процедуры последовательного решения.

ПРИМЕР 1. Пусть последовательная повторная выборка из распределения Бернулли с неизвестным значением параметра Предположим, что либо либо и статистик должен указать истинное значение будем считать, что пространство решений есть а функция потерь задается таблицей 12.1, причем каждое наблюдение стоит 1 единицу и априорное распределение параметра определяется

вероятностью Вычислим значения

Из таблицы 12.1 видно, что является байесовским решением при байесовским решением для

Таблица 12.1 (см. скан)

Поэтому

Как видно из (1), при Далее, из симметрии задачи следует, что для и всех значений Следовательно, достаточно вычислить для значений лежащих в интервале

При пусть обозначает апостериорную вероятность того, что если единственное наблюдение X дало значение х. По теореме Байеса

Из (1) и (2) выводим

Маргинальное распределение каждого наблюдения X таково:

Элементарные вычисления дают

Рис. 12.1. Функции риска из примера 1.

Так как , то

Перейдем к определению Заметим, что из (2) следует попарная эквивалентность соотношении и

Расчет основывающийся на формулах (4) и (6), а также на свойстве симметрии функции дает следующий результат:

Следовательно,

Графики функций приведены на рис. 12.1. Вычисление функций для больших значений становится все более громоздким ввиду возрастания вместе с числа участков линейности функций. Далее, если отбросить условие симметрии задачи, то вычисления также значительно усложнятся.

Таблица 12.2 (см. скан)

Однако если число наблюдений не ограничивать сверху, то оптимальная процедура в этом примере может быть найдена с помощью методов, изложенных в § 12.14-12.16.

ПРИМЕР 2. Предположим, что в условиях примера 1 функция потерь задается таблицей 12.2.

В силу соображений симметрии здесь, как и в примере при Имеем

для Далее» проводя вычисления, аналогичные вычислениям в примере 1, получаем

Поэтому в силу соотношения (3) § 12.5 заключаем, что

Из (2) видно, что тогда и только тогда, когда тогда и только тогда, когда в том и только в том случае, когда Поэтому

Из соотношения (5) § 12.5 получаем, что

Из полученных результатов следует, что при всех Это, конечно, весьма специальный результат. Более того, из соотношения (6) § 12.5 выводим, что при

По индукции заключаем, что для

Полученный нами результат можно интерпретировать следующим образом. Для всякой априорной вероятности независимо от того, какова верхняя граница числа наблюдений, статистику не следует проводить более одного наблюдения. При

ему надо сделать одно наблюдение и затем выбрать решение из в противном случае — принимать решение из вообще без наблюдений.

ПРИМЕР 3. Пусть последовательная повторная выборка из нормального распределения с неизвестным средним и заданной мерой точности Предположим, что значение надо оценить при функции потерь цене одного наблюдения с и нормальном априорном распределении для со средним и мерой точности

Из сказанного в § 11.2 ясно, что риск от принятия решения без наблюдений равен Далее, для всякого набора наблюденных значений мера точности апостериорного распределения параметра равна Следовательно, риск от принятия решения на этом шаге равен Таким образом, риск зависит лишь от числа проведенных наблюдений, но не от наблюденных значений. Далее, рассуждение по индукции, основанное на формуле (6) § 12.5, показывает, что и каждая функция обладает тем же свойством. Таким образом, для всех значений найдется постоянная такая, что при всех возможных значениях наблюдений

Применим теперь теорему 2 § 12.5, в которой указан вид оптимальной процедуры последовательного решения в классе процедур, требующих проведения не более наблюдений. Пусть на некотором шаге этой процедуры были наблюдены значения Тогда из вида оптимальной процедуры и из равенства (14) следует, что выбор надо закончить, если и целесообразно сделать еще одно наблюдение, если Таким образом, решение, проводить ли дальнейшие наблюдения, зависит лишь от чисел а не от наблюденных значений Другими словами, оптимальная процедура последовательного решения предписывает проведение фиксированного числа наблюдений.

Приближение для оптимального объема выборки в этом примере было найдено в упр. 3 к гл. 11. Таким образом, процедура, в которой проводится ровно наблюдений, является оптимальной в классе всех процедур последовательного решения. Конечно, если значение превосходит максимально возможное число наблюдений то надо проводить наблюдений. Точное выражение для оптимального числа наблюдений в этом примере указано в упр. 3.

Прежде чем перейти к последнему примеру, сформулируем одну общую теорему, верную для любой задачи последовательного решения; эта теорема была фактически установлена при рассмотрении примера 3.

Теорема 1. Пусть априорное распределение параметра в задаче последовательного решения есть Предположим, что для каждого значения значение постоянно при всех Тогда оптимальная процедура последовательного решения есть процедура с фиксированным числом наблюдений.

ПРИМЕР 4. Контрастом к только что рассмотренной задаче оценивания служит задача проверки гипотез, которая уже исследовалась в § 11.9. Предположим, что из нормального распределения с неизвестным средним и заданной мерой точности извлекается последовательная повторная выборка причем цена каждого наблюдения равна с. Статистик должен решить, превосходит или нет заданное значение Таким образом, и мы будем считать, что функция потерь имеет вид (1) § 11.8.

Если статистик должен провести фиксированное число Наблюдений, которое надо указать до начала выбора, то оптимальное число наблюдений можно приближенно найти из соотношения (10) § 11.9. В рассматриваемом примере общий риск можно уменьшить, используя процедуру последовательного решения. Однако, как мы сейчас увидим, вычисление даже лишь уже весьма трудоемко и получить явное выражение для оптимальной процедуры последовательного решения представляется невозможным.

Предположим, что априорное распределение параметра нормальное со средним и мерой точности Из соотношения (11) § 11.8 и следующих за ним рассуждений выводим, что риск от принятия решения из без наблюдений есть

Согласно формуле (3) § 11.9, мы можем записать в виде

При выводе равенства (16) мы воспользовались также следующим равенством, справедливым при (см. упр. 8):

Риск от проведения одного наблюдения и последующего принятия решения из равен значению даваемому формулой (5) § 11.9 при Так как функция

также как и каждая функция симметрична относительно точки имеем

где . Из (16) и (18) теперь выводим, что если

то . В противном случае

Расчет величины весьма труден, и мы отложим на время дальнейшее обсуждение примера 4. Этот пример будет вновь рассмотрен в § 12.11. Он изучался Черновым (1961а; 1965а, b), Брейкуэллом и Черновым (1962), Линдли (1961а), Бейзером (1962) и Линдли и Барнеттом (1965). Для оптимальной процедуры были найдены хорошие аппроксимации.

1
Оглавление
email@scask.ru