Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
2.2. Проверка двух простых гипотезНачнем наше рассмотрение с задачи, связанной с принятием решения, в которой каждое из двух значений выходной величины источника соответствует одной из двух гипотез. Каждая гипотеза отображается точкой в пространстве наблюдений. Предполагается, что пространство наблюдений соответствует ряду из
Вероятностный механизм перехода генерирует точки в пространстве наблюдений в соответствии с двумя известными условными плотностями вероятностей 2.2.1. Критерии принятия решенияВ задаче проверки двух гипотез нам известно, что верна либо гипотеза Я о, либо гипотеза Н. Ограничим рассмотрение только правилами решения, необходимыми для того, чтобы сделать выбор. (Можно было бы принять и другую возможную процедуру, когда, по правилам решения допускаются три ответа: а) правильна 1) верна 2) верна 3) верна Ни выбираем 4) верна. Ни выбираем Первый и третий исходы соответствуют правильным выборам а второй и четвертый — ошибочным. Смысл критерия решения состоит в том, что каждому из четырех возможных исходов (образов действия) придается некоторое относительное значение. Можно предположить, что метод обработки принимаемой информации Критерий Байеса. Байесовское испытание основывается на двух допущениях. Первое заключается в том, что оба значения выходной величины источника подчиняются некоторым распределениям вероятностей, которые обозначим соответственно через и Второе допущение состоит в том, что каждому из возможных образов действия приписывается некоторая стоимость. Обозначим стоимости четырех упомянутых образов действия через Каждый опыт будет сопряжен с определенными потерями. Желательно, чтобы наше правило решения было построено таким образом, чтобы в среднем эти потери были как можно меньше. Для этого запишем сначала выражение для ожидаемой величины потерь. Легко видеть, что имеются две вероятности, по которым мы должны усреднить: априорная вероятность и вероятность того, что будет предпринят заданный образ действий. Обозначая ожидаемую величину потерь как риск
Так как мы предполагали, что по правилу решения следует выбирать либо Н либо
Рис. 2.4. Области решений. Если результат наблюдения оказывается в Теперь можно написать выражение для риска через переходные вероятности и подпространства решений:
Для На протяжении всей книги мы исходим из того, что стоимость ошибочно принятого решения выше, чем стоимость правильного решения. Другими словами,
Чтобы найти теперь результат байесовского испытания, нам необходимо выбрать подпространства решений принятия решения означает, что каждая точка
Переписав (5), получим
Учитывая, что
(8) можно свести к
Первые два члена в (10) соответствуют фиксированной стоимости. Интеграл представляет собой стоимость, определяемую теми точками
то относим Формулу (11) можно записать в виде
Величину в левой части неравенства (12) называют отношением правдоподобия и обозначают через
Так как оно представляет собой отношение двух функций случайной величины, то и само является случайной величиной. Нетрудно видеть, что независимо от размерности Величина в правой части (12) является порогом испытания и обозначается через
Таким образом, критерий Байеса приводит нас к критерию отношения правдоподобия (КОП)
Отсюда видно, что вся процедура обработки данных сводится к вычислению
Рис. 2.5. Устройства обработки по критерию отношения правдоподобия. Так как натуральный логарифм — функция монотонная, а обе части неравенства (15) — величины положительные, то эквивалентной формой записи критерия отношения правдоподобия будет
Две соответствующие формы устройства обработки, реализующего процедуру проверки отношения правдоподобия, изображены на рис. 2.5. Прежде чем перейти к рассмотрению других критериев, разберэ три простых примера. Пример величина
и
так как отсчеты шума являются гауссовыми.
Рис. 2.6. Модель задачи к примеру 1. Нетрудно записать плотности вероятности величины
и
Поскольку
и
Подставляя (21) и (22) в (13), имеем
После приведения подобных членов и взятия логарифма получим
Итак, критерий отношения правдоподобия запишется в виде
или в эквивалентной форме
Нетрудно видеть, что устройство обработки просто суммирует результаты наблюдений и сравнивает с порогом. В этом примере наблюдаемые данные входят в отношение правдоподобия только в виде суммы. Это пример достаточной статистики, которую мы обозначим через Пример 2. К интересующей нас в этом примере математической модели приводят несколько различных физических ситуаций. Результаты наблюдений представляют ряд из
Подставляя (27) и (28) в (13) и беря логарифм, получаем
В данном случае достаточная статистика есть сумма квадратов результатов наблюдений:
и эквивалентный критерий для
При
В приведенных двух примерах мы имели дело с нормальными величинами. В следующем примере будет рассмотрен другой тип распределения. Пример 3. Пуассоновское распределение событий часто используется в качестве модели дробового шума и других явлений (см. [1] или [2]). При каждом Проведении эксперимента происходит некоторое число событий, которое и является результатом наблюдения; оно изменяется в пределах от 0 до
где
Именно по этому параметру
Тогда критерий отношения правдоподобия можно записать в виде
или в эквивалентной ему форме
Данный пример служит иллюстрацией того, как критерий отношения правдоподобия, который мы первоначально записали через плотности вероятности, можно легко привести к виду, удобному для случая, когда результаты наблюдений являются дискретными случайными величинами. Вернемся теперь к нашему общему обсуждению критериев Байеса. Существует несколько специальных видов критериев Байеса, которые часто используются и поэтому заслуживают отдельного рассмотрения. Если принять
Нетрудно усмотреть, что (39) есть просто полная вероятность допустить ошибку. Следовательно, для данного распределения стоимости критерий Байеса минимизирует полную вероятность ошибки. При этом критерий можно записать в виде
Когда две гипотезы одинаково правдоподобны (равновероятны), порог равен нулю. Это допущение обычно справедливо применительно к цифровым системам связи. Такие устройства обработки называются приемниками с минимальной вероятностью ошибки. Второй частный случай соответствует ситуации, когда априорные вероятности неизвестны. Для исследования этого случая снова обратимся к (8). Из этого выражения видно, что коль скоро области решений
Легко видеть, что эти значения являются условными вероятностями. Подстрочные индексы имеют мнемонический характер и заимствованы из радиолокационной задачи, где гипотеза
Рис. 2.7. Функции риска: а — фиксированная величина риска и типичная байесовская функция риска; б, в, г - максимальное значение Хотя класс интересующих нас задач гораздо шире, чем это предполагается данными обозначениями, мы все же будем ради удобства ими пользоваться. При любом выборе областей решений выражение для риска
Поскольку
(42) приобретает вид
Если все стоимости и априорные вероятности известны, можно воспользоваться критерием Байеса. На рис. 2.7 зависимость байесовского риска байесовского критерия, а следовательно, и вероятности
Если Интересная задача возникает, если предположить, что априорные вероятности выбираются с таким расчетом, чтобы качество обнаружения было как можно хуже. Другими словами, величина
Критерий Байеса, рассчитанный на минимизацию максимально возможного риска, называется минимаксным критерием. Уравнение (46), называемое минимаксным, справедливо во всех случаях, когда максимум Я в Особым случаем распределения стоимости, который часто бывает логически оправданным, является
Это распределение гарантирует, что максимум будет внутренним; Обозначая
напишем выражение для риска
и минимаксное уравнение
Прежде чем продолжить наше обсуждение критериев отношения правдоподобия, рассмотрим второй критерий и покажем, что он также ведет к критерию отношения правдоподобия. Испытания по критерию Неймана — Пирсона. Во многих физических ситуациях бывает затрудительно предсказать достаточно реалистичные стоимости и априорные вероятности. Эту трудность можно довольно просто обойти, если иметь дело с условными вероятностями Вообще говоря, нам хотелось бы сделать Критерий Неймана — Пирсона. Ограничим Решение этой задачи легко получить, используя метод множителей Лагранжа. Построим функцию
или
Очевидно, что при
Заметим, что при любом положительном значении Я критерий отношения правдоподобия минимизирует функцию Это обстоятельство следует из (53) непосредственно, так как для минимизации член в квадратных скобках отрицателен. Это эквивалентно критерию: если
то относим точку к области Величина, стоящая в левой части неравенства (54), есть не что иное, как отношение правдоподобия. Таким образом, функция F минимизируется по критерию отношения правдоподобия
Но Для того чтобы удовлетворить указанному ограничению, выберем
Решая (56) относительно X, получим величину порога. Значение X, определяемое из (56), будет неотрицательным, поскольку Заключение. В этом параграфе были изложены две идеи, имеющие фундаментальное значение в статистической теории решений. Первый результат сводится к тому, что для критериев Байеса и Неймана — Пирсона оптимальная процедура испытаний состоит в обработке результатов наблюдения Вторая идея — это представление о достаточной статистике Более важен случай, когда можно определить Таким образом,
Теперь выражение, стоящее в правой части, можно переписать в виде
Если I есть достаточная статистика, то
так как плотность вероятности величины у не может зависеть от того, какая из гипотез является верной. Видим, что выбор достаточной статистики сводится просто к выбору системы координат, в которой одна координата содержит всю информацию, необходимую для принятия решения. Остальные координаты не содержат никакой информации, и с точки зрения вынесения решения их можно не принимать во внимание. В примере 1 новую координатную систему можно было получить просто путем поворота. Например, когда
В примере 2 новая система координат явилась результатом преобразования в полярные координаты. Так, для
Заметим, что вектор у может быть выбран с таким расчетом, чтобы наглядность условия (59) достигалась возможно более простым способом. Единственное требование сводится к тому, что пара описывать любую точку пространства наблюдений. Следует также отметить, что условие
никак не влечет за собой (59), если
|
1 |
Оглавление
|