Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
2.4.1. Случайные параметры. Байесовская оценкаВ байесовской задаче обнаружения двумя величинами, которыми необходимо было задаваться, являлись система стоимостей и система априорных вероятностей действия определялись стоимостной матрицей. Поскольку у нас имелось В задаче оценки а и
Рис. 2.18. Типичные функции стоимости (потерь): а — средний квадрат ошибки; б - абсолютная ошибка; в — равномерная функция потерь. Во многих случаях, представляющих интерес, можно вполне реалистично предполагать, что стоимость зависит только от погрешности (ошибки) оценки. Обозначим эту ошибку как
Функция стоимости или потерь
Эту функцию обычно называют квадратичной функцией стоимости (потерь). Нетрудно заметить, что она подчеркивает значимость больших ошибок. Функция стоймости рис. 2.18, б является абсолютной величиной ошибки
На рис. 2.18, в всем ошибкам меньше
В любой конкретной задаче мы выбираем функцию стоимости из двух соображений. Во-первых, желательно, чтобы функция стоимости служила адекватной мерой степени удовлетворения потребителя. Зачастую бывает затруднительно указать аналитическую меру тому, что принципиально может являться качеством субъективным. Наша цель заключается в отыскании оценки, которая минимизирует ожидаемую величину стоимости. Поэтому второе соображение при выборе функции стоимости заключается в том, чтобы задаться такой функцией стоимости, которая приводила бы к разрешимой задаче. На практике функции стоимости обычно выбираются как компромисс между этими двумя требованиями. Следует заметить, что во многих представляющих интерес задачах одна и та же оценка может быть оптимальной для широкого класса функций стоимости. Подобно априорным вероятностям в задаче обнаружения в задаче оценки случайного параметра предполагается известной априорная плотность вероятности Если функция стоимости и априорная вероятность заданы, то можно написать выражение для риска:
Математическое ожидание в (122) берется по случайной величине а и наблюдаемым величинам
Байесовская оценка — это оценка, минимизирующая, риск. Байесовские оценки для функций-стоимости, приведенных на рис. 2.18, можно найти простым и непосредственным способом. Для функции стоимости рис. 2.18, а риск соответствует средцеквадратической ошибке. Обозначим риск для критерия среднеквадратической ошибки через
Выражение для совместной плотности вероятности можно переписать в виде
Используя (125) в (124), имеем
Внутренний интеграл и
Приравнивая результат нулю и замечая, что второй интеграл равен единице, получаем
Этот минимум является единственным, так как вторая производная равна постоянной величине, равной 2. Член в правой части (128) известен как среднее значение апостериорной плотности (или условное среднее). Из (126) видно, что если
Для минимизации внутреннего интеграла разобьем его на два:
Дифференцируя
Это просто математическая запись определения медианы апостериорной плотности. Третьим критерием служит равномерная функция стоимости рис. 2.18, в. Выражение для риска в этом случае имеет вид
Для минимизации риска необходимо максимизировать внутренний интеграл. Особый интерес представляет случай, когда А является сколь угодно малым, но отличным от нуля чцслом. Типичная апостериорная плотность вероятности изображена на рис. 2.19. Нетрудно заметить, что для малых А наилучшим выбором для
Рис. 2.19. Апостериорная плотность. Для отыскания Так как логарифм — функция монотонная, то расположение максимума можно одинаково успешно отыскать по функции Если максимум лежит внутри допустимой области изменения
Уравнение (133) мы называем уравнением максимальной апостериорной вероятности. В каждом случае необходимо убедиться, является ли решение абсолютным максимумом. Выражение для
Прологарифмировав, получим
Для оценки по максимуму апостериорной вероятности нам необходимо только найти такое значение А, при котором левая часть (135) максимальна. Так как последний член правой части от А не зависит, то достаточно рассмотреть только функцию
Первбе слагаемое дает вероятностную зависимость Уравнение максимальной апостериорной вероятности можно записать в виде
При дальнейшем изложении оценкам по минимуму среднеквадратической ошибки и по максимуму апостериорной вероятности будет уделяться основное внимание. Для изучения вопросов применения двух указанных процедур оценки рассмотрим примеры 2—4. Пример 2. Пусть
Предполагается, что а — нормальная величина,
Для отыскания
(Другими словами,
Произведя перегруппировку членов под знаком экспоненты выполнив действие возведения в квадрат и выделив члены, зависящие только от
где
апостериорная дисперсия. Видим, что
Поскольку апостериорная дисперсия не зависит от В связи с изложенным полезно сделать два замечания. 1. R входят в выражение для апостериорной плотности только в виде суммы. Поэтому,
является достаточной статистикой. Это понятие идентично понятию достаточной статистики в задаче обнаружения. 2. При реализации правила оценки имеющаяся информация используется следующим образом. Если
Оценку по максимуму апостериорной вероятности для этого случая получить несложно. Из (142) следует, что, поскольку распределение вероятностей нормально, максимальное значение
Ввиду того, что условная медиана нормального распределения имеет место при условном среднем, получаем
Итак, мы убедились, что для данного конкретного примера все три функции стоимости рис. 2.18 приводят к одинаковой оценке. Указанная инвариантность по отношению к выбору функции стоимости является, по-видимому, полезной особенностью ввиду субъективности тех соображений, которые часто кладутся в основу выбора Свойство 1. Предположим, что данная функция стоимости
при любом
Рис. 2.20. Симметричные выпуклые функции стоимости (потерь): а — выпуклая; Это условие иллюстрирует рис. 2.20, а. Если неравенство (150) при Введем величину
Исходя из симметрии апостериорной плотности, можно написать
Оценка а, которая минимизирует какую угодно функцию стоимости в этом классе, идентична Доказательство. Как и ранее, можно минимизировать условный риск [см. (126)], который запишем в виде
где второе равенство вытекает из (149). Запишем теперь четыре эквивалентных выражения для
[это равенство следует из (153)]
[это равенство следует из (152)]
[это равенство следует из (149)]
[это равенство следует из (152)]. Используем теперь условие выпуклости (150) вместе с (155) и (157):
Равенство в (158) будет достигнуто, если Чтобы охватить функции стоимости типа единичных функций стоимости, которые не являются выпуклыми, необходимо установить второе свойство. Свойство 2. Предположим, что функция стоимости есть симметричная неубывающая функция и что апостериорная плотность
Оценка а, которая минимизирует любую функцию стоимости этого класса, идентична Значения двух указанных свойств не следует недооценивать. На протяжении книги мы рассматриваем только оценки по минимуму среднеквадратической ошибки и по максимуму апостериорной ности. Свойства 1 и 2 гарантируют, что если апостериорные плотности удовлетворяют указанным выше предположениям, то получаемые нами оценки будут оптимальными для широкого класса функций стоимости. Очевидно, если апостериорная плотность является гауссовой, то она удовлетворйет сделанным выше допущениям. Рассмотрим теперь два примера другого типа. Пример 3. Переменная а входит в сигнал в виде нелинейной зависимости. Обозначим эту зависимость через
Поэтому
Это выражение не допускает дальнейшего упрощения, если Уравнение максимальной апостериорной вероятности получается подстановкой (160) в (137):
Для решения его в явном виде необходимо задать Другой тип часто встречающихся задач связан с оценкой параметра распределения вероятностей. Пример 4 Число событий в эксперименте подчиняется пуассоновскому закону распределения со средним значением а. Таким образом,
Мы хотим наблюдать число событий и оценить параметр а пуассоновского распределения. Будем полагать, что а является случайной величиной с экспоненциальной плотностью
Апостериорная плотность а равна
Подставляя (162) и (163) в (164), имеем
где
с тем, чтобы интеграл от плотности вероятности равнялся единице. Среднеквадратическая оценка есть условное среднее:
Для отыскания
Дифференцируя по
Заметим, что Другие примеры приводятся в задачах вне основного текста. Наиболее важные результаты данного параграфа сводятся к следующему. 1. Оценка по минимуму среднеквадратической ошибки всегда есть среднее апостериорной плотности (условное среднее). 2. Оценка по максимуму апостериорной вероятности равна значению величины 3. Для широкого класса функций стоимости оптимальная оценка есть условное среднее, если апостериорная плотность является унимодальной функцией, симметричной относительно условного среднего. Эти выводы служат основой для большей части наших дальнейших исследований по теории оценок. Единственным затруднением, с которым мы встретимся при изучении более сложных задач, являются вопросы фактической оценки условного среднего и максимума. Во многих случаях, представляющих интерес, оценки по минимуму среднеквадратической ошибки и по максимуму апостериорной вероятности оказываются одинаковыми. Обратимся теперь ко второму классу задач оценки, упомянутому в введении.
|
1 |
Оглавление
|