Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
Глава 6. АДАПТИВНЫЙ БАЙЕСОВ ПОДХОД6.1. ОБЩИЕ ПОЛОЖЕНИЯОсновная идея адаптивного байесова подхода заключается в следующем. Пусть имеется существенная априорная неопределенность Попытаемся тем не менее использовать тот порядок, который принят при нахождении байесова правила решения. (Как уже не раз подчеркивалось, главным его элементом является нахождение минимума апостериорного риска по для всех возможных решений и или хотя бы (что наиболее существенно) в окрестности его минимума. После того, как такая оценка получена, остается только воспользоваться стандартными рецептами для нахождения байесова решения, минимизировав вместо истинного оценочное значение апостериорного риска. Если при этом оставшаяся после оценки апостериорного риска часть сведений из общей совокупности данных наблюдениях достаточна для получения нетривиального решения (минимум оценочного значение апостериорного риска по и достигается для значения и, неодинакового при разных Проиллюстрируем эту идею двумя элементарными примерами. Пример 1. Пусть имеется двухальтернативная задача, о которой уже шла речь в п. 4 3.2, т. е. требуется принять решение
где известно все, кроме параметра а, вносящего априорную неопределенность в статистическое описание данных наблюдения. Пусть также заданы функции потерь Апостериорный риск в данной задаче
зависит от неизвестного параметра а, что не дает возможности сравнить его значения для Используем эти данные — совокупность значений распределенной и сходящейся к истинному значению с увеличением объема данных, использованных для ее нахождения (в данном случае числа
и подставим ее в выражение (6.1.1) для использования величины
Если величина отклонения
мало отличается от множества
которое является областью принятия решения Чтобы показать, что эти качественные рассуждения должны вызывать доверие, еще больше конкретизируем наш пример и дадим количественную оценку степени приближения правила решения (6.1.2) к оптимальному байесову. Пусть
и пусть для определенности истинное значение байесово правило решения
а правило (6.1.2) приводится к тому же виду с заменой а «а оценочное значение а. Если в качестве последнего взять оценку максимального правдоподобия, то
где отклонение
т. е. различаются между собой на интервал Не представляет труда рассчитать величину среднего риска для обоих случаев. Обозначим
Средний риск оптимального байесова правила при известном а равен
а для адаптивного правила с использованием оценочного значения
Величины 2° и z нормальны, имеют одинаковые (при фиксированном
и дисперсии, одинаковые для
где
Из выражений (6.1.4) видно, насколько эффективен и хорош в данном случае рассматриваемый подход даже при Пример 2. Пусть требуется осуществить выбор одной из Пусть для каждого
Благодаря независимости
и оптимальное байесово правило решения имело бы следующую структуру:
при
Используем все остальные данные наблюдения, которые при отсутствии априорной неопределенности вообще не нужны, для оценки функциональной зависимости апостериорного риска
Используя эту оценку вместо истинной величины апостериорного риска, получаем следующее представление для адаптивного байесова правила решения:
при
С ростом В качестве иллюстрации сходимости этого адаптивного правила решения к оптимальному байесову рассмотрим простой пример, когда число возможных решений
Если возможные значения потерь (0 и 1), условные вероятности этих потерь
Пусть для определенности
Рассчитаем теперь средний риск для адаптивного правила решения (6.1.7) в тех же условиях (с учетом дополнения его выбором решения наугад при равных значениях оценочного апостериорного риска для первого и второго решений). Оценка (6.1.6) апостериорного риска в данном случае может быть записана как
где
Математическое ожидание оценки
совпадает с истинным значением апостериорного риска при любой последовательности наблюдений и решений Для любого из значений например для
где вероятности выполнения неравенств и равенств вида
определяются с помощью биномиальных распределений для чисел Приведем еще выражение для среднего риска правила, при котором решение при любом значении
Таблица 6.1 (см. скан) Зависимость среднего риска от объема дополнительных данных наблюдения (числа Приведенные примеры показывают, что рассматриваемый подход позволяет получить в условиях априорной неопределенности правила решения (алгоритмы обработки информации), которые обладают достаточно хорошими качествами. Даже при сравнительно небольшом количестве «избыточных» данных эффективность найденных правил решения близка к эффективности соответствующих оптимальных байесовых правил, а при увеличении объема полной совокупности данных наблюдения х происходит достаточно быстрая сходимость к результатам, которые имели бы место при отсутствии априорной неопределенности. Вернемся снова к общему случаю. Имеет смысл еще раз пояснить суть рассматриваемого подхода. Она состоит в том, чтобы и в условиях априорной неопределенности сохранить для выбора наилучшего решения и нахождения наилучшего правила решения (алгоритма обработки информации) основное содержание байесова подхода. Это последнее заключается в том, что мы сопоставляем каждому состоянию наших знаний, которые характеризуются данными наблюдения х, ожидаемое значение потерь; осуществляем выбор решения, исходя из минимума ожидаемых при данном состоянии наших знаний потерь, и считаем оптимальным такое правило решения При этом предельно ясно, что смысловое содержание подхода - наилучшим решением является то, которое обеспечивает наименьшее значение ожидаемых потерь — вовсе не зависит от объема имеющихся априорных знаний. Степень полноты этих знаний влияет только на качество оценки ожидаемых потерь. При отсутствии априорной неопределенности ожидаемые потери для каждого из возможных решений и имеют точную количественную меру — величину апостериорного риска, которая определяется по простым формальным правилам как математическое ожидание потерь при данном состоянии наших знаний х. Нужно подчеркнуть, что эта оценка ожидаемых потерь (расчет величины апостериорного риска) производится по данным наблюдения х, а роль имеющихся априорных сведений о виде функции потерь и распределений вероятности х и X заключается только в том, что они позволяют установить четкое функциональное соответствие между значением х и величиной ожидаемых при принятии решения и потерь. При наличии априорной неопределенности по-прежнему необходимо оценить ожидаемые потери для каждого возможного решения. Как и при отсутствии априорной неопределенности, эта оценка, естественно, делается по имеющимся данным наблюдения х. Однако из-за недостатка априорных сведений невозможно установить точное функциональное соответствие между х и величиной апостериорного риска и следует как-то модифицировать свой подход к нахождению оценки ожидаемых потерь. В связи с этим роль и значение вновь полученной информации — данных наблюдения Применение этой терминологии, не очень много добавляющей по существу, но достаточно установившейся, объясняется тем, что нахождение правила решения при наличии априорной неопределенности так или иначе связано с приспособлением найденного при отсутствии априорной неопределенности правила решения (алгоритма обработки информации, управления и т. п.) к неизвестной (в смысле неполноты априорного статистического описания) обстановке, которая характерируется какими-то истинными, но полностью или частично неизвестными функциями потерь, распределениями вероятности и значением апостериорного риска, измеряющим ожидаемые нотери. Итак, по существу адаптивный байесов подход основан на принципе выбора решения по минимуму ожидаемых потерь и в этом смысле не отличается от обычного байесова подхода, обеспечивающего нахождение абсолютно наилучших правил решения; методически адаптивный байесов подход основан на замене точной меры ожидаемых потерь — апостериорного риска — его состоятельной оценкой по имеющимся данным наблюдения х и последующем применении всех формальных процедур перехода от заданной функции апостериорного риска к оптимальному правилу решения. Состоятельность оценки апостериорного риска позволяет быть уверенным в том, что не будут допущены по крайней мере грубые ошибки при сопоставлении величин ожидаемых потерь для разных решений и выборе наилучшего решения. Применение же формальных процедур нахождения байесова правила решения по величине апостериорного риска дает гарантию, что ничего не ухудшится в дальнейшем и действительно получится наилучшее при данной оценка ожидаемых потерь правило решения. Конечно, для того, чтобы это правило решения было вообще наилучшим в условиях априорной неопределенности, нужно, чтобы и принятая оценка апостериорного риска была наилучшей, а для того, чтобы правило решения было близко к наилучшему при отсутствии априорной неопределенности, иужно, чтобы оценочное и истинное значения апостериорного риска имели минимумы при одном и том же решении и почти для всех значений х ил» при близких значениях и для всех значений
|
1 |
Оглавление
|