Главная > Статистический синтез при априорной неопределенности и адаптация информационных систем
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

9.4. СЛУЧАИ, КОГДА ПРИ ВЫБРАННОЙ АППРОКСИМАЦИИ ПРАВИЛА РЕШЕНИЯ АПРИОРНЫХ ДАННЫХ ДОСТАТОЧНО ДЛЯ ВЫЧИСЛЕНИЯ АПОСТЕРИОРНОГО РИСКА

Обратимся теперь ко второй из указанных в § 9.2 возможностей, когда правило решения выбрано так, что имеется возможность получить аналитическую зависимость апостериорного риска от Как было отмечено выше, если при этом имеется совокупность эмпирических данных таких, что для любого выполняется равенство (9.2.10), то можно образовать состоятельную оценку среднего риска (9.2.7) и, минимизировав ее по с, найти значение зависящее от которое является состоятельной оценкой оптимального значения параметра Правило решения (9.2.12) находится подстановкой этого значения в (9.2.1) и является приближением к наилучшему правилу решения с из заданного класса (9.2.1), причем благодаря сходимости к с правило решения сходится к правилу

Фактически задача синтеза в данном случае сводится к отысканию наилучшего значения для чего, как и в задаче нахождения оценок максимального правдоподобия, могут быть использованы различные методы. В ряде случаев для отыскания значения минимизирующего оценку среднего риска могут быть использованы конечные методы, с помощью которых получается аналитическое выражение для являющееся точным решением задачи. Возможности их применения довольно ограничены и в основном исчерпываются случаем, когда функция апостериорного риска квадратично зависит от с. Соответствующие примеры, относящиеся к практически важной задаче фильтрации, будут приведены ниже. Более общим средством нахождения минимального значения и

соответствующего значения является применение различных итеративных процедур, многочисленные варианты которых разработаны для случаев как дифференцируемой, так и недифференцируемой функции Эти процедуры, естественно, применимы при любой зависимости следовательно, от с и часто обеспечивают нахождение с у за небольшое число шагов, однако обладают существенным недостатком, связанным с необходимостью при каждой итерации хранить и использовать всю имеющуюся начальную информацию — данные наблюдения и большой объем промежуточных расчетов.

В связи с этим большую важность приобретают рекуррентные методы нахождения значения минимизирующего оценку среднего риска для каждого Если соответствующая рекуррентная процедура построена так, что для нахождения очередного значения она требует использования только данных наблюдения (а не всей последовательности и результатов решения задачи минимизации на предыдущем шаге, то она приводит к существенной экономии в объеме, требуемой для запоминания информации памяти, сокращению объема вычислений и обладает тем преимуществом, что в любой момент времени (на любом шаге готова к остановке и выдаче необходимого результата — соответствующего значения Ограничимся случаем дифференцируемой по с функции Тогда наилучшее значение минимизирующее оценку среднего риска полученную путем эмпирического усреднения апостериорного риска является решением следующего уравнения для градиента:

и может быть найдено с помощью рекуррентной процедуры, аналогичной рассмотренным в гл. 8.

Пусть наилучшее значение с, найденное минимизацией оценки среднего риска вычисленной по эмипирической последовательности т. е. решение уравнения

аналогичного (9.4.1) с заменой на Перепишем уравнение (9.4.1) в следующем виде:

где малая поправка. Тогда его приближенное решение имеет вид

где матрица определяется выражением

При квадратичной зависимости от с решение (9.4.2) является точным и, кроме того, матрица вычисляется рекуррентно благодаря отсутствию зависимости При этом выражение (9.4.2) действительно является рекуррентным соотношением, требующим для вычисления значения знания только

Для того чтобы это выражение превратилось в рекуррентное соотношение в общем случае, нужно подобно тому, как это было сделано в гл. 7, 8, дать дополнительно рекуррентное правило вычисления матрицы либо просто задать ее (или обратную матрицу для каждого значения Используя те же идеи, что в гл. 7. 8, получаем для рекуррентное соотношение

которое в совокупности с (9.4.2) полностью определяет рекуррентную процедуру нахождения при любых начальных значениях При независимых эта процедура задает марковскую случайную последовательность, сходящуюся к истинному оптимальному значению причем разность асимптотически нормальна с дисперсией (корреляционной матрицей) порядка (Условия сходимости и асимптотической нормальности аналогичны обсуждавшимся выше.)

Второй способ превращения (9.4.2) в рекуррентное соотношение состоит в замене некоторой произвольной матрицей, обеспечивающей сходимость последовательности . В частности, как в процедуре Робинеа-Монро, можно выбрать в качестве весовой матрицы диагональную матрицу где последовательность положительных коэффициентов удовлетворяет условиям (8.2.18), (8.2.19). При этом, естественно, из рекуррентных соотношений (9.4.2), (9.4.3) остается только первое и вся процедура рекуррентного определения заметно упрощается, однако из-за неоптимальности выбора весовой матрицы в (9.4.2) она проигрывает первому способу в эффективности. Подробное обсуждение структуры и свойств рекуррентной процедуры (9.4.2) при различном выборе матрицы и многочисленные примеры ее применения содержатся в работах [39, 40].

Categories

1
Оглавление
email@scask.ru