Главная > Статистический синтез при априорной неопределенности и адаптация информационных систем
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

11.4. РЕКУРРЕНТНЫЕ АДАПТИВНЫЕ АЛГОРИТМЫ ПРОВЕРКИ ГИПОТЕЗ

Рассмотрим теперь процедуру проверки гипотез, имеющую смысл в случая, когда желательно (или даже необходимо) принятие решений на первых же шагах наблюдений, однако после их принятия никаких необратимых действий не совершается, и уже принятые решения могут быть изменены, если продолжение наблюдений свидетельствует об их неправильности.

Будем по-прежнему рассматривать систему проверки -альтернативных гипотез и считать, что обстановка, в которой они проверяются, известна не полностью, что характеризуется неизвестными векторам Гипотезы проверяются (т. е. решения принимаются) на каждом шаге наблюдений на основании наблюдения составного вектора компоненты которого векторы, представляющие собой совокупности наблюдаемых величин на каждом шаге. Таким образом, для принятия решения на шаге используются все данные, имеющиеся в наличии к этому щагу наблюдений. Уже принятые решения могут либо подтверждаться, либо изменяться на последующих шагах. При этом последующие решения не зависят от того, какими именно были предыдущие решения.

Описываемая процедура отличается как от классической, так и от последовательной, которые анализировались в предыдущих параграфах. Прагически она широко применяется Примерами могут служить

радиолокаторы обнаружения, которые никаких необратимых действий не совершают и лишь передают данные об обнаруженных объектах, в случае же неподтверждения данных о их наличии дают команду на «сброс» соответствующих траекторий. Таким же образом действуют так называемые автоматы захвата, применяемые в системах поиска сигналов то частоте, задержке модуляции и другим параметрам. После обнаружения сигнала поиск прекращается, но в случае неподтверждения его наличия (либо пропадания сигнала) поиск продолжается.

Обозначим через плотность вероятности наблюдаемых величин имеющих место к шагу наблюдений в ситуации известную с точностью до потери при принятии на шаге решения в ситуации Будем считать потери аддитивными, т. е. потери за шагов наблюдения

где номер решения, принятого на шаге.

При любом данном оптимальная система должна обеспечивать минимизацию среднего риска, который при аддитивной функции потерь определяется суммой средних рисков, связанных с каждым данным шагом наблюдений:

Очевидно также, что благодаря независимости решения, принимаемого на каждом шаге, от решений, принятых на предыдущих шагах, минимизация среднего риска сводится к минимизации каждого слагаемого

Минимизация с учетом оптимальности нерандомизировавного правила принятия решений ничем не отличается от задачи, рассмотренной в § 11.2, которая сводилась к составлению и минимизации усред ненного по параметрам обстановки апостериорного риска. В результате правило принятия решения на каждом шаге наблюдений сводится к выполнению условия

где определяется выражением (11.2.5), а - оценки максимального правдоподобия, полученные на шаге наблюдений на основе выборки

Таким образом, при данной процедуре проверки гипотез на каждом шаге наблюдений правило решения ничем не отличается от такового при классической процедуре. В частности, при простой функции потерь

оно сводится к максимизации взвешенного апостериорного распределения

Практически (11.4.6) может быть осуществлено, как и в предыдущих случаях, с помощью составления отношений правдоподобия

и сравнения их с порогами

В случае же проверки двухальтернативных гипотез оптимальное решение сводится к сравнению отношения правдоподобия с порогом при любых функциях потерь, причем порог определяется выражением

Учитывая, что при рассматриваемом методе анализа в соответствии с указанной процедурой решения принимаются на каждом шаге, целесообразно найти рекуррентные формулы как для величин, сравниваемых с порогами, так и для используемых при построенииэтих величин (и порогов) оценок параметров обстановки.

Как будет видно из дальнейшего, такие рекуррентные соотношения упрощают алгоритмы принятия решений на каждом шаге.

Введем обозначения с помощью соотношения

где условная плотность вероятности для наблюдения на шаге при заданных а

Считая разность оценок максимального правдоподобия параметров обстановки полученных за шагов и за шаг величиной малой, представим следующей приближенной формулой

где матрица определяется как

и вектор состоит из элементов

В соответствии с (7.5.27) для оценок максимального правдоподобия параметров обстановки справедливы следующие рекуррентные соотношения:

где

На основании (11.4.12) можно переписать (11.4.11) в виде

Рекуррентные соотношения (11.4.12) дают алгоритм формирования оценок неизвестных параметров обстановки, соотношение (11.4.14) — логарифма функции правдоподобия в ситуации Совокупность величин используется для принятия решений в соответствии с указанными выше простыми правилами комбинирования.

В соотношении (11.4.14) основную роль в правой части играют два первых члена. В случае высокой точности оценки параметров обстановки, когда разность весьма мала, достаточно учесть лишь эти члены. Третий член в (11.4.14) дает поправку за счет неточности определения параметров , и играет существенную роль только при малых пока ошибка оценки этих параметров значительна. С ростом числа шагов его роль уменьшается благодаря наличию убывающих множителей Начальные условия для полученных рекуррентных алгоритмов могут быть нулевыми

причем нулевые начальные условия для подалгоритма формирования оценок параметров а, соответствуют крайнему случаю полной априорной неопределенности относительно этих параметров.

Оптимальный алгоритм проверки многоальтернативных гипотез при простой функции потерь для достаточно большого числа шагов с учетом полученных результатов сводится к следующему: на шаге наблюдений принимается гипотеза если

или

для любых

Применяя формулу (11.2.5) для получаем в том же приближении для порога выражение

где

— часть порога, не зависящая от наблюдений и изменяющаяся лишь за счет изменения весовых коэффициентов с ростом числа шагов

— часть порога, зависящая от наблюдений как непосредственно, так и через оценки параметров обстановки.

В (11.4.17), как и в левой части неравенства (11.4.16), не учтены члены второго порядка малости по

При проверке двухальтернативных гипотез оптимальный алгоритм при любых функциях потерь сводится к составлению рекуррентного соотношения для логарифма отношения правдоподобия

и сравнению его с порогом

где

Таким образом, логарифм Отношения правдоподобия на каждом шаге формируется путем добавления к значению на предыдущем шаге поправки, зависящей от вновь наблюденного значения сигнала и оценок неизвестных параметров обстановки а, построенных по результатам наблюдения на предыдущих шагах. От этих же оценок зависит и порог, с которым на данном шаге сравнивается логарифм отношения правдоподобия. Оценка обстановки, производимая совместно с принятием основных решений, производится рекуррентно по формулам

(11.4.12), которые нужно рассматривать совместно с (11.4.16), (11.4.20).

При применении адаптивного байесова подхода, соответствующего принципу § 6.2, как и для рассмотренных выше процедур анализа, все результаты остаются в силе, если положить все коэффициенты Эти изменения касаются только порогов, с которыми сравниваются отношения правдоподобия или их логарифмы. В частности, порог (11.4.17) принимает вид

а порог (11 4.21) превращается в

и не зависит от результатов наблюдений .

1
Оглавление
email@scask.ru