Главная > Статистический синтез при априорной неопределенности и адаптация информационных систем
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

16.2. ДВУХЭТАПНАЯ ПРОЦЕДУРА ОБНАРУЖЕНИЯ

Рассмотрим некоторые примеры оптимизации многошаговых управляемых процессов принятия решения с адаптацией. В качестве первого решим задачу оптимизации двухэтапной процедуры обнаружения, которая довольно широко распространена в радиолокации и других практических приложениях. Эта процедура включает в себя управление процессом наблюдения и используется для проверки двухальтернативной гипотезы, когда параметр к принимает два значения — единица (в радиолокации это соответствует наличию цели) и нуль (отсутствие цели). Окончательное решение принимается за два шага. На первом шаге наблюдается совокупность данных (в радиолокации отрезок реализации принимаемого сигнала, соответствующий определенной мощности, длительности и виду модуляции зондирующего сигнала) и принимается одно из трех возможных решений:

— значение параметра (цель есть)

— значение параметра (цели нет) —

— продолжить наблюдение, так чтобы получить на втором шаге совокупность данных (в радиолокации этому решению может соответствовать выбор таких параметров зондирующего сигнала на втором шаге, как длительность, мощность, вид модуляции и т. п., совокупность которых мы обозначим через

Параметры так или иначе характеризуют качество совокупности данных получаемых в процессе наблюдения на втором шаге, и являются объектом выбора по результатам наблюдения на первом шаге.

На втором шаге, который реализуется, если принимается решение наблюдается совокупность данных и принимается одно из двух возможных окончательных решений:

— значение параметра

— значение параметра

Как видно из описания задачи, множество решений в ней в общем случае имеет довольно сложную дискретно-непрерывную структуру, разную на разных шагах и содержащую среди возможных на первом шаге сложное решение соответствующее, во-первых, принятию решения о продолжении наблюдения и, во-вторых, выбору тех или иных значений параметров из, вообще говоря, непрерывной области значений, определяющих качество получаемой на следующем шаге информации и риск окончательного решения. Таким образом, несмотря на то, что фактическое число шагов в данной многошаговой задаче равно всего двум, она содержит все особенности и трудности, характерные для многошаговых управляемых процессов принятия решения и является достаточно поучительной с точки зрения методологии решения подобных задач. Кроме того, она имеет немалое самостоятельное значение для практических применений. Введем следующую функцию потерь

где — потери от пропуска цели; — потери от ложного обнаружения (ложной тревоги), — затраты на продолжение наблюдения на втором шаге с выбором данного значения совокупности паралштров а правильные решения на первом шаге имеют нулевые потери.

Рассмотрим сначала неадаптивный вариант задачи, предпотагая, что распределения вероятности для данных наблюдения

и априорные вероятности

полностью известны. Распределения вероятности для данных наблюдения получаемых на втором шаге, естественно, зависят от выбора значения принятого на первом шаге

Конечный апостериорный риск (в данном случае ) определяется следующими выражениями

где

— совместные плотности вероятности при (наличии и отсутствии цели) соответственно и при заданном значении Апостериорный риск при не существует, так как при этом отсутствуют наблюдения Поэтому выбор решения производится сравнением двух выражений в (16.2.4), в результате чего правило принятия решения имеет вид: при любых принимается решение если

и решение при выполнении противоположного неравенства. Это правило решения можно записать в обычной форме неравенства для отношения правдоподобия

а именно:

Для дальнейшего удобно представить отношение правдоподобия А (16.2.7) в виде

где

— отношение правдоподобия для данных наблюдения на первом шаге, а

— отношение условных плотностей вероятности данных наблюдения на втором шаге. Соответственно правило принятия решения на втором шаге можно записать в виде

что соответствует сравнению условного отношения правдоподобия порогом, зависящим от (обратно пропорциональным отношению правдоподобия для первого шага).

После подстановки оптимального решения в апостериорный риск получаем выражение для минимизированного апостериорного риска

Для получения апостериорного риска определяющего оптимальный выбор решения согласно общим рекуррентным соотношениям § 2.7, следует вычислить условное математическое ожидание при фиксированном значении т. е. усреднить (16.2.13) по при заданном значении Соответствующая условная плотность вероятности определяется очевидным соотношением

и зависит от решения только посредством

Выполняя усреднение по распределению вероятности с плотностью (16.2.14) и записывая апостериорный риск при получаем следующие выражения для апостериорного риска

Решение и, выбирается в зивисимости от того, какая из величин или оказывается наименьшей, причем когда последняя из них минимальна и принимается решение продолжить наблюдение, в качестве выбирается то значение, для которого достигается минимум

Детализируем это правило решения. Для этого нужно более подробно рассмотреть последнее из выражений (16.2.15), в частности, входящий в него интеграл, который может быть записан в виде

где области интегрирования

соответствуют тому, какое из выражений в фигурных скобках минимально. Используя отношение правдоподобия и вводя для краткости обозначение

приведем выражение (16.2.16) к следующему виду:

Если интересоваться случаем независимых наблюдений то и с учетом этого представления, а также обозначения (16.2.17) апостериорный риск можно записать в виде

откуда следует, что правило принятия решения зависит только от достаточной статистики которая с точностью до множителя совпадает с отношением правдоподобия для совокупности данных наблюдения

Структура правила решения зависит от наличия и положения точек пересечения кривой

с прямыми которыми определяются относительные значения апостериорных рисков для различных решений. Поскольку функция из (16.2.18) при любом изменяется от нуля до единицы, когда х меняется от нуля до бесконечности, и является монотонно не убывающей функцией к, то функция из (16.2.20) также

является монотонно не убывающей и уравнение либо вообще не имеет корней либо имеет единственный корень Если при всех функция или то решение о продолжении наблюденйя никогда не принимается и двухэтапная процедура вырождается в одноэтапную. Правило принятия решения в этом случае имеет вид

и соответствует высокой стоимости продолжения наблюдения.

Если уравнение имеет корень то можно принять любое из трех решений в соответствии с правилом:

где — корень уравнения

Таким образом, в целом правило принятия решений при двух этапной процедуре определяется двумя порогами для отношения правдоподобия на первом шаге, величиной обеспечивающей минимум в (16.2 20) и зависящей от и одним порогом для отношения правдоподобия полной совокупности данных наблюдения

Пусть теперь все или часть из распределений вероятности данных наблюдения (16.2.2) зависят от некоторых неизвестных параметров а, характеризующих априорную неопределенность задачи. Поэтому отношения правдоподобия и функция (посредством и непосредственно благодаря зависимости от а) также зависят от параметров а. Формируя оценки максимального правдоподобия для этих параметров по совокупности данных наблюдения полученных на первом шаге, и по совокупности данных на обоих шагах, получаем на основании общих результатов § 16.1 следующее адаптивное байесово правило принятия решений:

где пороговые значения и оптимальное значение управляемого параметра определяются при подстановке в функцию значения и также, вообще говоря, зависят от оценки . В (16.2.23) предполагается, что Если это не что правило принятия решения соответственно видоизменяется и переходит в (16.2.21) с заменой всюду неизвестного значения а на оценку максимального правдоподобия

1
Оглавление
email@scask.ru