6.5.5. Фильтрация марковского параметра методом апостериорной вероятности
Выше мы убеждались, что в уравнения для оптимальных операторов входит апостериорная вероятность параметра (параметров) при заданной реализации сигнала (сигналов). Иначе говоря, формирование апостериорной вероятности является достаточной первичной операцией оптимальной системы, после которой остается лишь
принять решение, наилучшее с точки зрения некоторого критерия. Приемник, формирующий апостериорную вероятность для постоянного параметра, известен в литературе как приемник Вудворда — Дэвиса. Формула Байеса может быть, однако, записана и для параметра, переменного во времени. Считая, что наблюдение проводится в дискретные моменты
имеет формулу
где
многомерные априорное и апостериорное распределения;
многомерная функция правдоподобия;
нормировочная величина, не зависящая от
Исследование оператора апостериорной вероятности (6.5.21) без конкретизации характера изменения параметра во времени провести затруднительно. Широким классом случайных процессов, охватывающим массу интересных для приложений случаев, является класс марковских процессов (см. § 6.3). Проблема формирования апостериорной вероятности для марковски изменяющихся параметров, произвольно закодированных во входном сигнале
была изучена Стратоновичем Р. Л. в работах [16—18]. Хотя метод Р. Л. Стратоновича по существу не относится к теории решений, он важен для теории измерений. Мы изложим его, не придерживаясь канвы изложения работы [16].
Предположим, что моменты наблюдения входной смеси
отстоят так, что все случайные переменные, по которым произведено усреднение при нахождении функции правдоподобия, в разные моменты не связаны, так что
распадается на произведение
Используя (6.3.2) и (6.5.22), запишем (6.5.21) для двух соседних моментов наблюдения:
откуда
Перейдем теперь к финальным апостериорным вероятностям, характеризующим апостериорное распределение параметра на последнем шаге при наличии наблюдений на предыдущих. Это осуществляется интегрированием
по всем аргументам
кроме последнего
Тогда из (6.5.23) имеем
Физическая трактовка важного для дальнейшего соотношения (6.5.24) достаточно ясна из рис. 6.9.
Рис. 6.9. Фильтр апостериорной вероятности: 1 — блок образования функции правдоподобия; 2 — блок задержки и обработки апостериорной вероятности.
Для формирования апостериорного распределения на очередном шаге необходимо трансформировать апостериорное распределение предыдущего момента с помощью функции перехода, что позволяет учесть ожидаемый характер
изменения параметра за шаг, и умножить результат трансформации на значение функции правдоподобия очередного замера, характеризующее вновь поступившие сведения о параметре.
Формула (6.5.24) была выведена выше в предположении дискретного наблюдения. Однако она имеет более широкую область применимости. Если полезная компонента в
имеет импульсную структуру, причем все случайные возмущения (шумы, помехи, флюктуации отражающей поверхности) от импульса к импульсу независимы, то после предельного перехода к непрерывному наблюдению для функции правдоподобия справедливо соотношение
аналогичное (6.5.22). В (6.5.25) в качестве элементов входят функции правдоподобия для всех
циклов наблюдения, зависящие от значения параметра
которое остается в пределах
импульса неизменным. Иными словами, если мы не интересуемся эволюцией апостериорного распределения в интервалах между импульсами, остается применимым соотношение (6.5.24), где дискретизация параметра диктуется характером входного сигнала
а наблюдение реализации последнего считается непрерывным.
Если же сигнал имеет произвольную структуру и мы интересуемся видом апостериорного распределения непрерывно, то необходимо изыскать какие-то новые способы математического описания апостериорной вероятности, устраняющие дискретный характер соотношения (6.5.24).
При переходе к непрерывному пределу аналогом соотношения (6.5.22) явится функция
где
интервал наблюдения;
некоторый функционал
и
при
(иногда это просто функция
в этом мы убедимся ниже на примерах).
Тогда соотношение (6.5.24) перейдет в
Здесь
— функция правдоподобия на интервале
на котором параметр будем считать изменяющимся столь мало, что практически можно отождествлять
с его значением в конце интервала.
Будем интересоваться параметрами в виде диффузионных процессов с плотностью вероятности перехода, удовлетворяющей уравнению Фоккера-Планка (см. § 6.3):
где
линейный дифференциальный оператор.
Если учесть, что
удовлетворяет условию непрерывности
то из (6.5.28) следует, что при малых
или
Обратим теперь внимание на то, что при малых
выполняется
где содержимое прямых скобок является конечной величиной при
и из соображений статистической эквивалентности может отождествляться с подынтегральным выражением. Учтем еще, что
при малом
близко к 1, так что можно полагать
где
пока не определено. Разлагая
в ряд по
подставляя в (6.5.27) соотношения (6.5.28)-(6.5.31) и ограничиваясь везде первыми степенями по
имеем уравнение
Если проинтегрировать обе части (6.5.32) по
и учесть убывание
при
-уоо, то оказывается, что
откуда окончательно имеем дифференциальное уравнение для апостериорной вероятности
Итак, при непрерывном наблюдении эволюция апостериорной вероятности задается дифференциальным уравнением типа Фоккера-Планка, правая часть которого содержит линейный оператор
характеризующий функцию перехода, и слагаемое, зависящее от входной реализации.
Первое слагаемое ведет к "расплыванию"
за счет регулярных и случайных изменений параметра, второе, наоборот, — к "сужению" пика
за счет вновь приходящей информации. Мера информации пропорциональна разности между текущим подынтегральным выражением логарифма функции правдоподобия и значением той же функции, усредненным по апостериорному распределению, которое сформировано по ранее поступившим данным.
В § 6.3 уже говорилось, что решать уравнения диффузионного типа трудно даже при отсутствии случайно
меняющихся коэффициентов в правой части. В данном же случае второе слагаемое содержит случайные компоненты типа белого шума. Но для формирования апостериорной вероятности достаточно найти технически удобный способ его моделирования. Такая задача решается, например, — в [18]. Мы же здесь откажемся от моделирования общих решений и их исследования, перейдя к дифференциальным уравнениям для некоторых основных характеристик апостериорного распределения.
Рассмотрим случай малой апостериорной неточности, когда
является узким (по сравнению с априорным распределением) изолированным пиком на оси значений параметра. Ввиду наложения множества случайных факторов разумно предположить, что
с достаточной точностью описывается гауссовой кривой:
где
текущая вершина апостериорного распределения, которая иногда может браться в качестве оптимальной оценки
дисперсия апостериорного распределения.
Подставляя (6.5.34) в (6.5.33), производя разложение
и
возле точки
и приравнивая коэффициенты при одинаковых степенях
имеем уравнения
При выводе (6.5.35) учтен малый апостериорный разброс, в пределах которого коэффициенты
и
меняются мало, так что, например,
Если
считается оптимальной оценкой, то совместное решение уравнений (6.5.35) представляет задачу оптимальной фильтрации при малой апостериорной неточности. Решение, естественно, может производиться некоторой динамической системой, моделирующей эти уравнения. Однако детального изучения этих уравнений в работе [16], где они были впервые получены, не дается. Не исчерпывает проблемы и анализ измерения меняющейся частоты, данный в [17, 18], поскольку соотношения (6.5.35) там фактически не используются. Поэтому схемную интерпретацию этих результатов мы отложим до § 6.9 и проведем после изложения основных результатов теории оптимальных измерителей гауссовых параметров. Там же будут изучены рекуррентные соотношения для характеристик апостериорного распределения, которые при импульсном некогерентном сигнале или дискретном наблюдении могут быть выведены непосредственно из (6.5.24).