6.9.4. Синтез измерителя при ограниченном знании статистики
Наряду с байесовым решением, дающим как бы абсолютный оптимум, чрезвычайно интересно с практической точки зрения решить задачу синтеза измерителя, оптимального в условиях ограниченного априорного знания. Задачи подобного типа в общем плане в теории статистических решений не ставились. Некоторым исключением является винеровская теория фильтрации и ее нелинейное обобщение в работах Заде [15], в которых оптимальный оператор фильтрации отыскивается при задании только корреляционных функций однако этот оператор заранее считается принадлежащим к заданному классу — линейному в винеровской теории и определенному виду нелинейных в [15]. Последнее ограничение вызывает естественную критику, ибо остается
неясным, Насколько близки синтезируемые схемы к действительно оптимальным операторам, которые следует получить из общей теории решений без предварительного задания их структуры. Некоторые результаты, относящиеся к решению задачи синтеза при ограниченном априорном знании содержатся в работе Здесь наряду с ними мы попытаемся сформулировать общую постановку и рассмотрим другие частные случаи.
Итак, пусть относительно имеются некоторые априорные статистические сведения, например типа рассмотренных в п. 6.9.4, которые позволяют задать множество допустимых реализаций Это множество описывается априорным распределением вероятностей с плотностью принадлежащим к заданному классу распределений, который обозначим через Частным случаем является полное отсутствие статистических сведений, когда — множество всех положительных интегрируемых в бесконечной области значений X функции, нормированных к единице.
Правило нахождения оценок в данном случае может быть получено соответствующим обобщением правила, основанного на наименее предпочтительном распределении. При этом естественно считать, что наименее предпочтительное распределение также подчиняется ограничениям, и отыскивать его среди распределений класса Общее правило выбора оптимального решения может быть сформулировано в следующем виде:
где распределение, принадлежащее к заданному классу — наименее предпочтительное из этого класса распределение; X — байесова оценка относительно
При построении решения уравнения (6.9.25) сначала для любой плотности отыскивается байесова оценка минимизирующая средний риск и являющаяся функционалом Затем выбором функции максимизируется средний риск, вычисленный для этой оценки.
где множители определяются из условий
а байесова оценка относительно распределения
Таким образом, оценка соответствующая заданию только корреляционной матрицы измеряемых параметров, является оптимальной в том случае, если она является байесовой оценкой относительно априорного распределения вероятностей, для которого корреляционная матрица равна заданной, а условный риск для этой оценки представляет собой сумму постоянной величины и квадратичной формы X вида
Покажем, что при некоторых условиях наименее предпочтительным распределением для данного случая является гауссово распределение. Пусть функция потерь — квадратическая (6.5.8), а функция правдоподобия представлена в виде (6.9.19), причем функция аппроксимируется гауссовой кривой
где матрица порядка по структуре подобная матрице
Заметим, что функция в (6.9.19) при соответствующей нормировке является плотностью распределения вероятностей для вектора являющегося оценкой максимального правдоподобия для k. Рассмотрим гауссово априорное распределение с корреляционной матрицей и найдем оценку условного математического ожидания, соответствующую квадратической функции потерь. Тогда
где матрица определяется из уравнения
т. е. оценка линейно выражается через вектор Подставляя (6.9.34) в выражение для условного риска, получаем
Как видно, условный риск имеет требуемый вид (6.9.30), т. е. гауссово распределение действительно является наименее предпочтительным, а сама оптимальная оценка имеет вид (6.9.34).
Представление (6.9.19) строго выполняется для аддитивной смеси в этом случае и Этот результат позволяет осмыслить характер оптимальности решений линейной теории фильтрации. Оказывается, что если измеряемый параметр аддитивно смешан с гауссовой помехой и задана функция корреляции то никакого лучшего (с точки зрения квадратичной функции потерь) оператора фильтрации, чем линейный оператор, определяемый винеровской теорией фильтрации, не существует и только более подробные статистические сведения могут привести к изменению структуры оптимального оператора.
Приближенно представление (6.9.19) выполняется в довольно большом числе случаев, о которых уже говорилось в п. 6.5.1 и которые имеют место в задачах радиолокационного измерения. Это обстоятельство подчеркивает значение гауссова априорного распределения, которое оказывается интересным не только само по себе, но и как наименее предпочтительное распределение из класса распределений с заданной функцией корреляции. В связи с этим мы уделили выше гауссову априорному распределению наибольшее внимание.
Еще одним интересным примером задачи с частично заданными статистическими характеристиками является случай, когда заданы значения только матрицы вторых моментов производной в любой момент времени. К этому случаю приближенно можно свести и случай, когда априори заданы пределы изменения производной в любой момент времени. В данном примере
и уравнение (6.9.29) для условного риска имеет вид
Если задан еще второй момент для значения в начальный момент времени то к правой части (6.9.37) следует добавить слагаемое Можно убедиться, что при определенных условиях, подобных рассмотренным выше, наименее предпочтительным распределением для данного случая является распределение для марковского гауссова процесса с переходной вероятностью
и с равномерным распределением для в случае, когда не задана, либо гауссовым распределением для , с дисперсией при заданной
Аналогичные результаты получаются и в том случае, когда наряду со статистическими характеристиками первых производных заданы статистические характеристики вторых производных, так что определены следующие моменты:
В этом случае наименее предпочтительное распределение оказывается соответствующим марковскому гауссову процессу второго порядка с гауссовой переходной вероятностью, зависящей только от квадратичной формы переменных полностью определяемой заданными
Поэтому оптимальный оператор оценки, полученный для такого распределения, одновременно является оптимальным при задании только матрицы вторых моментов для первых и вторых производных измеряемых параметров Эти положения показывают, что приведенные в п. 6.8.2 примеры измерения марковских и одновременно гауссовых параметров имеют более универсальный смысл, чем это ранее формулировалось.