ГЛАВА 4. РЕКУРРЕНТНАЯ ФИЛЬТРАЦИЯ ФАЗОВЫХ КООРДИНАТ ЛИНЕЙНОЙ СИСТЕМЫ
§ 4.1. Основные предположения
В главе 1 было показано, что для синтеза оптимального стохастического управления объектом в условиях, когда поступает дискретная статистическая информация о его текущих фазовых координатах, надо знать достаточные статистики — характеристики условных распределений векторов фазовых координат. В данной главе рассматривается случай, когда объект управления линеен — описывается линейными дифференциальными уравнениями вида (3.1), а векторы измерений
линейно зависят от векторов фазовых координат
От векторов измерений
могут зависеть матрицы
входящие в уравнение (3.10) дискретной линейной системы, эквивалентной объекту управления в моменты
матрицы, описывающие линейную связь векторов
корреляционные матрицы случайных векторов возмущений и ошибок измерений.
Предполагается, что нормально априорное распределение вектора
и нормальны апостериорные (после фиксации векторов измерений) распределения векторов возмущений и ошибок измерений. Тогда векторы
имеют нормальные условные (апостериорные) распределения при произвольной зависимости векторов управлений от рацее зафиксированных векторов измерений, а достаточные статистики — векторы условных м. о. и условные к. м. векторов
определяются рекуррентными уравнениями, которые называются «алгоритмами оптимальной рекуррентной фильтрации» («алгоритмами ОРФ»). Из § 1.7 следует, что векторы условных м. о., последовательно определяемые алгоритмом ОРФ, являются оценками векторов фазовых координат, оптимальными по среднеквадратичному критерию.
При отсутствии зависимости от векторов измерений матриц описания моделей динамической системы и
измерений алгоритм ОРФ, определяющий векторы условных м. о., является дискретным линейным оператором над векторами измерений, оптимальным по среднеквадратичному критерию. Но предложенный в [27] (см., также [19], [36], [44]) алгоритм Калмана, применимый при измерениях модели 1, тоже является дискретным линейным оператором, оптимальным по среднеквадратичному критерию и полученным в рамках корреляционной теории (используются первые два априорных момента без предположений о виде распределений случайных векторов возмущений и ошибок измерений; алгоритм Калмана не изменится, если эти распределения считать нормальными). Из единственности оптимального линейного оператора (см. также теорему В. С. Пугачева [43, стр. 768]) следует, что алгоритм Калмана и алгоритм ОРФ при измерениях модели 1 должны совпадать. Поэтому, далее, этот алгоритм ОРФ называется «алгоритмом ОРФ Калмана». В общем случае алгоритмы ОРФ разной структуры (в том числе и алгоритм Калмана) выводятся далее при рассмотрении измерений модели 2.
Следует отметить, что способ вывода алгоритмов оптимального оценивания как алгоритмов определения параметров условных нормальных распределений существенно проще способа получения этих же алгоритмов как линейных операторов, оптимальных по среднеквадратичному критерию. Поэтому ниже систематически используется именно этот способ вывода (использование способа в различных статистических ситуациях было проведено в [10]), основанный только на известных в теории вероятностей [1] свойствах условного нормального распределения.