Приложение 6. Вывод уравнений оптимального наблюдения (уравнений фильтра Калмана — Бьюси)
1. Найдем вначале уравнения для ошибки ) наблюдения. Для этого вычтем из уравнения объекта (5.2.1) уравнение наблюдателя (5.2.6), тогда получим
2 Теперь вычислим значение критерия (5.2.7) на решениях . В связи с этим введем обозначения
где - математическое ожидание; — матрица дисперсий ошибок наблюдения.
Нетрудно видеть, что
Отсюда следует, что
Матрица называется матрицей моментов второго порядка. Элементы матрицы определяются выражениями
Таким образом, можно записать в виде
Утверждение . Среднее значение квадрата ошибка восстановления (5.2.7) выражается через математическое ожидание и матрицу дисперсий ошибок наблюдения следующим образом:
Доказательство этого соотношения получаем, если с учетом запишем
Далее для простоты полагаем .
3. Переходя к минимизации критерия (5.2.7), заметим что в соответствии с второе слагаемое достигает минимума, когда . Найдем условия, при которых выполняется это равенство. В соответствии с формулой Коши (1.3.18) решение уравнения имеет вид
где - нормированная фундаментальная матрица решений однородного уравнения
Принимая во внимание, что , получим на основе
Это означает, что является решением уравнения
Если задать начальное условие наблюдателя
то и, следовательно, решение уравнения
Таким образом, доказано соотношение (5.2.11).
4. Найдем условия, при которых достигает минимума первое слагаемое в выражении . Для этого построим вначале уравнение, которому удовлетворяет матрица дисперсий ошибок восстановления . Такое уравнение нетрудно записать, если воспользоваться следующим утверждением [4.7].
Утверждение . Если — решение уравнения
(где "белый шум" интенсивности - стохастический вектор, не зависящий от со средним и матрицей дисперсий матрица дисперсий
удовлетворяет матричному дифференциальному уравнению
Для доказательства этого утверждения запишем вначале в соответствии с
Для вычисления значения матрицы воспользуемся выражением для решения уравнения :
Тогда
Второе и третье слагаемые в этом выражении равны нулю, так как векторы независимы и .
Преобразуем последнее слагаемое с учетом (5.1.3)
Подставляя , получим с учетом
Аналогично получим
(Нетрудно видеть, что ). Дифференцируя это равенство с учетом соотношения
и равенства
получим (П 6 14), и таким образом, утверждение доказано.
Используя это утверждение, запишем уравнение для матрицы дисперсий ошибок восстановления
5. Сформулируем одно утверждение, касающееся свойств решений матричного дифференциального уравнения Риккати (4.1.28).
Отметим вначале, что в соответствии с (2.3.11) функция
являющаяся решением уравнения метода динамического программирования, возникшего в связи с задачей о минимуме функционала (4.1.26) на связях (4.1.25), позволяет вычислить значение функционала (4.1.26) на оптимальных траекториях. Это значение
Вычислим значение функционала (4.1.26) при неоптимальном управлении
где - произвольная, но фиксированная матрица функций времени, заданных на интервале .
Объект, замкнутый управлением , описывается уравнением
где
а функционал (4.1.26) принимает вид
где
Итак, необходимо вычислить значение функционала на решениях уравнения .
Не фиксируя пока , будем искать значение функционала (П 6.29) как
Из этого выражения следует, в частности, что
Дифференцируя обе части с учетом , получим
Отсюда следует уравнение
Это уравнение с учетом примет вид
Из получим значение функционала
Очевидно, что
так как — значение этого функционала при оптимальном управлении.
Из следует, что поскольку вектор произвольный. Кроме того, используя произвольность , заключаем, что
Таким образом, доказано следующее утверждение.
Утверждение . Матричное уравнение с краевым условием имеет решение, удовлетворяющее неравенству . Это неравенство обращается в равенство, если
Если функционал (4.1.26) имеет вид , то уравнение принимает вид
а матрица
6. Введем (полагая дальше для простоты ) в рассмотрение дифференциальное уравнение для некоторой матрицы (размеров ), которое получается уравнения обращением времени путем введения и последующей замены на :
Очевидно, что решения уравнений связаны равенством
Применим теперь утверждение к уравнению . Матрица достигает минимума, если матрица
Действительно, уравнение совпадает с уравнением , если в последнем положить ,
и тогда на основе получаем . Подставляя , получим уравнение для наименьшего значения матрицы :
Решения уравнений удовлетворяют условию
Обращая время в уравнении , заключаем, что
где - решение уравнения (5.2.9), которое совпадает с после обращения времени.
Из следует
и поэтому матрица , совпадающая при с матрицей (5.2.8), минимизирует наблюдатель, и таким образом, утверждение 5.2.2 доказано.
Отметим, что полученный результат не зависит от конкретного момента времени t, который выбран для минимизации критерия (5.2.7) и выбора матрицы , поэтому матрица (5.2.8) минимизирует (5.2.7) одновременно для всех и любых знакоопределенных матриц .