Наблюдатель (оцениватель, фильтр) Калмана.
Как отмечалось, задача синтеза стохастической оптимальной системы при неполной информации обычно разделяется на задачу оптимальной оценки и задачу синтеза оптимальной системы при полной информации. Рассмотрим задачу оптимальной оценки в дискретном случае. Пусть объект и наблюдение описываются уравнениями
где
— последовательность гауссовских случайных величин с характеристиками
символ Кронекера
при
при
гауссовская случайная величина с характеристиками
— симметричные матрицы, причем
Случайные последовательности
называются соответственно шумом объекта и шумом наблюдения или измерения, и они не коррелированы со случайной величиной
Требуется, используя измеренные значения переменной
при
, найти несмещенную оценку
вектора
, обеспечивающего минимум квадрата ошибки
Напомним, что оценка
называется несмещенной, если
Условие
означает, что ни одна координата выходной переменной не измеряется точно. В этом случае задача оценивания называется несингулярной или невырожденной (неособой).
Решение невырожденной задачи определяется следующим образом [51:
Здесь
является математическим ожиданием вектора
и служит его априорной оценкой, т. е. оценкой, которая получается до измерения
дисперсионная матрица
ошибки
, т. е. ошибки априорной оценки;
дисперсионная матрица ошибки
т. е. ошибки искомой (апостериорной) оценки.
Выражение для оценки содержит кроме априорной оценки поправочный член, пропорциональный невязке — разности между измеренным значением переменной
и ее оценкой. При вычислении оценки на каждом шаге нужно начинать с определения априорной дисперсионной матрицы
Далее нужно вычислить матрицу коэффициентов усиления
и дисперсионную матрицу
затем априорную оценку
и в последнюю очередь искомую оценку
Так как матрицы
не зависят от измерений, их можно вычислить заранее при всех необходимых значениях
Соотношения
определяющие оптимальный фильтр (оцениватель, наблюдатель), впервые были получены Калманом, поэтому оптимальный дискретный линейный фильтр называют фильтром Калмана.
Установим физический смысл или роль матрицы
Для этого рассмотрим случай, когда
являются скалярными переменными и
. При этом соотношения
принимают следующий вид:
Пусть
. В этом случае
(искомая оценка равна априорной оценке) и измерение, которое производится в
момент, при определении оценки
не используется. Из физических соображений ясно, что
измерение не должно учитываться, если оно никакой информации не несет, т. е. дисперсия его ошибки очень велика
. Этот вывод также следует из приведенного соотношения для
Так как
независимы, то из последнего соотношения следует первая часть равенства (10.282).
Остается доказать, что средний квадрат ошибки
равный следу матрицы Р (С), принимает минимальное значение, если в (10.279) матрица
определяется соотношением (10.281). Как легко проверить, первую часть равенства (10.282)
(опустив для краткости аргумент
можно представить в виде
Если
определяется из (10.281), первое слагаемое правой части последнего равенства обращается в нуль. Оставшуюся часть обозначим Р:
Эта матрица в силу свойств дисперсионных матриц является неотрицательно-определенной, поэтому ее диагональные элементы не отрицательны (последнее следует из неравенств
которые получаются из
при
диагональные элементы матрицы Р. Так как матрица
является положительноопределенной, то первое слагаемое в (10.284) также является неотрицательно-определенной при произвольной матрице
Поэтому след матрицы Р будет минимальным при такой матрице
когда первое слагаемое в (10.284) обращается в нуль, т. е. когда
определяется соотношением (10.281). При этом из (10.284) получаем вторую часть равенства соотношения (10.282).
Заметим, что здесь вывод соотношений, определяющих фильтр Калмана, был несколько упрощен тем, что структура уравнения (10.279) была задана. Задача оптимальной оценки, таким образом, была сведена к определению оптимальной матрицы коэффициентов усиления.
Стохастическая линейная оптимальная система управ» ления при неполной информации. Пусть объект и наблюдатель описываются уравнениями
(10.285) входит оценка
вместо
Оценка
получается на выходе фильтра (10.286), совпадающего с фильтром Калмана (10.279)-(10.283). Таким образом, дискретная оптимальная система управления в случае неполной информации, как и аналогичная непрерывная оптимальная система управления, состоит из оптимального фильтра (наблюдателя) и оптимального «детерминированного» регулятора.
Если шумы или значение фазового вектора в начальный момент не являются гауссовскими, то соотношения (10.285), (10.286) определяют линейную оптимальную систему управления, т. е. систему управления, вообще говоря, оптимальную только в классе линейных систем.