§ 9.11. Алгоритм минимаксной рекуррентной фильтрации
1. В изложенном выше материале задача оценки компонент вектора фазовых координат была статистической, так как предполагалось, что существуют статистические распределения (может быть с неизвестными параметрами) векторов ошибок измерений, возмущений динамической системы, начальных условий. Однако возможны случаи, в которых упомянутые векторы наряду со случайными компонентами содержат неопределенные компоненты, для которых статистических распределений не существует, а из априорных соображений задаются лишь области возможного существования. Подобная ситуация
(ее назовем статистически неопределенной) возникает, например, если в состав ошибок измерений компонент вектора информации кроме флуктуационных (быстро меняющихся) ошибок входят медленно меняющиеся ошибки — «уходы нулей» аппаратуры системы. При статистическом подходе, использованном в § 6.3, модели этих ошибок описывались формирующим фильтром той или иной степени сложности. Другой подход, иногда менее искусственный, чем статистический, состоит в том, что «уходы нулей» аппаратуры считаются нестатистическими (неопределенными) с априори заданными лишь пределами изменения.
2. Далее изучается лишь задача оценивания (а не управления) в статистически неопределенной ситуации. Поэтому считаем, что управление отсутствует
Тогда вместо (4.77), (4.78) уравнения динамической системы и измерений запишем в виде
где
случайные нормально распределенные вектора, статистические характеристики которых заданы формулами (4.79)-(4.81) и априорными вектором м. о.
неопределенные вектора с заданными областями существования:
Далее эти области считаются замкнутыми, выпуклыми и содержащими начало координат. 1
Будем пытаться оценить наилучшим в некотором смысле способом вектор
в момент
считая, что зафиксировано
векторов измерений
Ранее в статистической ситуации вектор
оценок вектора
считался оптимальным, если он равнялся вектору условного м. о. вектора
следовательно, как показано в § 1.7, доставлял минимум квадратичному критерию точности
где
В статистически неопределенной ситуации для получения гарантированных результатов (ошибки оценки не должны быть слишком большими даже в наиболее неблагоприятном случае) естественно требовать, чтобы
вектор оценок в среднем был наилучшим, если наиболее неблагоприятными являются вектора
которые ограничены условием (9.112) и, как видно из (9.110), (9.111), влияют на вектор
и на вектора
Поэтому в статистически неопределенной ситуации естественно вектор оценок z определять пользуясь минимаксным критерием
где величина
определяется (9.113), а выражение
означает, что при фиксированном векторе z неопределенные вектора должны максимизировать величину
на областях, заданных условиями (9.112).
3. Для построения вектора оценок
оптимального по минимаксному критерию, учтем, что вектор
может быть представлен суммой случайного вектора
и неопределенного вектора
Здесь
в момент
вектор фазовых координат дискретной системы (9.110), у которой
в момент
вектор фазовых координат дискретной системы (9.110), у которой
.
Пусть зафиксированы вектора измерений
Тогда вектор
можно записать в виде
где
вектор условного м. о. случайного вектора
случайный вектор, характеризующий рассеивание векторов
относительно вектора
Очевидно, что
где
к.
определяемая алгоритмом (4.95) при
Тогда из (9.115), (9.113), (9.116)
Основное предположение о природе неопределенных векторов состоит в гипотезе о их постоянстве на множестве случайных реализаций, для которых постоянен вектор
(или, что то же самое, постоянны вектора измерений
Эта гипотеза выполнится, например, если неопределенные вектора постоянны на множестве
всех реализаций. Тогда (9.117) задишем в виде
где
плотность вероятностей случайного вектора
Из (9.110) видно, что вектор
определяется при
рекуррентным уравнением
Вектор
является случайным вектором
(при
порождаемым стохастическим уравнением вида (4.100), которое в рассматриваемом случае имеет вид
где
последовательность независимых нормально распределенных величин, таких, что
Далее, считаем, что
Тогда из (9.120)
случайного вектора
определится рекуррентным уравнением
при
Поэтому
Учитывая линейность алгоритма (4.94), (4.95) нетрудно проверить, что
где
выход в момент
алгоритма (4.94), (4.95), на вход которого поступают вектора измерений
неопределенный вектор, определяемый рекуррентным уравнением
Поэтому
В соответствии с принятой гипотезой о неопределенных векторах принцип минимакса должен быть применен к подынтегральной функции в (9.124) и вектор оптимальной оценки определится операциями
где положено
Итак, вектор
в статистически неопределенной
туации определяется следующим образом: вначале для любых векторов
заданном векторе
надо решить детерминированную задачу максимизации функции
от векторов
определяемых рекуррентными уравнениями (9.119), (9.123) на областях (9.112). После этого величина
станет функцией векторов
Далее решается детерминированная задача определения минимума этой функции на
(вектор z априори не ограничен, так как не ограничен искомый вектор
в результате чего найдется вектор
в функции вектора
Поэтому
Описанную последовательность вычислений можно назвать «алгоритмом минимаксной фильтрации». Ясно, что вектор
от
зависит, вообще говоря, нелинейно. Поэтому вектор
нелинейно зависит и от векторов измерений
линейно зависит от этих векторов). Следовательно алгоритм минимаксной фильтрации относится к классу алгоритмов нелинейной фильтрации.
4. Наметим путь решения сформулированных выше детерминированных задач оптимизации. Вектора
линейно (в соответствии с уравнениями (9.119), (9.123)) зависят от неопределенных векторов
которые аналогичны векторам управлений, ограниченных областями (9.112). Тогда, аналогично областям достижимости, рассмотренным в § 3.10, будет выпукла в и содержит начало координат область достижимости заполняемая векторами
образованными из компонент векторов
При этом
соответствующая области
должна определяться заранее (до процесса оценивания) и заноситься в «память» БЦВМ. Если область
следовательно, и область
симметрична относительно луча
то, как следует из рис.
и оценка по минимаксному среднеквадратичному критерию совпадает с оценкой, выдаваемой алгоритмом ОРФ Калмана (4.94), (4.95).
Отметим также, что в статистической ситуации
минимальная величина среднеквадратичного критерия точности оценивания — в рассматриваемом случае определяется равенством
В статистически неопределенной ситуации величина
получаемая при минимаксной среднеквадратичной фильтрации, имеет вид
где
координаты одной из точек касайия линий уровня с одинаковыми величинами с, в системе координат, центр которой находится в центре области
Величины
некоторые функции
определяемые попутно при нахождении функции
Как видно, величина
может быть найдена лишь приближенно при использовании соответствующих квадратурных формул.
Аналогичный выбор минимаксной среднеквадратичной оценки проводится для любой
компоненты вектора
если уметь определять — область достижимости, заполняемую точками с координатами
и соответствующую ей функцию
Построение подобных оценок для всех компонент вектора
потребует
-кратного определения областей
Полученные оценки будут «слишком» гарантированными, так как при минимаксном выборе оценки каждой фазовой координаты используется свое наиболее неблагоприятное сочетание неопределенных факторов.
Отметим, что алгоритм минимаксной фильтрации существенно зависит от вида функции потерь, входящей в критерий точности. Так, пусть, например,
где
четная, неубывающая функция потерь. В статистической ситуации, как показано в § 4.6 п. 3, оптимальная оценка величины х не зависит от конкретного вида функции
и является
системы, которой удовлетворяют
-мерные векторы
максимизирующих терминальный критерий
(матрицы
определяются из (9.130),
Применяя правило дифференцирования сложной функции, нетрудно показать, что
векторы градиентов функции
по векторам
определяются равенствами
где
-мерного вектора сопряженных переменных, определяемых уравнениями
при начальном условии
Необходимое и достаточное условие оптимальности векторов
имеет вид
где
(оптимальные векторы
и
неподвижные точки преобразований, описываемых оператором проектирования). Так как
выпуклые области, то
точки границ областей
в которых нормали к границам совпадают по направлениям с векторами —
Если таких точек не существует для некоторых
и данных
(границы составлены из кусков некасающихся гиперповерхностей), то точки
находятся в «вершинах» областей — точках, в которых «гладкие» куски границ областей
пересекаются под «острыми» углами.
Для двумерных областей
векторы и и
находятся очевидным геометрическим построением. В более сложном случае эти векторы определяются итерационным процессом (подобным описываемому формулой (2.58)), организация которого облегчается из-за того, что векторы
постоянны (не меняются при итерациях).
Задача приближенного определения областей достижимости делается более простой, если синтез оптимального дискретного управления приближенно заменить
синтезом оптимального непрерывного управления. Для этого от дискретизированной динамической системы, описываемой рекуррентным уравнением (9.110), перейдем к первоначальной непрерывной системе, определяемой дифференциальным уравнением
где
вектор белых нормально распределенных шумов единичной интенсивности
— неопределенный вектор-функция,
матрицы соответствующей размерности.
Обычно система, возмущаемая случайными и неопределенными факторами, задается именно в виде (9.1332) с назпачепием областей существования
Если интервалы времени между дискретными измерениями невелики, то условное распределение вектора
практически не изменится при замене дискретных измерений (9.111) непрерывными измерениями
где матрица
совпадает с матрицами
в моменты
вектор белых нормально распределенных шумов с неособенной матрицей интенсивностей
Матрица
в моменты
совпадает с
векторов в (9.111),
неопределенная вектор-функция, область существования которой
в моменты
совпадает с областью
Неопредел енные вектор-функции
действуют на непрерывную систему (9.1332), (9.135) примерно так же, как дискретные неопределенные векторы
действуют на непрерывную систему (9.110), (9.111). После соответствующего предельного перехода [101 дискретные алгоритмы
(4.78) перейдут в непрерывные алгоритмы
где
7. Задача минимаксной фильтрации в статистически неопределенной ситуации имеет изложенное выше относительно простое решение из-за того, что фиксация векторов измерений
не влияет на области существования, заданные условиями (9.112). Последнее же является следствием того, что максимизация подынтегральной функции в правой части (9.124) выбором векторов
при зафиксированном векторе
являющемся «носителем» векторов наблюдений, происходит без ограничения снизу на величину
Другими словами, при выборе
принадлежащих допускается сколь угодно малая плотность вероятностей вектора
являющегося в данной реализации условным м. о. случайной компоненты вектора
В принципе, можно ограничить возможности «природы», распоряжающейся «игрой» неопределенных векторов возмущений и ошибок измерений, и потребовать, чтобы эта плотность вероятностей была не меньше некоторой малой величины
этом случае допустимые при синтезе минимаксной оценки неопределенные векторы исключают некоторые маловероятные ситуации, и полученная оценка будет гарантированной лишь с некоторой большой вероятностью. Для учета вышеизложенного надо при определении максимума функции
использовать дополнительное условие:
После этого область допустимых векторов
станет зависеть от вектора
что исключит возможность решения задачи максимизации заранее (до конкретной реализации процесса оценивания).
При минимаксной оценке величины
условие (9.144) примет вид:
Условие (9.145) переводит область
в область
, которая или совпадает с
или уже ее вдоль оси
Методика решения задачи минимакса не меняется: при фиксированной абсциссе центра области
надо менять его ординату до тех пор, пока
не коснется двух линий уровня функции
которым соответствуют
наковые величины с. Однако эту операцию нельзя производить до процесса оценивания, так как форма области 32 зависит от величины
в свою очередь зависящей от векторов измерений
Следует отметить, что рассмотренная в [33] задача минимаксной фильтрации в неопределенной ситуации требует учета влияния зафиксированных результатов измерений на область допустимых неопределенных возмущений и ошибок измерений, что заметно осложняет общее решение задачи. Приближенное решение этой задачи можно получить из изложенного выше, если сделать достаточно малыми дисперсии компонент случайных векторов. По-видимому возможен и предельный переход при стремлении этих дисперсий к нулю.
8. Упомянем класс задач минимаксной фильтрации, в которых для определения областей достижимости 9 (или областей
неприменима изложенная выше методика. Пусть, например, заданы области существования не только неопределенных векторов в (9.1332), возмущающих динамическую систему, но и скоростей их изменения. Такая ситуация возникает при оценке параметров движения гироплатформы; ее дрейфы естественно считать неопределенными возмущениями, величина и скорость изменения которых ограничены. Дополним уравнение (9.139) уравнением
где для вектора к задана область существования
Тогда при определении области достижимости в момент
векторов
удовлетворяющих (9.139), вектор
следует считать вектором дополнительных фазовых координат, а к — вектором управления (наряду с вектором
Максимизировать величину
определяемую (9.141), следует при учете ограничений (9.136), (9.146) на векторы управлений и ограничения (9.134) на часть фазовых координат. Подобные задачи можно численно решать, используя метод штрафных функций или метод нахождения седловой точки функции Лагранжа.
9. Перед синтезом алгоритма нелинейной фильтрации, точно решающего задачу получения вектора минимаксных среднеквадратичных оценок, целесообразно найти дополнительные ошибки оценки, возникающие при использовании, например, алгоритма ОРФ (4.94), (4.95)
из-за наличия неопределенных векторов
стесненных условиями (9.112). Векторы
дополнительных ошибок оценки удовлетворяют рекуррентному уравнению (9.123). Если эти ошибки могут принимать недопустимые значения, то необходимо использовать алгоритм минимаксной фильтрации или перейти от алгоритма ОРФ к алгоритму КОРФ, менее чувствительному к наличию неопределенных факторов.
Пусть надо найти область достижимости
— отрезок, внутри которого может находиться величина
Эта задача решается по методике
если ввести векторы
связанные уравнением (9.133), при матрицах
из уравнений (9.123), (9.119). Оптимальные
и должны минимизировать терминальные критерии
определяющие координаты левого и правого концов отрезка 521. Начальные (в момент
векторы сопряженных переменных примут вид
должны удовлетворять условиям (9.133).
Задачу приближенного определения координат концов отрезка
проще решать, переходя к непрерывному времени. Вектор
удовлетворяет уравнению (9.139), матрицы
и В которого находятся из системы уравнений (9.138). Координаты концов отрезка
найдем при минимизации оптимальными вектор-функциями
и вектором
удовлетворяющими условиям (9.134), (9.136), (9.140), терминальных критериев
Явные выражения для
нетрудно получить с помощью принципа максимума, если вместо (9.143) учесть, что
Аналогично определяются координаты концов отрезков
областей достижимости, в которых могут оказаться величины
Опыт разработки алгоритмов КОРФ для конкретных условий показывает, что области
заметно уменьшаются, если периодически «обновлять» матрицы
заменять в процессе оценивания с некоторой рациональной частотой
на априорную к.
и алгоритм (4.95) периодически использовать при новых начальных условиях.