§ 9.11. Алгоритм минимаксной рекуррентной фильтрации

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

§ 9.11. Алгоритм минимаксной рекуррентной фильтрации

1. В изложенном выше материале задача оценки компонент вектора фазовых координат была статистической, так как предполагалось, что существуют статистические распределения (может быть с неизвестными параметрами) векторов ошибок измерений, возмущений динамической системы, начальных условий. Однако возможны случаи, в которых упомянутые векторы наряду со случайными компонентами содержат неопределенные компоненты, для которых статистических распределений не существует, а из априорных соображений задаются лишь области возможного существования. Подобная ситуация

(ее назовем статистически неопределенной) возникает, например, если в состав ошибок измерений компонент вектора информации кроме флуктуационных (быстро меняющихся) ошибок входят медленно меняющиеся ошибки — «уходы нулей» аппаратуры системы. При статистическом подходе, использованном в § 6.3, модели этих ошибок описывались формирующим фильтром той или иной степени сложности. Другой подход, иногда менее искусственный, чем статистический, состоит в том, что «уходы нулей» аппаратуры считаются нестатистическими (неопределенными) с априори заданными лишь пределами изменения.

2. Далее изучается лишь задача оценивания (а не управления) в статистически неопределенной ситуации. Поэтому считаем, что управление отсутствует Тогда вместо (4.77), (4.78) уравнения динамической системы и измерений запишем в виде

где случайные нормально распределенные вектора, статистические характеристики которых заданы формулами (4.79)-(4.81) и априорными вектором м. о. неопределенные вектора с заданными областями существования:

Далее эти области считаются замкнутыми, выпуклыми и содержащими начало координат. 1

Будем пытаться оценить наилучшим в некотором смысле способом вектор в момент считая, что зафиксировано векторов измерений

Ранее в статистической ситуации вектор оценок вектора считался оптимальным, если он равнялся вектору условного м. о. вектора следовательно, как показано в § 1.7, доставлял минимум квадратичному критерию точности

где В статистически неопределенной ситуации для получения гарантированных результатов (ошибки оценки не должны быть слишком большими даже в наиболее неблагоприятном случае) естественно требовать, чтобы

вектор оценок в среднем был наилучшим, если наиболее неблагоприятными являются вектора которые ограничены условием (9.112) и, как видно из (9.110), (9.111), влияют на вектор и на вектора Поэтому в статистически неопределенной ситуации естественно вектор оценок z определять пользуясь минимаксным критерием

где величина определяется (9.113), а выражение означает, что при фиксированном векторе z неопределенные вектора должны максимизировать величину на областях, заданных условиями (9.112).

3. Для построения вектора оценок оптимального по минимаксному критерию, учтем, что вектор может быть представлен суммой случайного вектора и неопределенного вектора

Здесь в момент вектор фазовых координат дискретной системы (9.110), у которой в момент вектор фазовых координат дискретной системы (9.110), у которой .

Пусть зафиксированы вектора измерений Тогда вектор можно записать в виде

где вектор условного м. о. случайного вектора случайный вектор, характеризующий рассеивание векторов относительно вектора Очевидно, что где к. определяемая алгоритмом (4.95) при Тогда из (9.115), (9.113), (9.116)

Основное предположение о природе неопределенных векторов состоит в гипотезе о их постоянстве на множестве случайных реализаций, для которых постоянен вектор (или, что то же самое, постоянны вектора измерений Эта гипотеза выполнится, например, если неопределенные вектора постоянны на множестве

всех реализаций. Тогда (9.117) задишем в виде

где плотность вероятностей случайного вектора Из (9.110) видно, что вектор определяется при рекуррентным уравнением

Вектор является случайным вектором (при порождаемым стохастическим уравнением вида (4.100), которое в рассматриваемом случае имеет вид

где последовательность независимых нормально распределенных величин, таких, что

Далее, считаем, что Тогда из (9.120) случайного вектора определится рекуррентным уравнением

при Поэтому

Учитывая линейность алгоритма (4.94), (4.95) нетрудно проверить, что где выход в момент алгоритма (4.94), (4.95), на вход которого поступают вектора измерений неопределенный вектор, определяемый рекуррентным уравнением

Поэтому

В соответствии с принятой гипотезой о неопределенных векторах принцип минимакса должен быть применен к подынтегральной функции в (9.124) и вектор оптимальной оценки определится операциями

где положено

Итак, вектор в статистически неопределенной туации определяется следующим образом: вначале для любых векторов заданном векторе надо решить детерминированную задачу максимизации функции от векторов определяемых рекуррентными уравнениями (9.119), (9.123) на областях (9.112). После этого величина станет функцией векторов Далее решается детерминированная задача определения минимума этой функции на (вектор z априори не ограничен, так как не ограничен искомый вектор в результате чего найдется вектор в функции вектора Поэтому

Описанную последовательность вычислений можно назвать «алгоритмом минимаксной фильтрации». Ясно, что вектор от зависит, вообще говоря, нелинейно. Поэтому вектор нелинейно зависит и от векторов измерений линейно зависит от этих векторов). Следовательно алгоритм минимаксной фильтрации относится к классу алгоритмов нелинейной фильтрации.

4. Наметим путь решения сформулированных выше детерминированных задач оптимизации. Вектора линейно (в соответствии с уравнениями (9.119), (9.123)) зависят от неопределенных векторов которые аналогичны векторам управлений, ограниченных областями (9.112). Тогда, аналогично областям достижимости, рассмотренным в § 3.10, будет выпукла в и содержит начало координат область достижимости заполняемая векторами образованными из компонент векторов При этом

Границы области 9 можно найти методом проектирования градиентов, определяя для различных -мерных единичных векторов максимальное значение величины На области надо найти максимум по функции а затем провести минимизацию по Начало координат области будем называть ее «центром». Первые координат центра образуют вектор оставшиеся координат образуют вектор

Геометрически можно представить следующий процесс оптимизации. Пусть в проведены поверхности уровня функции поверхности, на которых Здесь Эти поверхности обозначим через Так как то При изменении величины с в указанных пределах семейство заполнит Поверхность содержит начало координат По одну сторону от лежат поверхности с по другую сторону — с При произвольных заданных векторах граница выпуклой области будет касаться некоторых поверхностей Положим Область коснется некоторых поверхностей семейства Задачу максимизации по функции решает та точка касания, которая принадлежит с наибольшей величиной с. Чтобы найти вектор минимизирующий величину надо, сохраняя менять тех пор, пока наибольшая величина с будет соответствовать не одной, а нескольким точкам касания. Найденный вектор решает задачу минимакса (по крайней мере в некоторой окрестности вектора вследствие гладкости функции небольшое изменение вектора z в произвольном направлении должно лишь увеличить наибольшую из величин с, соответствующих новым точкам касания.

5. Дальнейшую детализацию методики проведем в случае, когда минимаксный квадратичный критерий используется для вычисления оптимальной оценки лишь одной (например, наиболее «ответственной») компоненты вектора Пусть для определенности это будет первая компонента вектора оценка этой компоненты. Тогда в и в (9.126) функция

примет вид

где первые компоненты соответственно векторов первые элементы первой строки матриц Необходимо найти оценку величины оптимальную по минимаксному квадратичному критерию.

Для решения задачи минимакса надо вначале при фиксированных максимизировать функцию по величинам учитывая условие (9.112). Это условие означает, что допустимые точки с координатами должны принадлежать плоской области полученной сечением -мерной области соответствующей -мерной гиперплоскостью. После этого станет функцией величины Минимизируя по найдем функцией

Формулу (9.127) перепишем в следующем виде:

где

Линии уровня функции для представлены на рис. 9.3. Точки с координатами принадлежат области полученной из области аффинным преобразованием, в котором абсциссы точек делятся на а ординаты — на

Дальнейшие рассуждения нетрудно формализовать и провести синтез оптимальной оценки, не обращаясь к рис. 9.3. Однако для сокращения изложения определение проведем, используя геометрические соображения,

Для решения задачи мипимакса в плоскости абсциссу центра области сделаем равной а ординату будем менять так, чтобы выпуклая область коснулась двух линий уровня, соответствующих одинаковым величинам с (рис. 9.3).

Рис. 9.3. (см. скан)

В этот момент где некоторая функция, определяемая для любого значения аргумента описанным выше приближенным геометрическим построением. Учитывая приведенные формулы для получим выражение для оценки величины оптимальной по минимаксному среднеквадратичному критерию:

Формула (9.129) определяет нелинейный алгоритм минимаксной фильтрации, который состоит в том, что к величине получаемой из алгоритма ОРФ Калмана, добавляется некоторая величина, нелинейно зависящая от а значит — нелинейно зависящая от результатов наблюдений. Следует подчеркнуть, что функция

соответствующая области должна определяться заранее (до процесса оценивания) и заноситься в «память» БЦВМ. Если область следовательно, и область симметрична относительно луча то, как следует из рис. и оценка по минимаксному среднеквадратичному критерию совпадает с оценкой, выдаваемой алгоритмом ОРФ Калмана (4.94), (4.95).

Отметим также, что в статистической ситуации минимальная величина среднеквадратичного критерия точности оценивания — в рассматриваемом случае определяется равенством В статистически неопределенной ситуации величина получаемая при минимаксной среднеквадратичной фильтрации, имеет вид

где координаты одной из точек касайия линий уровня с одинаковыми величинами с, в системе координат, центр которой находится в центре области Величины некоторые функции определяемые попутно при нахождении функции Как видно, величина может быть найдена лишь приближенно при использовании соответствующих квадратурных формул.

Аналогичный выбор минимаксной среднеквадратичной оценки проводится для любой компоненты вектора если уметь определять — область достижимости, заполняемую точками с координатами и соответствующую ей функцию Построение подобных оценок для всех компонент вектора потребует -кратного определения областей Полученные оценки будут «слишком» гарантированными, так как при минимаксном выборе оценки каждой фазовой координаты используется свое наиболее неблагоприятное сочетание неопределенных факторов.

Отметим, что алгоритм минимаксной фильтрации существенно зависит от вида функции потерь, входящей в критерий точности. Так, пусть, например, где четная, неубывающая функция потерь. В статистической ситуации, как показано в § 4.6 п. 3, оптимальная оценка величины х не зависит от конкретного вида функции и является

соответствующей компонентой вектора условного м. о. вектора В статистически неопределенной ситуации задача определения минимакса заметно усложняется, так как вместо простого выражения (9.127) функция примет следующий существенно более сложный вид:

и оптимальная минимаксная оценка будет зависеть от конкретного вида функции

6. Рассмотрим подробнее приближенную методику определения двумерных областей Векторы входящие в (9.126), определяются, как следует из (9.119), (9.123), рекуррентными уравнениями

где обозначено

В формуле Для определения — области достижимости первых компонент векторов необходимо для различных величин найти величину

учитывая рекуррентные уравнения (9.130), (9.131). Величина является расстоянием от центра области до ее границы вдоль единичного вектора, наклоненного на угол к оси абсцисс. Определяя величину при изменении с некоторым шагом от 0 до приближенно найдем границы области Обозначим по заданным областям нетрудно построить — область, которой могут принадлежать неопределенные векторы Тогда задача определения границ области сводится к решению задачи синтеза оптимальных векторов начальны условий и управлений дискретной линейной

системы, которой удовлетворяют -мерные векторы

максимизирующих терминальный критерий (матрицы определяются из (9.130), Применяя правило дифференцирования сложной функции, нетрудно показать, что векторы градиентов функции по векторам определяются равенствами где -мерного вектора сопряженных переменных, определяемых уравнениями при начальном условии

Необходимое и достаточное условие оптимальности векторов имеет вид

где (оптимальные векторы и неподвижные точки преобразований, описываемых оператором проектирования). Так как выпуклые области, то точки границ областей в которых нормали к границам совпадают по направлениям с векторами — Если таких точек не существует для некоторых и данных (границы составлены из кусков некасающихся гиперповерхностей), то точки находятся в «вершинах» областей — точках, в которых «гладкие» куски границ областей пересекаются под «острыми» углами.

Для двумерных областей векторы и и находятся очевидным геометрическим построением. В более сложном случае эти векторы определяются итерационным процессом (подобным описываемому формулой (2.58)), организация которого облегчается из-за того, что векторы постоянны (не меняются при итерациях).

Задача приближенного определения областей достижимости делается более простой, если синтез оптимального дискретного управления приближенно заменить

синтезом оптимального непрерывного управления. Для этого от дискретизированной динамической системы, описываемой рекуррентным уравнением (9.110), перейдем к первоначальной непрерывной системе, определяемой дифференциальным уравнением

где вектор белых нормально распределенных шумов единичной интенсивности — неопределенный вектор-функция, матрицы соответствующей размерности.

Обычно система, возмущаемая случайными и неопределенными факторами, задается именно в виде (9.1332) с назпачепием областей существования

Если интервалы времени между дискретными измерениями невелики, то условное распределение вектора практически не изменится при замене дискретных измерений (9.111) непрерывными измерениями

где матрица совпадает с матрицами в моменты вектор белых нормально распределенных шумов с неособенной матрицей интенсивностей Матрица в моменты совпадает с векторов в (9.111), неопределенная вектор-функция, область существования которой

в моменты совпадает с областью

Неопредел енные вектор-функции действуют на непрерывную систему (9.1332), (9.135) примерно так же, как дискретные неопределенные векторы действуют на непрерывную систему (9.110), (9.111). После соответствующего предельного перехода [101 дискретные алгоритмы (4.78) перейдут в непрерывные алгоритмы

где

Входящий в (9.124) вектор определяется приближенным равенством а из (9.1332) и (9.137) следует, что дифференциальные уравнения для аналогичные рекуррентным уравнениям (9.119), (9.123), имеют вид

при начальных условиях Поэтому векторы удовлетворяют уравнению

при начальных условиях Для векторов могут быть найдены области существования зависящие от областей

Входящие в (9.126) величины векторов определяются равенствами Задача определения области сводится к выбору вектор-функций и векторов удовлетворяющих условиям (9.134), (9.136), (9.140), на которых достигает минимума терминальный критерий

В соответствии с принципом, максимума введем -мерный вектор сопряженных переменных удовлетворяющий уравнению

Пусть вектор-строка имеет вид где векторы размерности, соответственно, Тогда максимум гамильтониана

достигается на векторах доставляющих максимум величине при условиях (9.134), (9.136).

При конкретном задании областей определение соответствующих трудностей не вызывает. Так, если где то

Численно интегрируем от 0 до уравнение (9.139) при начальном условии и вектор-функциях совместно с уравнением (9.138), поставляющим матрицу для интегрирования (9.139). В результате найдем первые компоненты векторов возникающие при использовании оптимальных управлений и нулевых начальных условиях. Одновременно производится численное интегрирование однородных уравнений при векторах представляющих собой единичные орты в пространстве

В результате найдем фундаментальную матрицу уравнения строки которой обозначим через Векторы удовлетворяющие условиям (9.140), надо выбрать так, чтобы достигался максимум величины При конкретном задании областей определение соответствующих оптимальных векторов трудностей не вызывает. Величина максимальное значение определяемой (9.141), имеет вид

Величина является расстоянием от центра области 531 до ее границы вдоль направления, наклоненного на угол к оси абсцисс. Проведя описанную процедуру для различных величин найдем границу области Аналогично находятся границы областей что позволит полностью решить задачу минимаксной фильтрации по среднеквадратичному критерию для каждой из компонент вектора

7. Задача минимаксной фильтрации в статистически неопределенной ситуации имеет изложенное выше относительно простое решение из-за того, что фиксация векторов измерений не влияет на области существования, заданные условиями (9.112). Последнее же является следствием того, что максимизация подынтегральной функции в правой части (9.124) выбором векторов при зафиксированном векторе являющемся «носителем» векторов наблюдений, происходит без ограничения снизу на величину Другими словами, при выборе принадлежащих допускается сколь угодно малая плотность вероятностей вектора являющегося в данной реализации условным м. о. случайной компоненты вектора В принципе, можно ограничить возможности «природы», распоряжающейся «игрой» неопределенных векторов возмущений и ошибок измерений, и потребовать, чтобы эта плотность вероятностей была не меньше некоторой малой величины этом случае допустимые при синтезе минимаксной оценки неопределенные векторы исключают некоторые маловероятные ситуации, и полученная оценка будет гарантированной лишь с некоторой большой вероятностью. Для учета вышеизложенного надо при определении максимума функции использовать дополнительное условие:

После этого область допустимых векторов станет зависеть от вектора что исключит возможность решения задачи максимизации заранее (до конкретной реализации процесса оценивания).

При минимаксной оценке величины условие (9.144) примет вид:

Условие (9.145) переводит область в область , которая или совпадает с или уже ее вдоль оси Методика решения задачи минимакса не меняется: при фиксированной абсциссе центра области надо менять его ординату до тех пор, пока не коснется двух линий уровня функции которым соответствуют

наковые величины с. Однако эту операцию нельзя производить до процесса оценивания, так как форма области 32 зависит от величины в свою очередь зависящей от векторов измерений

Следует отметить, что рассмотренная в [33] задача минимаксной фильтрации в неопределенной ситуации требует учета влияния зафиксированных результатов измерений на область допустимых неопределенных возмущений и ошибок измерений, что заметно осложняет общее решение задачи. Приближенное решение этой задачи можно получить из изложенного выше, если сделать достаточно малыми дисперсии компонент случайных векторов. По-видимому возможен и предельный переход при стремлении этих дисперсий к нулю.

8. Упомянем класс задач минимаксной фильтрации, в которых для определения областей достижимости 9 (или областей неприменима изложенная выше методика. Пусть, например, заданы области существования не только неопределенных векторов в (9.1332), возмущающих динамическую систему, но и скоростей их изменения. Такая ситуация возникает при оценке параметров движения гироплатформы; ее дрейфы естественно считать неопределенными возмущениями, величина и скорость изменения которых ограничены. Дополним уравнение (9.139) уравнением где для вектора к задана область существования

Тогда при определении области достижимости в момент векторов удовлетворяющих (9.139), вектор следует считать вектором дополнительных фазовых координат, а к — вектором управления (наряду с вектором Максимизировать величину определяемую (9.141), следует при учете ограничений (9.136), (9.146) на векторы управлений и ограничения (9.134) на часть фазовых координат. Подобные задачи можно численно решать, используя метод штрафных функций или метод нахождения седловой точки функции Лагранжа.

9. Перед синтезом алгоритма нелинейной фильтрации, точно решающего задачу получения вектора минимаксных среднеквадратичных оценок, целесообразно найти дополнительные ошибки оценки, возникающие при использовании, например, алгоритма ОРФ (4.94), (4.95)

из-за наличия неопределенных векторов стесненных условиями (9.112). Векторы дополнительных ошибок оценки удовлетворяют рекуррентному уравнению (9.123). Если эти ошибки могут принимать недопустимые значения, то необходимо использовать алгоритм минимаксной фильтрации или перейти от алгоритма ОРФ к алгоритму КОРФ, менее чувствительному к наличию неопределенных факторов.

Пусть надо найти область достижимости — отрезок, внутри которого может находиться величина Эта задача решается по методике если ввести векторы связанные уравнением (9.133), при матрицах из уравнений (9.123), (9.119). Оптимальные и должны минимизировать терминальные критерии определяющие координаты левого и правого концов отрезка 521. Начальные (в момент векторы сопряженных переменных примут вид должны удовлетворять условиям (9.133).

Задачу приближенного определения координат концов отрезка проще решать, переходя к непрерывному времени. Вектор удовлетворяет уравнению (9.139), матрицы и В которого находятся из системы уравнений (9.138). Координаты концов отрезка найдем при минимизации оптимальными вектор-функциями и вектором удовлетворяющими условиям (9.134), (9.136), (9.140), терминальных критериев Явные выражения для нетрудно получить с помощью принципа максимума, если вместо (9.143) учесть, что

Аналогично определяются координаты концов отрезков областей достижимости, в которых могут оказаться величины

Опыт разработки алгоритмов КОРФ для конкретных условий показывает, что области заметно уменьшаются, если периодически «обновлять» матрицы заменять в процессе оценивания с некоторой рациональной частотой на априорную к. и алгоритм (4.95) периодически использовать при новых начальных условиях.

<< Предыдущий параграф

Следующий параграф >>

Оглавление