Синтез стохастических оптимальных систем управления при неполной информации

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

Синтез стохастических оптимальных систем управления при неполной информации

Измерение (наблюдение), как правило, всегда сопровождается помехами, и состояние системы никогда точно не известно, поэтому более практичной является стохастическая задача оптимального управления при неполной информации о состоянии системы. Эта задача намного сложнее, и для ее решения часто используют эвристический прием (метод разделения), при котором стохастическая задача синтеза при неполной информации разделяется на две задачи: задачу оптимальной оценки состояния и детерминированную задачу синтеза или стохастическую задачу синтеза при полной информации. В общем случае система, синтезированная таким приемом, не обязательно является оптимальной. Но возможно, что, как, например, при линейных уравнениях объекта и наблюдения и среднеквадратичном критерии, метод разделения позволяет синтезировать оптимальную систему управления. Таким образом, со стохастической задачей оптимального управления тесно связана задача оптимальной оценки. Перейдем к рассмотрению этой задачи.

Наблюдатель (оцеииватель, фильтр) Калмана-Бьюси.

Рассмотрим следующую задачу оптимального оценивания (восстановления). Пусть объект и наблюдение описываются уравнениями

где — гауссовские белые шумы с характеристиками

гауссовская случайная величина с характеристиками

— неотрицательно-определенные симметричные матрицы — положительно-определенная симметричная матрица

Случайные процессы и называются соответственно шумом объекта и шумом наблюдения или измерения. Они не коррелированы со случайной величиной Требуется, используя измеренные значения выходной переменной на интервале найти несмещенную оценку обеспечивающую минимум среднего квадрата ошибки:

Условие т. е. условие положительной определенности матрицы интенсивности шума наблюдения, означает, что ни одна компонента выходной переменной не измеряется точно. В этом случае задача оценивания называется несингулярной [10]. Таким образом, задача (10.189)-(10.191) является несингулярной задачей оценивания (фильтрации).

Ее решение, т. е. несмещенная оптимальная оценка определяется из уравнения

где матрица коэффициентов усиления

В (10.193) Р является дисперсионной матрицей ошибки и находится из так называемого дисперсионного уравнения:

Если шумы объекта и наблюдения не коррелированы то из (10.193) и (10.194) получаем

Рис. 10.7

Несингулярная задача оценивания (10.189)-(10.191) при некоррелированных шумах впервые была решена Р. Калманом и Р. Бьюси. Ее решение, представляющее собой оптимальный наблюдатель, называется наблюдателем (оценивателем) или чаще фильтром Калмана—Бьюси. Заметим, что Р. Калман и Р. Бьюси рассмотрели случай, когда

Сравнивая уравнения объекта (10.189) и оптимального наблюдателя (10.192), замечаем, что их правые части отличаются только последними слагаемыми: в уравнении наблюдателя вместо шума объекта появляется слагаемое, пропорциональное разности Эта разность между измеренным текущим значением выходной переменной и его оценкой называется невязкой. Структурная схема наблюдателя Калмана—Бьюси (рис. 10.7, а) включает в себя как составную часть модель исходной системы (рис. 10.7, б). Ее отличие от заданной системы состоит только в том, что она имеет дополнительно обратную связь по невязке. Интересно отметить, что наблюдатель Калмана—Бьюси имеет такую же структуру, что и наблюдатель полного порядка в детерминированном случае (см. рис 10.3)

Соотношения (10.192)-(10.195) определяют также решение задачи линейного оптимального оценивания, которая отличается от задачи оптимального оценивания (10.189)- (10.191) тем, что: а) о законах распределения шумов и начального состояния никаких предположений не делается (не требуется, чтобы они были гауссовскими); б) нужно найти линейный оптимальный наблюдатель, т. е. оптимальный наблюдатель в классе линейных систем. Другими словами, если шумы и и начальное состояние не являются гауссовскими, то наблюдатель Калмана — Бьюси является оптимальным,

вообще говоря, только среди линейных наблюдателей (систем).

Покажем, что наблюдатель Калмана—Бьюси является линейным оптимальным наблюдателем. Достаточно доказать, что оценка, определяемая наблюдателем Калмана—Бьюси, минимизирует функционал

при произвольном -векторе а. Действительно, если оценка минимизирует функционал (10.196) при произвольном а, то она, очевидно, минимизирует функционалы

которые получаются из (10.196) при соответствующем выборе вектора а, и соответственно сумму

представляющую средний квадрат ошибки оценивания (10.191).

Сначала примем Воспользуемся схемой доказательства, основанной на преобразовании задачи линейного оптимального оценивания к задаче оптимального управления [16]. Так как отыскивается линейный оптимальный наблюдатель, то линейная комбинация как и сама оценка представляет собой линейный функционал от функции которая является входным воздействием искомого наблюдателя:

Найдем весовую функцию и и постоянный вектор при которых оценка определяемая последним соотношением, является несмещенной и оптимальной в смысле минимума критерия (10.196).

Подставим в (10.197) выражение для из (10.190):

Введем векторную переменную х, определяемую уравнением

при граничном условии

Очевидно,

Так как в силу уравнений (10.188) и (10.199) (напомним, что рассматривается случай

то

Вычитая из этого соотношения (10.198), получим

откуда

Из последнего равенства следует, что при

оценка линейной комбинации определяемая соотношением (10.197), будет несмещенной при всех а и Из него также следует, что

Используя (10.201), получим

Кроме того,

Поэтому

Преобразуем подынтегральное выражение следующим образом:

Введя обозначение

выражение для 7 можно представить в виде

Уравнение (10.199) преобразуется к виду

где

Если положить

и ввести новую независимую переменную уравнение и граничное условие для х и выражение для преобразуются к виду

Таким образом, задача линейного оптимального оценивания свелась к задаче оптимального управления (10.204), где нужно найти «управление» минимизирующее критерий . Задача (10.204) эквивалентна задаче оптимального управления (10.120), (10.121) при причем между матрицами, входящими в условия этих задач, имеется следующее соответствие:

Используя решение задачи (10.120), (10.121) при получим [см. (10.138)]

где Р определяется из уравнения [см. (10.123), (10.125)]

Возвращаясь к независимой переменной полученное соотношение можно записать следующим образом (заметим, что

Принимая во внимание обозначения (10.202) и (10.203), получаем:

Итак, установлено, что соотношение (10.197) определяет несмещенную оптимальную оценку если весовая функция удовлетворяет (10.205), (10.206), а постоянный вектор b — условию (10.201). Выражение для из (10.205) и уравнение (10.206) совпадают с (10.193) и (10.194) соответственно. Следовательно, остается доказать, что оценка, определяемая из соотношения (10.197), после подстановки в него весовой функции и из (10.205) удовлетворяет уравнению . Подставив выражение для и из (10.205) в (10.199), получим

Пусть — решение матричного уравнения

при единичном начальном условии

Тогда (см. § 8.2) решение уравнения и в силу (10.200) и (10.201)

Из (10.205) и (10.209) имеем

При подстановке этого выражения и выражения (10.210) соотношение (10.197) при преобразуется к виду

откуда следует, что оценка

является несмещенно и доставляет минимум (10.196) при любом а. Продифференцируем (10.211) и, используя (10.208), получим

или, принимая во внимание (10.211),

Из (10.211) при получаем

Итак, для случая и показали, что наблюдатель Калмана—Бьюси действительно является линейным оптимальным наблюдателем.

Перейдем к случаю . Представим фазовый вектор в виде суммы [9]: , где слагаемые удовлетворяют уравнениям

Вектор наблюдения также представим в виде двух составляющих: где

Составляющие однозначно определяются из уравнений.

Составляющая легко определяется по измерениям

Таким образом, задача оптимальной оценки при свелась к оценке по — задаче оптимальной оценки при и

Для линейной оптимальной оценки имеем [см. (10.192)]

где определяется из (10.193)-(10.195).

Очевидно, оптимальная оценка равна сумме:

Продифференцировав это выражение, получим

или, принимая во внимание равенство

На этом заканчивается доказательство, что наблюдатель Калмана—Бьюси, определяемый соотношением является линейным оптимальным наблюдателем.

Пример 10.24. Рассмотрим задачу определения оптимальной оценки скалярной постоянной величины х по измерениям где — белый шум с интенсивностью

До начала измерения известны следующие характеристики

Искомая величина и шум независимы. Учитывая уравнение рассматриваемую задачу можно сформулировать как задачу линейной оптимальной оценки. В данном случае

и наблюдатель Калмана — Бьюси описывается уравнением

где определяется из уравнения

Как легко проверить,

Заметим, что хотя х — константа, ее оценка х является функцией времени: с течением времени оценка уточняется и при стремится к х. Это следует из того, что дисперсия ошибки при стремится к нулю:

Дисперсионное уравнение. Покажем, что матрица Р, определяемая из уравнения (10.194), является дисперсионной матрицей ошибок для оценки, получаемой наблюдателем Калмана—Бьюси. С этой целью сначала получим уравнение для дисперсионной матрицы стохастического процесса описываемого уравнением

где детерминированная функция; белый шум с интенсивностью случайный вектор с математическим ожиданием и матрицей дисперсий не коррелированы.

Пусть — нормированная фундаментальная матрица. Тогда

Так как, очевидно,

то для центрированного процесса имеем

Используя это выражение, для корреляционной матрицы получаем

Дисперсионная матрица

Используя тождества при при и выражение (10.125) для соотношение (10.214) для корреляционной матрицы можно преобразовать к виду

Это соотношение потребуется в дальнейшем при доказательстве принципа разделения. Из (10.215) путем дифференцирования получаем следующее уравнение для дисперсионной матрицы (дисперсионное уравнение):

Из (10.215) также имеем

Теперь получим уравнение для дисперсионной матрицы ошибки. Вычитая (10.192) из (10.189), получаем уравнение для ошибки

Начальное значение имеет следующие характеристики:

Оно не коррелировано с шумами. Уравнение (10.219) получается из (10.212) при

Получим выражение для интенсивности шума

откуда

Дисперсионное уравнение (10.217) в этом случае принимает вид

Если предположить, что дисперсионная матрица оценки и подставить выражение для из (10.193), то последнее уравнение преобразуется к виду (10.194). Следовательно, действительно матрица Р, определяемая из матричного уравнения

Риккати в наблюдателе Калмана—Бьюси, является дисперсионной матрицей ошибки.

<< Предыдущий параграф

Следующий параграф >>

Оглавление