Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
Синтез стохастических оптимальных систем управления при неполной информацииИзмерение (наблюдение), как правило, всегда сопровождается помехами, и состояние системы никогда точно не известно, поэтому более практичной является стохастическая задача оптимального управления при неполной информации о состоянии системы. Эта задача намного сложнее, и для ее решения часто используют эвристический прием (метод разделения), при котором стохастическая задача синтеза при неполной информации разделяется на две задачи: задачу оптимальной оценки состояния и детерминированную задачу синтеза или стохастическую задачу синтеза при полной информации. В общем случае система, синтезированная таким приемом, не обязательно является оптимальной. Но возможно, что, как, например, при линейных уравнениях объекта и наблюдения и среднеквадратичном критерии, метод разделения позволяет синтезировать оптимальную систему управления. Таким образом, со стохастической задачей оптимального управления тесно связана задача оптимальной оценки. Перейдем к рассмотрению этой задачи. Наблюдатель (оцеииватель, фильтр) Калмана-Бьюси.Рассмотрим следующую задачу оптимального оценивания (восстановления). Пусть объект и наблюдение описываются уравнениями
где
Случайные процессы и
Условие Ее решение, т. е. несмещенная оптимальная оценка
где матрица коэффициентов усиления
В (10.193) Р является дисперсионной матрицей ошибки
Если шумы объекта и наблюдения не коррелированы
Рис. 10.7 Несингулярная задача оценивания (10.189)-(10.191) при некоррелированных шумах впервые была решена Р. Калманом и Р. Бьюси. Ее решение, представляющее собой оптимальный наблюдатель, называется наблюдателем (оценивателем) или чаще фильтром Калмана—Бьюси. Заметим, что Р. Калман и Р. Бьюси рассмотрели случай, когда Сравнивая уравнения объекта (10.189) и оптимального наблюдателя (10.192), замечаем, что их правые части отличаются только последними слагаемыми: в уравнении наблюдателя вместо шума объекта появляется слагаемое, пропорциональное разности Соотношения (10.192)-(10.195) определяют также решение задачи линейного оптимального оценивания, которая отличается от задачи оптимального оценивания (10.189)- (10.191) тем, что: а) о законах распределения шумов и начального состояния никаких предположений не делается (не требуется, чтобы они были гауссовскими); б) нужно найти линейный оптимальный наблюдатель, т. е. оптимальный наблюдатель в классе линейных систем. Другими словами, если шумы вообще говоря, только среди линейных наблюдателей (систем). Покажем, что наблюдатель Калмана—Бьюси является линейным оптимальным наблюдателем. Достаточно доказать, что оценка, определяемая наблюдателем Калмана—Бьюси, минимизирует функционал
при произвольном
которые получаются из (10.196) при соответствующем выборе вектора а, и соответственно сумму
представляющую средний квадрат ошибки оценивания (10.191). Сначала примем
Найдем весовую функцию и Подставим в (10.197) выражение для
Введем векторную переменную х, определяемую уравнением
при граничном условии
Очевидно,
Так как в силу уравнений (10.188) и (10.199) (напомним, что рассматривается случай
то
Вычитая из этого соотношения (10.198), получим
откуда
Из последнего равенства следует, что при
оценка
Используя (10.201), получим
Кроме того,
Поэтому
Преобразуем подынтегральное выражение следующим образом:
Введя обозначение
выражение для 7 можно представить в виде
Уравнение (10.199) преобразуется к виду
где
Если положить
и ввести новую независимую переменную
Таким образом, задача линейного оптимального оценивания свелась к задаче оптимального управления (10.204), где нужно найти «управление»
Используя решение задачи (10.120), (10.121) при
где Р определяется из уравнения [см. (10.123), (10.125)]
Возвращаясь к независимой переменной
Принимая во внимание обозначения (10.202) и (10.203), получаем:
Итак, установлено, что соотношение (10.197) определяет несмещенную оптимальную оценку
Пусть
при единичном начальном условии
Тогда (см. § 8.2) решение уравнения
Из (10.205) и (10.209) имеем
При подстановке этого выражения и выражения (10.210) соотношение (10.197) при
откуда следует, что оценка
является несмещенно и доставляет минимум (10.196) при любом а. Продифференцируем (10.211) и, используя (10.208), получим
или, принимая во внимание (10.211),
Из (10.211) при Итак, для случая и Перейдем к случаю
Вектор наблюдения также представим в виде двух составляющих:
Составляющие Составляющая
Таким образом, задача оптимальной оценки при Для линейной оптимальной оценки
где Очевидно, оптимальная оценка
Продифференцировав это выражение, получим
или, принимая во внимание равенство
На этом заканчивается доказательство, что наблюдатель Калмана—Бьюси, определяемый соотношением Пример 10.24. Рассмотрим задачу определения оптимальной оценки скалярной постоянной величины х по измерениям До начала измерения известны следующие характеристики
Искомая величина и шум независимы. Учитывая уравнение
и наблюдатель Калмана — Бьюси описывается уравнением
где
Как легко проверить,
Заметим, что хотя х — константа, ее оценка х является функцией времени: с течением времени оценка уточняется и при
Дисперсионное уравнение. Покажем, что матрица Р, определяемая из уравнения (10.194), является дисперсионной матрицей ошибок для оценки, получаемой наблюдателем Калмана—Бьюси. С этой целью сначала получим уравнение для дисперсионной матрицы стохастического процесса
где Пусть
Так как, очевидно,
то для центрированного процесса
Используя это выражение, для корреляционной матрицы
Дисперсионная матрица
Используя тождества
Это соотношение потребуется в дальнейшем при доказательстве принципа разделения. Из (10.215) путем дифференцирования получаем следующее уравнение для дисперсионной матрицы (дисперсионное уравнение):
Из (10.215) также имеем
Теперь получим уравнение для дисперсионной матрицы ошибки. Вычитая (10.192) из (10.189), получаем уравнение для ошибки
Начальное значение
Оно не коррелировано с шумами. Уравнение (10.219) получается из (10.212) при
Получим выражение для интенсивности шума
откуда
Дисперсионное уравнение (10.217) в этом случае принимает вид
Если предположить, что дисперсионная матрица оценки Риккати в наблюдателе Калмана—Бьюси, является дисперсионной матрицей ошибки.
|
1 |
Оглавление
|