Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше
Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике
Стохастическая линейная оптимальная система управления при неполной информации. Принцип разделимости
Рассмотрим задачу синтеза стохастичёской линейной оптимальной системы управления при неполной информации о состоянии. Пусть объект и наблюдение описываются уравнениями
критерий оптимальности имеет вид
Шумы являются белыми с интенсивностями соответственно; начальное состояние — случайный вектор со средним значением и матрицей дисперсий Шумы и начальное состояние не коррелированы между собой. Матрицы положительно определены. Задача состоит в определении такой функции (функционала)
при которой критерий оптимальности принимает минимальное значение.
Решение этой задачи, т. е. оптимальный закон управления, имеет вид
где К — матрица, определяемая из уравнения
линейная оптимальная оценка, получаемая наблюдателем (фильтром) Калмана—Бьюси:
Соотношения (10.246), (10.247) совпадают с соотношениями (10.138), (10.123), (10.125) и (10.179)-(10.181), определяющими оптимальный регулятор в детерминированной задаче синтеза оптимальных систем и задаче синтеза стохастических линейных оптимальных систем управления с полной информацией, с той лишь разницей, что в (10.246) входит оценка х, а в (10.138) и (10.179) — сам вектор х. Таким образом, стохастический линейный оптимальный регулятор состоит из линейного оптимального наблюдателя и детерминированного оптимального регулятора (рис. 10.10). Этот результат известен как принцип разделения [101 или принцип стохастической эквивалентности [51. В соответствии с этим принципом задача синтеза стохастической линейной оптимальной системы управления
Рис. 10.10
при неполной информации о состоянии разбивается на две: задачу синтеза линейного оптимального наблюдателя и детерминированную задачу синтеза оптимальной системы. Если шумы и начальное состояние подчиняется гауссовскому закону распределения, то соотношения (10.246)-(10.248) определяют стохастический оптимальный регулятор, т. е. регулятор, оптимальный в классе всех систем, а не только линейных.
Для доказательства принципа разделения сначала покажем, что ошибка и оценка х не коррелированы. Уравнение для оценки из (10.248), используя (10.246) и (10.244), можно преобразовать к виду
Это уравнение совместно с уравнением (10.219) для ошибки можно представить в виде
где
Дисперсионное уравнение (10.217) в данном случае принимает вид
где
Представим матрицу Q в виде
где дисперсионная матрица ошибки взаимная корреляционная матрица ошибки и оценки.
Из уравнения (10.249) нетрудно получить
В силу равенств последние два слагаемых в правой части сокращаются, поэтому уравнение для является линейным и однородным. И так как то оно имеет единственное решение Это и доказывает, что ошибка и оценка не коррелированы.
Преобразуем критерий оптимальности (10.245). Используя (10.187), получаем
поэтому
и критерий оптимальности (10.245) можно преобразовать к виду
Последние два слагаемых в этом выражении не зависят от управления. Таким образом, исходная задача свелась к следующей стохастической задаче линейного оптимального управления с полной информацией:
Решение этой задачи, как это следует из решения (10.179), (10.180) задачи (10.175), (10.176), определяется соотношениями (10.246) и (10.247), если слагаемое или его сомножитель является белым шумом. Невязка будет белым шумом, если интеграл от нее, т. е. стохастический процесс определяемый уравнением
является процессом с независимыми приращениями. Чтобы доказать это, рассмотрим совместно процессы Подставив выражение у, последнее уравнение можно преобразовать к виду Это уравнение совместно с уравнением (10.219) для ошибки можно записать в виде где в данном случае
Дисперсионное уравнение для рассматриваемого процесса имеет вид [см. (10.217), (10.218), (10.250)]
Представим матрицу Q в виде
где — матрица дисперсии — дисперсионная матрица ошибки . Из дифференциального уравнения для Q имеем:
В силу равенств второе уравнение является однородным, поэтому оно имеет единственное нулевое решение: Уравнение для принимает вид
откуда
Для корреляционной матрицы имеем [см. (10.216)]
где — фундаментальная матрица уравнения
или
Представим фундаментальную матрицу в виде
Тогда решение (10.254) примет вид
С другой стороны, из уравнений
имеем
где фундаментальная матрица первого уравнения системы (10.255). Следовательно, фундаментальную матрицу системы (10.253) можно записать в виде
Представим корреляционную матрицу в виде
где — корреляционная матрица для
Используя (10.251)-(10.253) и (10.256), из (10.253) получаем
откуда следует, что процесс является процессом с независимым приращением [16].