которое может быть доказано путем дифференцирования единичной матрицы получим
где точка обозначает дифференцирование по Так как является переходной матрицей для (3.99), имеем
Подставляя эти выражения в (3.115), получим после перегруппировки следующее дифференциальное уравнение:
Граничное условие для этого дифференциального уравнения определяется путем подстановки в (3.98). Отсюда следует
Матричное дифференциальное уравнение, полученное таким образом, подобно хорошо известному уравнению
где х — независимая, у — зависимая переменные, а — известцые функции х. Это уравнение называется уравнением Риккати [44]. По аналогии будем называть уравнение (3.117) матричным уравнением Риккати [86].
Отметим, что, поскольку матрица являющаяся конечным условием для симметрична и матричное дифференциальное уравнение для также симметрично, решение для должно быть симметричным для всех Эта симметрия будет часто использоваться, особенно при вычислении Р.
Дадим интерпретацию матрицы Оптимальная замкнутая
система описывается дифференциальным уравнением состояния
Рассмотрим в связи с этим критерий оптимальности (3.65), вычисляемый на интервале Напишем
так как
На основе результатов разд. 1.11.5 (теорема 1.54) выражение (3.121) можно записать в виде
где — решение матричного дифференциального уравнения
с
Подставляя в (3.124), получим
Можно утверждать, что решение этого матричного дифференциального уравнения в точности равно
Это легко показать, так как при подстановке в выражение для дифференциальное уравнение (3.125) сводится к виду
Это уравнение является матричным уравнением Риккати (3.117), которое удовлетворяется подстановкой кроме того, конечпое условие корректно. Этот вывод также показывает, что матрица должна быть неотрицательно определенной, так как выражение (3.121) является неотрицательным, поскольку матрицы — неотрицательно определенные.
Сформулируем выводы в следующем виде.
Теорема 3.4. Оптимальная входная переменная в детерминированном оптимальном линейном регуляторе задается линейным законом управления
где
Тогда существует симметрическая неотрицательно определенная матрица удовлетворяющая матричному уравнению Риккати
с конечным условием
и где
Для оптимального решения имеем соотношение
Видно, что матрица позволяет не только найти оптимальный закон управления с обратной связью, но и оценить величину критерия для любых заданных начального состояния и начального момента времени.
Из выводов этого раздела рассмотрим следующий результат который будет полезен при решении задачи, построения стохастического линейного оптимального регулятора и задачи оптимального наблюдения.
Лемма 3.1. Рассмотрим матричное дифференциальное уравнение
с конечным условием
где — заданные переменные во времени матрицы соответствующей размерности, причем — неотрицательно определенная матрица, — положительно определенная матрица при — неотрицательно определенная матрица. Пусть — произвольная непрерывная матричная функция при Тогда для
где — решение матричного уравнения Риккати
имеем
Неравенство (3.135) преобразуется в равенство, если
Лемма предполагает, что «минимизируется» в соответствии с (3.135), если выбрать функцию как указано в (3.138). Доказательство является песложным. Выражение
представляет собой критерий (3.121), если система управляется с помощью линейного закона
Оптимальный закон управления, который является линейным и, как следствие, наилучшим линейным законом управления, дает величину критерия, равную (теорема 3.4), так что
Это и требовалось доказать.
Рис. 3.7. Поведение в задаче стабилизации угловой скорости при различных значениях
Закончим этот раздел замечанием о существовании решения задачи синтеза регулятора. Можно показать, что при условиях, сформулированных в определении 3.2, задача построения детерминированного линейного оптимального регулятора имеет единственное решение. Существование решения задачи также гарантирует 1) существование обратной матрицы в выражении (3.98) и 2) единственность решения (3.98) матричного уравнения Рйккати (3.130) с копечпым условием (3.131). Вопросы существования решения задачи и решения уравнения Риккати рассмотрены в работах Калмапа [86], Атанса и Фалба [8], Вонхэма [185], а также в работах [26, 29, 91, 129, 158].
Пример 3.6. Стабилизация угловой скорости
Продолжим рассмотрение примера 3.5. Здесь является скалярной функцией, удовлетворяющей скалярному уравнению Риккати
с конечным условием
В этом скалярном случае уравнение Риккати (3.142) может быть решено непосредственно. Однако с учетом результатов, полученных примере 3.5, целесообразнее использовать соотношение (3.98). Поэтому напишем
где определяется таким же образом, как в примере 3.5. На рис. 3.7 показано изменение для некоторых рассмотренных ранее