Синтез стохастической оптимальной линейной системы при полной информации о состоянии
Рассмотрим стохастическую задачу оптимального управления при линейном объекте, квадратичном критерии и полной информации о состоянии системы:
Здесь — белый шум с характеристиками
— случайная величина с характеристиками
F, Q — неотрицательно-определенные симметричные матрицы; R - положительно-определенная симметричная матрица.
Задача заключается в определении оптимального закона управления. Критерий оптимальности (10.176) имеет такой же смысл, что и критерий оптимальности (10.121) в детерминированной задаче оптимального управления. Здесь только производится усреднение по всем случайным факторам.
Решение этой задачи совпадает с решением (10.138), (10.123), (10.125) детерминированной задачи (10.120), (10.121) при
Оптимальное управление
где симметричная матрица К определяется из матричного уравнения Риккати
при граничном условии
Таким образом, случайное воздействие и случайное начальное условие на оптимальный закон управления не влияют. Они сказываются только на значении критерия оптимальности: оно, естественно, увеличивается. При оптимальном управлении критерий оптимальности (10.176) принимает следующее значение:
Для получения решения (10.179)-(10.181) воспользуемся методом динамического программирования. Уравнения (10.171) в данном случае принимают вид
Из второго уравнения полученной системы
Подставив это выражение в первое уравнение, получим
Будем искать решение этого уравнения в виде квадратичной формы:
где симметричная матрица, — скалярная функция. Подставив ее, получим
откуда
Граничное условие (10.170) принимает вид
поэтому
Подставив выражение для S в (10.183), получим оптимальный закон управления (10.179). Осталось получить (10.182). Из определения функции Беллмана следует, что
Вычислим математическое ожидание от квадратичной формы:
Как легко проверить непосредственным вычислением, если а и b являются произвольными векторами (столбцами) одного и того же размера, то
Используя это соотношение, окончательно получаем
Для второго слагаемого правой части (10.186) из уравнения (10.184) с учетом граничного условия (10.185) имеем
поэтому действительно из (10.186) получаем (10.182).