Стохастическая оптимальная линейная система при полной информации о состоянии.
Пусть объект описывается уравнением
и задан критерий оптимальности
Здесь
— известная функция;
— последовательность некоррелированных случайных величин с нулевым средним и дисперсионной матрицей
матрицы
симметричны, причем
. Шум
не коррелирован с начальным значением
Требуется найти оптимальное управление с обратной связью, т. е. управление, доставляющее минимум функционалу (10.274) при произвольном начальном состоянии объекта. Принимается, что фазовый вектор
известен без ошибки. Эта задача является стохастическим аналогом детерминированной задачи (10.258)-(10.259) и отличается от нее тем, что объект подвержен случайному воздействию и критерий оптимальности представляет математическое ожидание от функционала, совпадающего с критерием оптимальности в детерминированной задаче. Как и в непрерывном случае, ее решение совпадает с решением детерминированного аналога, т. е. стохастическое оптимальное управление определяется соотношениями (10.260)-(10.265) или в частном случае, когда
соотношениями (10.266), (10.261)-(10.263). Вывод основывается на методе динамического программирования.
Функция Беллмана в данном случае определяется следующим образом
Уравнение Беллмана принимает вид (для краткости опускается аргумент i)
или
Решение последнего уравнения ищется в виде «трехчлена» (10.269). Далее, проделав те же выкладки, что и в детерминированном случае, можно получить искомые соотношения для оптимального управления