Стохастическая оптимальная линейная система при полной информации о состоянии.
Пусть объект описывается уравнением
и задан критерий оптимальности
Здесь — известная функция; — последовательность некоррелированных случайных величин с нулевым средним и дисперсионной матрицей матрицы симметричны, причем . Шум не коррелирован с начальным значением Требуется найти оптимальное управление с обратной связью, т. е. управление, доставляющее минимум функционалу (10.274) при произвольном начальном состоянии объекта. Принимается, что фазовый вектор известен без ошибки. Эта задача является стохастическим аналогом детерминированной задачи (10.258)-(10.259) и отличается от нее тем, что объект подвержен случайному воздействию и критерий оптимальности представляет математическое ожидание от функционала, совпадающего с критерием оптимальности в детерминированной задаче. Как и в непрерывном случае, ее решение совпадает с решением детерминированного аналога, т. е. стохастическое оптимальное управление определяется соотношениями (10.260)-(10.265) или в частном случае, когда соотношениями (10.266), (10.261)-(10.263). Вывод основывается на методе динамического программирования.
Функция Беллмана в данном случае определяется следующим образом
Уравнение Беллмана принимает вид (для краткости опускается аргумент i)
или
Решение последнего уравнения ищется в виде «трехчлена» (10.269). Далее, проделав те же выкладки, что и в детерминированном случае, можно получить искомые соотношения для оптимального управления