§ 1.4. Основные леммы
Чтобы добиться замкнутости изложения и избежать ссылки на стохастический принцип оптимальности Веллмана, намеченный в [51 и названный автором «интуитивным» [5, стр. 105, 108], вывод рекуррентных уравнений оптимизации дискретного стохастического управления с обратной связью будем основывать на двух простых леммах.
Лемма 1.1. Обозначим
где положительные функции, некоторый вектор. Тогда, если то
Действительно, пусть достигаются соответственно при Тогда справедливость леммы сразу следует из неравенства
(см. скан)
где по условию.
Лемма 1.2. Пусть функционал от функций определяется формулой
(см. скан)
где - положительные функции. Тогда минимум достигается на функциях определяемых рекуррентными уравнениями
(см. скан)
причем
(см. скан)
Обозначив через минимум получим, что при первым в цепочке рекуррентных равенств должно быть равенство
Лемма доказана.