2. Задача с закрепленным концом траектории и свободным временем.
Управляемую систему, описываемую дифференциальными уравнениями
(14.22)
которым эквивалентно векторное уравнение
(14.23)
где
и
— векторы следующего вида:
требуется перевести из точки
фазового пространства X в заданную точку
. Момент времени
, в который изображающая точка попадет в точку
, заранее не фиксируется. Управление
должно удовлетворять ограничениям
(14.24)
и его надо выбрать так, чтобы функционал
(14.25)
принимал наименьшее возможное значение.
Удовлетворяющее этим условиям управление, соответствующую ему траекторию и промежуток времени
будем считать оптимальными.
Полученное при указанных выше условиях наименьшее возможное значение
функционала Q будет функцией от начального состояния
системы
В предположении, что функция Ф непрерывна и всюду имеет непрерывные частные производные по всем своим аргументам, можно получить уравнение в частных производных (уравнение Беллмана), которому эта функция удовлетворяет.
По определению
(14.27)
Интеграл в правой части (27) можно представить в виде
(14.28)
Для малых значений
выражение (28) можно переписать так:
(14.29)
где предполагается, что функция
непрерывна на полуинтервале
. Выражение (27) принимает вид
(14.30)
Необходимость знака
перед всей квадратной скобкой в (30) обосновывается теми же рассуждениями, которые были изложены при выводе соотношения (12).
Второе слагаемое в квадратных скобках в выражении (30) есть
, и выражение (30) можно переписать так:
(14.31)
Поскольку согласно (23)
(14.32)
то, при сделанном выше предположении относительно гладкости функции
, будем иметь
(14.33)
Подставим теперь выражение (33) в (31). Учитывая, что функция
, полученная в результате минимизации функционала (25), уже не содержит а, можно вынести
за знак
в выражении (31). Тогда получим
(14.34)
В качестве начального состояния можно принять любое текущее состояние
и переписать соответственно соотношение (34)
(14.35)
Поскольку
, то, переходя в (35) к пределу при
, получим
(14.36)
Уравнение (36) и является уравнением Беллмана в рассматриваемой здесь задаче с закрепленным концом траектории и свободным временем.