Рис. XX.4. Функция оптимального управления для стационарных систем со сдвигом во времени
Рис. XX. 5. Иллюстрация свойств оптимального управления
значение
Из перечисленных свойств следует, что всякий отрезок оптимальной траектории (аналогично для оптимального управления) является также оптимальной траекторией.
Предположим, что
является оптимальным управлением, переводящим фазовую точку из положения
в положение
а соответствующее этому управлению
является оптимальной траекторией. Пусть значения функционала (XX.4) на отрезках оптимальной траектории при
соответственно равны
(рис. XX.5). В этом случае при управлении
функционал (XX.4) принимает значение
Предположим, что управление
на отрезке
не оптимально; тогда существует управление
которое переводит фазовую точку из положения
в положение
и при этом функционал (XX.4) имеет значение
Отсюда следует, что существует новое управление, переводящее фазовую точку из положения
в положение
и придающее функционалу (XX.4) значение
Это противоречит первоначальному условию, что
на отрезке
оптимально.
Решение поставленной задачи дает теорема — принцип максимума Л. С. Понтрягина, доказательство которой приводится в работе [58]. Прежде чем сформулировать эту теорему, рассмотрим, кроме основной системы дифференциальных уравнений (XX.6), системы уравнений относительно дополнительных переменных
Если на всем отрезке
определены управление
и траектория
то система (XX.7) в силу линейности и однородности допускает единственное решение
при любых начальных условиях для
Решением системы (XX.7) являются непрерывные функции
имеющие всюду непрерывные производные по
кроме конечного числа точек, где имеет место разрыв управления
Системы уравнений (XX.6) и (XX.7) объединяются одной записью при введении функции
переменных
называемой гамильтонианом.
Легко проверить, что системы уравнений (XX.6) и (XX.7) с помощью функции
объединяются в одну гамильтонову систему:
где
Принцип максимума дает необходимые условия оптимальности, поэтому если некоторая траектория удовлетворяет принципу максимума, то это, вообще говоря, еще не значит, что найдено оптимальное решение. В ряде случаев выделение оптимальных решений требует дополнительных условий.
Из всех фазовых траекторий (решений), начинающихся в точке
и заканчивающихся в точке
принцип максимума позволяет выделить отдельные траектории, которые удовлетворяют условиям
В формулировке принципа максимума имеется
неизвестных функций:
Следовательно, для решения задачи нужно иметь
начальных значений для решения системы дифференциальных уравнений (XX.9), (XX. 10) и дополнительных соотношений для определения
.
Рассмотрим равенство (XX. 12). Очевидно, что из него получается
соотношений между неизвестными функциями.
Действительно, если точка
является внутренней точкой области
то для выполнения условия (XX. 12) необходимо обращение в нуль
частных производных:
Если точка
лежит на
-мерной грани области
то должно выполняться условие принадлежности точки
этой грани, что дает одно соотношение, и должны обращаться в нуль частные производные
по всем направлениям в этой грани, т. е. еще будет
соотношений. Аналогично будет и для области с меньшим числом граней. Таким образом, из условий (XX.9), (XX. 10), (XX. 12), (XX. 13) все неизвестные функции могут быть найдены, если заданы
начальных условий.
Поскольку функции
определены с точностью до общего множителя, функции
однородны и один из параметров связан условием
то остается только
начальных условий. Этими
параметрами нужно распоряжаться так, чтобы траектория
при заданном
проходила через точку
и при каком-то
проходила через точку
Число
также является определяемым параметром. Условие прохождения траектории через точки
дает
соотношений.
Например, если принципу максимума удовлетвбряет только одна траектория и по техническим соображениям оптимальная траектория поставленной задачи должна существовать, то найденное решение и является оптимальным.