12.4. ПМП для задач оптимального управления
Применим принцип максимума в геометрической форме к задачам оптимального управления, начиная с задач с закрепленным временем. Для управляемой системы
с граничными условиями
и функционалом
рассмотрим задачу оптимального управления
Преобразуем эту задачу, как в параграфе 10.2. Расширим пространство состояний:
определим расширенное векторное поле
и получим новую управляемую систему
с граничными условиями
Если управление
оптимально для задачи (12.17)-(12.21), то траектория
расширенной системы (12.22), начинающаяся в
удовлетворяет условию
где
множество достижимости системы (12.22) из точки до за время
Поэтому применима теорема 12.1.
Однако принцип максимума в геометрической форме для расширенной системы (12.22) не различает минимумов и максимумов функционала
Чтобы получить условия, справедливые только
для минимума, введем новый управляющий параметр
и рассмотрим новую систему
Траектория системы (12.23), соответствующая управлениям
попадает на границу множества достижимости этой системы за время
Применим теорему 12.1 к системе (12.23). Имеем
Гамильтониан системы (12.23) имеет вид
а гамильтонова система принципа максимума записывается как
Здесь
гамильтоново поле с гамильтонианом
Первое из уравнений (12.24) означает, что
вдоль оптимальной траектории.
Условие максимума имеет вид
Так как этот максимум достигается, имеем
поэтому можно положить
в правой части условия максимума:
Итак, доказано следующее утверждение.
Теорема 12.3. Пусть управление
оптимально для задачи
Определим гамильтониан
Тогда существует нетривиальная пара
для которой выполняются следующие условия:
Замечания. (1) Если вместо задачи на минимум (12.21) рассматривается задача на максимум, то предыдущее неравенство для у нужно обратить:
(2) Для задачи со свободным временем
(12.17), (12.18), (12.20), (12.21), необходимые условия оптимальности ПМП такие же, как в теореме 12.3, плюс одно дополнительное скалярное равенство
(упражнение).
Для постоянного параметра у в теореме 12.3 имеются две возможности:
а) если
то кривая
называется нормальной экстремалью. Так как пару
можно умножить на любое положительное число, мы можем нормировать
и считать, что в нормальном случае
б) если
то А есть анормальная экстремаль.
Итак, можно всегда считать, что
или
Теперь рассмотрим задачу быстродействия:
Принцип максимума Понтрягина для задачи быстродействия имеет следующую форму.
Следствие 12.1. Пусть управление
оптимально
быстродействию. Определим гамильтониан
Тогда существует липшицева кривая
для которой выполняются следующие условия для почти всех