Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
§ 14. Применение динамического программирования к системам непрерывного действия1. Задача с фиксированным временем и свободным концом траектории.Рассмотрим управляемую систему, описываемую векторным дифференциальным уравнением
где
Начальное состояние системы задано
Требуется найти управление и
и доставляющее минимум функционалу
где Т — некоторая фиксированная величина. Пусть найдена оптимальная траектория системы (1) (рис. 14.1), проходящая через заданную точку Значение Минимальное значение функционала Q, соответствующее оптимальной траектории, обозначим через
Рис. 14.1. На рис. 14.1 указаны положения изображающей точки на оптимальной траектории в моменты времени t и Состояние системы в момент времени t будет
Согласно принципу оптимальности участок оптимальной траектории от точки
Это минимальное значение функционала (7) обозначим через Аналогично участок оптимальной траектории от точки
Минимальное значение функционала (8) обозначим так:
По принятому выше определению
Интеграл в правой части выражения (10) можно, учитывая малость
где предполагается, что функция
Первое слагаемое в квадратной скобке в выражении (12) зависит лишь от значения управления и в момент
перепишем соотношение (12) так:
Нетрудно видеть, что соотношение (14), которым связаны Таким образом, рекуррентное соотношение (13.30) здесь должно быть заменено соотношением
где Заметим, что в соответствии с (1)
Предположим теперь, что функция S непрерывна и всюду имеет непрерывные частные производные по всем своим аргументам
Это предположение весьма существенно, так как во многих задачах оно не имеет места и для этих задач последующие рассуждения требуют дополнительного обоснования [14]. При сделанном выше предположении будем в соответствии с (15) иметь
Обозначая через
скалярное произведение векторов
можно переписать выражение (16) так:
Подставляя выражение (18) в соотношение (14), получим
Согласно (10) функция то есть функция
соотношение (19) так:
или
Так как
Уравнение (21) [9] называется уравнением Беллмана. Так как в результате минимизации по и выражения в квадратных скобках правая часть уравнения (21) не будет содержать Граничные условия для уравнения (21) будут следующими: для функционала (5) Подчеркнем теперь, что при выводе уравнения (21) мы исходили из найденной уже оптимальной траектории системы (1). Для всякой оптимальной траектории в предположении гладкости функции Пример 1. Рассмотрим систему, описываемую следующими уравнениями [85]:
Предположим, что подынтегральная функция в функционале (5) имеет вид
Как следует из (1), в рассматриваемом примере
Уравнение Беллмаиа (21) здесь принимает вид
где
Так как
то в случае, когда
Минимальное значение
Таким образом, уравнение Беллмана (21) в рассматриваемом примере принимает вид
Пример 2. В предыдущем примере на управление и не было наложено ограничений. Рассмотрим теперь систему, описываемую уравнениями
Пусть подынтегральная функция в функционале (5) имеет вид
На управления
Согласно (1) в рассматриваемом примере
Уравнение Беллмана (21) принимает вид
где
Оптимальное управление
Таким образом, при наложенных на управление ограничениях
Уравнение Беллмана (21) принимает в рассматриваемом здесь примере следующий вид:
Заметим, что при наложенных здесь ограничениях на управления
|
1 |
Оглавление
|