Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
§ 22. Связь принципа максимума с методом динамического программированияОбратимся к задаче с закрепленным концом траектории и свободным временем. Рассмотрим систему, описываемую дифференциальными уравнениями
которым эквивалентно векторное уравнение
где
Требуется перевести систему из точки Управление и
и его надо выбрать так, чтобы функционал
принимал наименьшее возможное значение. Удовлетворяющее этим условиям управление, соответствующую ему траекторию и промежуток времени Полученное при указанных выше условиях наименьшее возможное значение
В § 14, в предположении, что функция
Как и выше, обозначим через
и начальным условием
Из (7), (8) и (5) следует, что подлежащий минимизации функционал Q можно представить так:
Введем теперь следующие
Через
Уравнение Беллмана (14.36) можно теперь записать так:
Если умножить левую и правую части соотношения (12) на —1, то знак min в левой части (12) надо будет заменить на знак max. Таким образом, уравнение (12) можно представить так:
Аналогично (15.28) обозначим
Уравнение Беллмана (13) принимает вид
При этом верхняя грань достигается для некоторого Сделаем теперь еще следующие дополнительные предположения. Будем предполагать, что функция Функцию, стоящую под знаком
Пусть Фиксируем некоторый момент времени
Из уравнения (16) следует, что для любого оптимального движения
Точки
Следовательно, рассматриваемая в (18) функция
Учитывая, что согласно (1) и (7) для оптимального движения
будем иметь
Соотношение (21) в соответствии с (23) можно переписать так:
Обозначим теперь через
Как следует из (24), вдоль всякой оптимальной траектории величины
Заметим, что согласно (25), (15) и (11)
что не противоречит уравнениям (26), так как
Вектор
Уравнение Беллмана (16) в соответствии с (25), (10), (29) теперь можно переписать так:
Обозначим теперь через
зависящую от Уравнение (30) принимает теперь следующий вид:
Из соотношения (32) можно заключить, что оптимальное управление
Заметим, однако, что соотношения (30), (32) и (33) получены здесь при исходном предположении о том, что функция
|
1 |
Оглавление
|