Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
§ 15. Достаточные условия оптимальности и обоснование метода динамического программирования для систем непрерывного действия. Теоремы В. Г. БолтянскогоМетод динамического программирования вполне обоснован для систем, описываемых уравнениями в конечных разностях.
Для систем, описываемых обыкновенными дифференциальными уравнениями (то есть для систем непрерывного действия) корректное обоснование метода динамического программирования требовало бы доказательства существования гладкой функции Задача об обосновании метода динамического программирования для систем непрерывного действия решена в работа к В. Г. Болтянского [14], к изложению которых мы и перейдем. 1. Постановка задачи. Геометрическая интерпретация уравнения Беллмана в задаче о быстродействии.Рассмотрим управляемую систему, описываемую скалярными дифференциальными уравнениями
В векторной форме систему уравнений (1) можно записать так:
где
На управление и наложены ограничения
Обратимся к задаче о быстродействии. Требуется найти оптимальное управление Конечное состояние системы Минимально возможное время T, в течение которого управление и, удовлетворяющее условию и
В § 14, в предположении, что функция эта функция удовлетворяет уравнению в частных производных (14.44)
Управление, доставляющее минимум выражению в квадратных скобках, является оптимальным и было обозначено через Ниже удобнее вместо
Из соотношения (14.44) следует, что
Учитывая (5), можно переписать соотношение (6) так:
Функция
Для любого управления из совокупности управлений, ограниченных условием
Так как
будет выполняться в течение всего времени движения для каждой оптимальной траектории, то есть всего времени перехода из начальной точки Уравнению Беллмана в задаче о быстродействии можно дать следующую геометрическую интерпретацию. Так как согласно (1)
то уравнение Беллмана (14.44) можно переписать так:
то есть при движении по оптимальной траектории промежуток времени, оставшийся до достижения начала координат, убывает Согласно (11)
Выражение в квадратных скобках представляет собой скалярное произведение вектора градиента функции Представим себе семейство поверхностей Предположение о существовании непрерывных частных производных
|
1 |
Оглавление
|