Главная > Геометрическая теория управления
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

17.3. Динамическое программирование

Уравнение Гамильтона-Якоби для оптимального качества можно вывести и непосредственно, минуя принцип максимума Понтрягина благодаря идее, восходящей еще к Гюйгенсу и составляющее основу

метода динамического программирования Беллмана; см. [3]. Для этого необходимо предположить, что оптимальное качество существует и -гладко.

Пусть оптимальная траектория переводит точку в точку за время Применим постоянное управление и на временном отрезке и обозначим траекторию, выходящую из точки через Так как конечная точка допустимой траектории, начинающейся в то выполняется следующее неравенство для оптимального качества:

Разделим на

и перейдем к пределу при

Получаем неравенство

Пусть теперь есть оптимальная пара. Пусть точка Лебега управления и. Возьмем любое Любой участок оптимальной траектории оптимален, поэтому есть конечная точка оптимальной траектории, так же, как и Поэтому оптимальное качество удовлетворяет равенству

Повторяем наши рассуждения:

переходим к пределу

Это равенство вместе с неравенством (17.14) означает, что

Обозначим

и запишем (17.15) как уравнение Гамильтона-Якоби:

Получаем, что производная оптимального качества равна импульсу вдоль оптимальной траектории

Мы не касаемся здесь обширной теории обобщенных негладких решений уравнения Гамильтона-Якоби для гладких и негладких гамильтонианов

Categories

1
Оглавление
email@scask.ru