1. Постановка задачи. Геометрическая интерпретация уравнения Беллмана в задаче о быстродействии.

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

§ 15. Достаточные условия оптимальности и обоснование метода динамического программирования для систем непрерывного действия. Теоремы В. Г. Болтянского

Метод динамического программирования вполне обоснован для систем, описываемых уравнениями в конечных разностях.

Для систем, описываемых обыкновенными дифференциальными уравнениями (то есть для систем непрерывного действия) корректное обоснование метода динамического программирования требовало бы доказательства существования гладкой функции , определяемой нелинейным уравнением в частных производных (-уравнением Беллмана (то же относится и к функции определяемой уравнением , так как при выводе этого уравнения предполагалось, что функция непрерывна и всюду имеет непрерывные частные производные по всем своим аргументам. Это требование не вытекает из постановки задачи и представляет собой ограничение, которое, однако, не выполняется во многих даже простых задачах, где оказывается [15], что функция является негладкой.

Задача об обосновании метода динамического программирования для систем непрерывного действия решена в работа к В. Г. Болтянского [14], к изложению которых мы и перейдем.

1. Постановка задачи. Геометрическая интерпретация уравнения Беллмана в задаче о быстродействии.

Рассмотрим управляемую систему, описываемую скалярными дифференциальными уравнениями

(15.1)

В векторной форме систему уравнений (1) можно записать так:

(15.2)

где — векторы следующего вида:

(15.3)

На управление и наложены ограничения

(15.4)

Обратимся к задаче о быстродействии. Требуется найти оптимальное управление , то есть управление, которое переводит систему из начального состояния в состояние за минимально возможное время Т.

Конечное состояние системы , то есть точка в фазовом пространстве, в которую надо привести систему, фиксирована: . В качестве начального состояния мы рассматриваем любое состояние системы, то есть любую точку фазового пространства .

Минимально возможное время T, в течение которого управление и, удовлетворяющее условию и , переводит систему из точки в точку , является функцией от начального состояния :

В § 14, в предположении, что функция непрерывна и всюду (кроме конечной точки ) имеет непрерывные частные производные , было показано, что

эта функция удовлетворяет уравнению в частных производных (14.44)

Управление, доставляющее минимум выражению в квадратных скобках, является оптимальным и было обозначено через .

Ниже удобнее вместо рассматривать функцию , отличающуюся от нее знаком

Из соотношения (14.44) следует, что

Учитывая (5), можно переписать соотношение (6) так:

(15.7)

Функция определена во всем фазовом пространстве X. В силу предположений, при которых получено соотношение (14.44), следует, что соотношение (7) имеет место в предположении, что функция непрерывна и всюду (кроме конечной точки имеет непрерывные частные производные

представляет собой уравнение Беллмана в задаче о быстродействии.

Для любого управления из совокупности управлений, ограниченных условием (в том числе и оптимального), переводящих систему из точки в точку , будем в соответствии с (7) иметь такое соотношение:

Так как то соотношение

будет выполняться в течение всего времени движения для каждой оптимальной траектории, то есть всего времени перехода из начальной точки в конечную точку .

Уравнению Беллмана в задаче о быстродействии можно дать следующую геометрическую интерпретацию. Так как согласно (1)

(15.10)

то уравнение Беллмана (14.44) можно переписать так:

(15.11)

то есть при движении по оптимальной траектории промежуток времени, оставшийся до достижения начала координат, убывает .

Согласно (11)

(15.12)

Выражение в квадратных скобках представляет собой скалярное произведение вектора градиента функции на вектор фазовой скорости изображающей точки.

Представим себе семейство поверхностей . Эти поверхности можно назвать изохронными поверхностями — наименьшее время попадания из любой точки поверхности в начало координат равно одной и той же величине С. Вектор направлен в точке по нормали к поверхности , проходящей через эту точку. Соотношение (12) показывает, что оптимальное управление и обеспечивает то, что проекция фазовой скорости на отрицательное направление нормали к поверхности , проходящей через точку в любой момент времени положительна, то есть изображающая точка все время перемещается в сторону убывающих значений .

Предположение о существовании непрерывных частных производных в любой точке означает, что предполагается гладкость поверхностей , то есть единственность направления нормали в любой точке этих поверхностей. Точки, в которых частные производные не существуют, являются особыми точками поверхностей , и в этих точках направление нормали к поверхности не определено.

<< Предыдущий параграф

Следующий параграф >>

Оглавление

ПРЕДИСЛОВИЕ
Глава 1. ЛИНЕЙНЫЕ УПРАВЛЯЕМЫЕ СИСТЕМЫ
§ 1. Одномерные управляемые системы
2. Функция веса и передаточная функция.
3. Частотная характеристика.
4. Замкнутая управляемая система.
5. Разомкнутая управляемая система.
6. Воспроизведение преобразованного входного сигнала.
7. Одномерная управляемая система с конечным числом степеней свободы.
8. Одно замечание об интегрировании уравнений движения одномерной системы.
§ 2. Многомерные управляемые системы
1. Замкнутая управляемая система.
2. Характеристический определитель замкнутой управляемой системы.
3. Уравнение автоматического управления.
4. Разомкнутая управляемая система.
5. Интерпретация матричных операторов.
6. О воспроизведении входного сигнала в многомерной управляемой системе.
§ 3. Частотные методы исследования устойчивости линейных управляемых систем
1. Преобразование характеристического определителя замкнутой управляемой системы.
2. Критерий асимптотической устойчивости замкнутых управляемых систем, содержащих лишь устойчивые звенья (критерий Найквиста).
3. Применение критерия Найквиста к системам с нейтральными звеньями.
4. Применение критерия Найквиста к системам с неустойчивыми звеньями.
5. Частотные характеристики управляемых систем и их экспериментальное определение.
6. Пример построения диаграммы Найквиста.
7. Управляемые системы, содержащие звенья с запаздыванием и критерии устойчивости этих систем.
8. Логарифмические частотные характеристики.
9. Определение устойчивости замкнутой управляемой системы по логарифмическим частотным характеристикам разомкнутой управляемой системы.
§ 4. Функция веса и переходная функция стационарной линейной системы
1. Одномерная управляемая система.
2. Одномерная управляемая система, у которой передаточная функция является неправильной дробью.
3. Многомерные управляемые системы.
§ 5. Переходные и установившиеся процессы в замкнутых управляемых системах
1. Определение функции веса по частотной характеристике замкнутой системы.
2. Определение переходной функции по частотной характеристике замкнутой системы.
3. Минимально-фазовые системы.
4. Установившиеся процессы в замкнутых управляемых системах. Коэффициенты ошибок.
5. Установившиеся процессы в следящей системе.
Глава 2. НЕЛИНЕЙНЫЕ УПРАВЛЯЕМЫЕ СИСТЕМЫ
§ 6. Устойчивость нелинейных управляемых систем. Частотные критерии. Применение прямого метода Ляпунова
2. Интерпретация функции W(D).
3. Видоизмененная частотная характеристика.
4. Теорема В.М. Попова.
5. Геометрическая формулировка теоремы В.М. Попова.
6. О возможности при доказательстве теоремы ограничиться случаем q>0.
7. Лемма 1.
8. Лемма 2.
9. Доказательство теоремы В.М. Попова.
10. Применение прямого метода Ляпунова. Метод А. И. Лурье в теории абсолютной устойчивости нелинейных систем.
§ 7. Нелинейные системы под воздействием внешних сил
1. Приведение задачи к интегральным уравнениям.
2. Построение приближенных решений.
§ 8. Качественные методы исследования движения нелинейных систем
1. Нелинейные системы с одной степенью свободы.
2. Консервативные системы.
3. Диссипативные системы.
4. Автоколебательные системы. Метод точечных преобразований.
§ 9. Нелинейные системы под воздействием периодических внешних сил
1. Вынужденные колебания нелинейной системы.
2. Установившиеся колебания с частотой внешней силы и их устойчивость.
Глава 3. СИСТЕМЫ С КОНЕЧНЫМ ВРЕМЕНЕМ УПРАВЛЕНИЯ
§ 10. Функции от матриц и их применение к интегрированию систем линейных дифференциальных уравнений
2. Теорема Гамильтона — Кэли.
3. Минимальный полином матрицы.
4. Функции от матрицы.
5. Интерполяционный полином Лагранжа — Сильвестра.
6. Построение функции.
7. Компоненты матрицы А.
8. Общие формулы, определяющие компоненты Z матрицы А.
9. Представление функций от матриц рядами.
10. Распространение на функции от матриц интегральной формулы Коши для аналитических функций.
11. Некоторые свойства функций от матриц.
12. Интегрирование систем линейных дифференциальных уравнений с постоянными коэффициентами при помощи функций от матриц.
13. Сравнение с решениями, получаемыми при помощи преобразования Лапласа.
§ 11. Управляемость и наблюдаемость линейных систем
1. Управляемость систем, описываемых линейными дифференциальными уравнениями с постоянными коэффициентами.
2. Системы с одной управляющей силой.
3. Наблюдаемость систем, описываемых линейными дифференциальными уравнениями с постоянными коэффициентами.
4. Системы с одной наблюдаемой координатой.
5. Принцип двойственности в теории управляемости и наблюдаемости.
6. Управляемость линейных нестационарных систем.
7. Наблюдаемость линейных нестационарных систем.
8. Условие управляемости линейной стационарной системы в задаче с подвижными концами.
9. Условие управляемости линейной нестационарной системы в задаче с подвижными концами.
Глава 4. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
§ 12. Оптимальное управление в системах с ограниченными ресурсами
2. Метод динамического программирования Р. Беллмана. Принцип оптимальности.
§ 13. Применение динамического программирования к дискретным системам
1. Рекуррентное соотношение Беллмана.
2. Многомерные дискретные системы.
§ 14. Применение динамического программирования к системам непрерывного действия
1. Задача с фиксированным временем и свободным концом траектории.
2. Задача с закрепленным концом траектории и свободным временем.
3. Задача о быстродействии.
§ 15. Достаточные условия оптимальности и обоснование метода динамического программирования для систем непрерывного действия. Теоремы В. Г. Болтянского
1. Постановка задачи. Геометрическая интерпретация уравнения Беллмана в задаче о быстродействии.
2. Теорема В. Г. Болтянского для задачи о быстродействии.
3. Теорема В. Г. Болтянского для общей задачи динамического программирования.
§ 16. Связь уравнения Беллмана с уравнением Гамильтона — Якоби в задачах аналитической механики
1. Задача о минимизации интеграла вида
2. Получение уравнения Гамильтона — Якоби из принципа Гамильтона.
Глава 5. ПРИНЦИП МАКСИМУМА Л. С. ПОНТРЯГИНА В ТЕОРИИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
§ 17. Теорема о необходимом условии оптимальности
2. Принцип максимума Л. С. Понтрягина в задаче о быстродействии.
3. Доказательство теоремы о необходимом условии оптимальности (принципа максимума) в задаче с закрепленным временем Т и свободным концом траектории.
§ 18. Принцип максимума для неавтономных систем
1. Теорема о необходимом условии оптимальности для неавтономных систем.
2. Доказательство теоремы о необходимом условии оптимальности для неавтономной системы с линейно входящим управлением.
3. Линейные неавтономные системы. Приведение задачи о быстродействии к краевой задаче.
§ 19. Задача с подвижными концами. Применение принципа максимума. Условия трансверсальности
§ 20. Понятие регулярного синтеза в теории оптимальных систем
§ 21. Достаточное условие оптимальности в форме принципа максимума. Теорема В. Г. Болтянского
§ 22. Связь принципа максимума с методом динамического программирования
§ 23. Некоторые примеры применения принципа максимума
1. Теорема о числе переключений управления в линейной задаче о быстродействии.
2. Задача о максимальном отклонении.
3. Применение принципа максимума при отсутствии ограничений на управление.
§ 24. Оптимальные линейные системы с квадратичным критерием качества
1. Задача о регуляторе состояния [34].
2. Задача о регуляторе выхода.
3. Стационарные системы с бесконечным временем наблюдения.
4. Задача слежения [34].
Глава 6. СТОХАСТИЧЕСКИЕ СИСТЕМЫ
§ 25. Преобразование случайных сигналов линейными системами
§ 26. Прогноз и фильтрация одномерных случайных процессов
1. Метод А. Н. Колмогорова и Н. Винера. Стационарные случайные процессы.
2. Решение интегрального уравнения, определяющего функцию веса оптимальной системы.
3. Нестационарные случайные процессы. Интегральное уравнение для оптимальной функции веса.
4. Оптимальные фильтры Калмана — Бьюси.
§ 27. Многомерные случайные процессы. Оптимальные фильтры Кальмана — Бьюси
1. Системы с конечным временем наблюдения.
2. Стационарные системы с бесконечным временем наблюдения.
3. Нестационарные системы с бесконечным временем наблюдения.
4. Оптимальная фильтрация коррелированных шумов.
ЛИТЕРАТУРА