1. Задача с фиксированным временем и свободным концом траектории.

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

§ 14. Применение динамического программирования к системам непрерывного действия

1. Задача с фиксированным временем и свободным концом траектории.

Рассмотрим управляемую систему, описываемую векторным дифференциальным уравнением

где и векторы следующего вида:

Начальное состояние системы задано

Требуется найти управление и , удовлетворяющее ограничениям

и доставляющее минимум функционалу

где Т — некоторая фиксированная величина.

Пусть найдена оптимальная траектория системы (1) (рис. 14.1), проходящая через заданную точку , то есть траектория, минимизирующая при условии (4) функционал (5).

Значение в рассматриваемой задаче заранее не задано.

Минимальное значение функционала Q, соответствующее оптимальной траектории, обозначим через .

Рис. 14.1.

На рис. 14.1 указаны положения изображающей точки на оптимальной траектории в моменты времени t и .

Состояние системы в момент времени t будет . Состояние системы в момент времени обозначим так:

Согласно принципу оптимальности участок оптимальной траектории от точки до точки сам по себе является оптимальной траекторией, которая доставляет минимум функционалу

Это минимальное значение функционала (7) обозначим через или для краткости .

Аналогично участок оптимальной траектории от точки до точки также сам по себе является оптимальной траекторией, доставляющей минимум функционалу

Минимальное значение функционала (8) обозначим так:

По принятому выше определению

(14.10)

Интеграл в правой части выражения (10) можно, учитывая малость , представить так:

где предполагается, что функция непрерывна на полуинтервале . Выражение (10) принимает вид

(14.12)

Первое слагаемое в квадратной скобке в выражении (12) зависит лишь от значения управления и в момент , то есть от . Второе слагаемое в квадратной скобке надо минимизировать на множестве всех допустимых управлений в интервале времени . Это минимальное значение, которое мы обозначили через является в свою очередь функцией от состояния системы Последнее же зависит от управления и на интервале или, с точностью до от значения в момент времени . Поэтому в соотношении (12) минимизируется по все выражение, заключенное в квадратные скобки, а не только его первое слагаемое. Учитывая принятое здесь обозначение

(14.13)

перепишем соотношение (12) так:

(14.14)

Нетрудно видеть, что соотношение (14), которым связаны и , можно получить также из (13.30), если учесть, что моментам времени и здесь соответствуют моменты времени и . Заметим при этом, что в функционале (13.3) подынтегральная функция была обозначена через , а входящая в выражение (13.30) функции G согласно (13.10) имеет вид . Поэтому вместо функции , входящей в выражение (13.30), здесь в соответствии с (5) надо подставить функцию .

Таким образом, рекуррентное соотношение (13.30) здесь должно быть заменено соотношением

где — величина высшего порядка малости, чем . Эта величина добавлена потому, что при выводе соотношения (13.30) мы исходили из разностного уравнения (13.7), которое было получено при помощи приближенного соотношения (13.6), содержащего погрешность порядка . Входящее в выражение (13.6) приращение аргумента здесь заменено через .

Заметим, что в соответствии с (1)

(14.15)

Предположим теперь, что функция S непрерывна и всюду имеет непрерывные частные производные по всем своим аргументам

Это предположение весьма существенно, так как во многих задачах оно не имеет места и для этих задач последующие рассуждения требуют дополнительного обоснования [14].

При сделанном выше предположении будем в соответствии с (15) иметь

Обозначая через

(14.17)

скалярное произведение векторов

можно переписать выражение (16) так:

(14.18)

Подставляя выражение (18) в соотношение (14), получим

(14.19)

Согласно (10) функция получена в результате минимизации функционала по и на интервале

то есть функция уже не содержит . Поэтому содержащиеся в квадратных скобках в (19) слагаемые

и можно вынести за знак и переписать

соотношение (19) так:

или

(14.20)

Так как то, переходя в (20) к пределу при , получим

(14.21)

Уравнение (21) [9] называется уравнением Беллмана.

Так как в результате минимизации по и выражения в квадратных скобках правая часть уравнения (21) не будет содержать , то уравнение (21) будет нелинейным уравнением первого порядка в частных производных типа уравнений Гамильтона — Якоби. Функция и, которая доставляет минимум выражению в квадратных скобках в (21), является искомым оптимальным управлением . Эта функция будет, однако, зависеть от . Только получив решение уравнения в частных производных (21) (в котором уже выполнена мизация по , мы найдем явный вид , а следовательно, и явный вид оптимального управления .

Граничные условия для уравнения (21) будут следующими: для функционала (5) ; для функционала (13.3) .

Подчеркнем теперь, что при выводе уравнения (21) мы исходили из найденной уже оптимальной траектории системы (1). Для всякой оптимальной траектории в предположении гладкости функции , уравнение (21) будет иметь место. Таким образом, уравнение Веллмана дает, при сделанных выше предположениях о гладкости функции , необходимые условия оптимальности. Вопрос о достаточных условиях оптимальности требует отдельного рассмотрения.

Пример 1. Рассмотрим систему, описываемую следующими уравнениями [85]:

Предположим, что подынтегральная функция в функционале (5) имеет вид

Как следует из (1), в рассматриваемом примере

Уравнение Беллмаиа (21) здесь принимает вид

где

Так как

то в случае, когда , функция К будет иметь минимум при , где

Минимальное значение будет следующим:

Таким образом, уравнение Беллмана (21) в рассматриваемом примере принимает вид

Пример 2. В предыдущем примере на управление и не было наложено ограничений. Рассмотрим теперь систему, описываемую уравнениями

Пусть подынтегральная функция в функционале (5) имеет вид

На управления наложены ограничения

Согласно (1) в рассматриваемом примере

Уравнение Беллмана (21) принимает вид

где

Оптимальное управление , доставляющее минимум функции будет следующим:

Таким образом, при наложенных на управление ограничениях минимальное значение имеет вид

Уравнение Беллмана (21) принимает в рассматриваемом здесь примере следующий вид:

Заметим, что при наложенных здесь ограничениях на управления функция не будет всюду гладкой (см. ниже, § 15). Полученное в настоящем примере уравнение Беллмана поэтому должно рассматриваться лишь в области, где функция S непрерывна и имеет непрерывные частные производные по всем своим аргументам.

<< Предыдущий параграф

Следующий параграф >>

Оглавление

ПРЕДИСЛОВИЕ
Глава 1. ЛИНЕЙНЫЕ УПРАВЛЯЕМЫЕ СИСТЕМЫ
§ 1. Одномерные управляемые системы
2. Функция веса и передаточная функция.
3. Частотная характеристика.
4. Замкнутая управляемая система.
5. Разомкнутая управляемая система.
6. Воспроизведение преобразованного входного сигнала.
7. Одномерная управляемая система с конечным числом степеней свободы.
8. Одно замечание об интегрировании уравнений движения одномерной системы.
§ 2. Многомерные управляемые системы
1. Замкнутая управляемая система.
2. Характеристический определитель замкнутой управляемой системы.
3. Уравнение автоматического управления.
4. Разомкнутая управляемая система.
5. Интерпретация матричных операторов.
6. О воспроизведении входного сигнала в многомерной управляемой системе.
§ 3. Частотные методы исследования устойчивости линейных управляемых систем
1. Преобразование характеристического определителя замкнутой управляемой системы.
2. Критерий асимптотической устойчивости замкнутых управляемых систем, содержащих лишь устойчивые звенья (критерий Найквиста).
3. Применение критерия Найквиста к системам с нейтральными звеньями.
4. Применение критерия Найквиста к системам с неустойчивыми звеньями.
5. Частотные характеристики управляемых систем и их экспериментальное определение.
6. Пример построения диаграммы Найквиста.
7. Управляемые системы, содержащие звенья с запаздыванием и критерии устойчивости этих систем.
8. Логарифмические частотные характеристики.
9. Определение устойчивости замкнутой управляемой системы по логарифмическим частотным характеристикам разомкнутой управляемой системы.
§ 4. Функция веса и переходная функция стационарной линейной системы
1. Одномерная управляемая система.
2. Одномерная управляемая система, у которой передаточная функция является неправильной дробью.
3. Многомерные управляемые системы.
§ 5. Переходные и установившиеся процессы в замкнутых управляемых системах
1. Определение функции веса по частотной характеристике замкнутой системы.
2. Определение переходной функции по частотной характеристике замкнутой системы.
3. Минимально-фазовые системы.
4. Установившиеся процессы в замкнутых управляемых системах. Коэффициенты ошибок.
5. Установившиеся процессы в следящей системе.
Глава 2. НЕЛИНЕЙНЫЕ УПРАВЛЯЕМЫЕ СИСТЕМЫ
§ 6. Устойчивость нелинейных управляемых систем. Частотные критерии. Применение прямого метода Ляпунова
2. Интерпретация функции W(D).
3. Видоизмененная частотная характеристика.
4. Теорема В.М. Попова.
5. Геометрическая формулировка теоремы В.М. Попова.
6. О возможности при доказательстве теоремы ограничиться случаем q>0.
7. Лемма 1.
8. Лемма 2.
9. Доказательство теоремы В.М. Попова.
10. Применение прямого метода Ляпунова. Метод А. И. Лурье в теории абсолютной устойчивости нелинейных систем.
§ 7. Нелинейные системы под воздействием внешних сил
1. Приведение задачи к интегральным уравнениям.
2. Построение приближенных решений.
§ 8. Качественные методы исследования движения нелинейных систем
1. Нелинейные системы с одной степенью свободы.
2. Консервативные системы.
3. Диссипативные системы.
4. Автоколебательные системы. Метод точечных преобразований.
§ 9. Нелинейные системы под воздействием периодических внешних сил
1. Вынужденные колебания нелинейной системы.
2. Установившиеся колебания с частотой внешней силы и их устойчивость.
Глава 3. СИСТЕМЫ С КОНЕЧНЫМ ВРЕМЕНЕМ УПРАВЛЕНИЯ
§ 10. Функции от матриц и их применение к интегрированию систем линейных дифференциальных уравнений
2. Теорема Гамильтона — Кэли.
3. Минимальный полином матрицы.
4. Функции от матрицы.
5. Интерполяционный полином Лагранжа — Сильвестра.
6. Построение функции.
7. Компоненты матрицы А.
8. Общие формулы, определяющие компоненты Z матрицы А.
9. Представление функций от матриц рядами.
10. Распространение на функции от матриц интегральной формулы Коши для аналитических функций.
11. Некоторые свойства функций от матриц.
12. Интегрирование систем линейных дифференциальных уравнений с постоянными коэффициентами при помощи функций от матриц.
13. Сравнение с решениями, получаемыми при помощи преобразования Лапласа.
§ 11. Управляемость и наблюдаемость линейных систем
1. Управляемость систем, описываемых линейными дифференциальными уравнениями с постоянными коэффициентами.
2. Системы с одной управляющей силой.
3. Наблюдаемость систем, описываемых линейными дифференциальными уравнениями с постоянными коэффициентами.
4. Системы с одной наблюдаемой координатой.
5. Принцип двойственности в теории управляемости и наблюдаемости.
6. Управляемость линейных нестационарных систем.
7. Наблюдаемость линейных нестационарных систем.
8. Условие управляемости линейной стационарной системы в задаче с подвижными концами.
9. Условие управляемости линейной нестационарной системы в задаче с подвижными концами.
Глава 4. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
§ 12. Оптимальное управление в системах с ограниченными ресурсами
2. Метод динамического программирования Р. Беллмана. Принцип оптимальности.
§ 13. Применение динамического программирования к дискретным системам
1. Рекуррентное соотношение Беллмана.
2. Многомерные дискретные системы.
§ 14. Применение динамического программирования к системам непрерывного действия
1. Задача с фиксированным временем и свободным концом траектории.
2. Задача с закрепленным концом траектории и свободным временем.
3. Задача о быстродействии.
§ 15. Достаточные условия оптимальности и обоснование метода динамического программирования для систем непрерывного действия. Теоремы В. Г. Болтянского
1. Постановка задачи. Геометрическая интерпретация уравнения Беллмана в задаче о быстродействии.
2. Теорема В. Г. Болтянского для задачи о быстродействии.
3. Теорема В. Г. Болтянского для общей задачи динамического программирования.
§ 16. Связь уравнения Беллмана с уравнением Гамильтона — Якоби в задачах аналитической механики
1. Задача о минимизации интеграла вида
2. Получение уравнения Гамильтона — Якоби из принципа Гамильтона.
Глава 5. ПРИНЦИП МАКСИМУМА Л. С. ПОНТРЯГИНА В ТЕОРИИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
§ 17. Теорема о необходимом условии оптимальности
2. Принцип максимума Л. С. Понтрягина в задаче о быстродействии.
3. Доказательство теоремы о необходимом условии оптимальности (принципа максимума) в задаче с закрепленным временем Т и свободным концом траектории.
§ 18. Принцип максимума для неавтономных систем
1. Теорема о необходимом условии оптимальности для неавтономных систем.
2. Доказательство теоремы о необходимом условии оптимальности для неавтономной системы с линейно входящим управлением.
3. Линейные неавтономные системы. Приведение задачи о быстродействии к краевой задаче.
§ 19. Задача с подвижными концами. Применение принципа максимума. Условия трансверсальности
§ 20. Понятие регулярного синтеза в теории оптимальных систем
§ 21. Достаточное условие оптимальности в форме принципа максимума. Теорема В. Г. Болтянского
§ 22. Связь принципа максимума с методом динамического программирования
§ 23. Некоторые примеры применения принципа максимума
1. Теорема о числе переключений управления в линейной задаче о быстродействии.
2. Задача о максимальном отклонении.
3. Применение принципа максимума при отсутствии ограничений на управление.
§ 24. Оптимальные линейные системы с квадратичным критерием качества
1. Задача о регуляторе состояния [34].
2. Задача о регуляторе выхода.
3. Стационарные системы с бесконечным временем наблюдения.
4. Задача слежения [34].
Глава 6. СТОХАСТИЧЕСКИЕ СИСТЕМЫ
§ 25. Преобразование случайных сигналов линейными системами
§ 26. Прогноз и фильтрация одномерных случайных процессов
1. Метод А. Н. Колмогорова и Н. Винера. Стационарные случайные процессы.
2. Решение интегрального уравнения, определяющего функцию веса оптимальной системы.
3. Нестационарные случайные процессы. Интегральное уравнение для оптимальной функции веса.
4. Оптимальные фильтры Калмана — Бьюси.
§ 27. Многомерные случайные процессы. Оптимальные фильтры Кальмана — Бьюси
1. Системы с конечным временем наблюдения.
2. Стационарные системы с бесконечным временем наблюдения.
3. Нестационарные системы с бесконечным временем наблюдения.
4. Оптимальная фильтрация коррелированных шумов.
ЛИТЕРАТУРА