§ 11.3. СИНТЕЗ ОПТИМАЛЬНОГО ЗАКОНА УПРАВЛЕНИЯ С ИСПОЛЬЗОВАНИЕМ МЕТОДА ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ И ПРИНЦИПА МАКСИМУМА

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

§ 11.3. СИНТЕЗ ОПТИМАЛЬНОГО ЗАКОНА УПРАВЛЕНИЯ С ИСПОЛЬЗОВАНИЕМ МЕТОДА ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ И ПРИНЦИПА МАКСИМУМА

Рассмотренная в § 11.2 задача синтеза оптимальной функции веса решена при полной свободе выбора структуры и параметров системы. При синтезе оптимальных САУ объект управления обычно задан. Тогда воспользоваться рассмотренной методикой в общем случае не представляется возможным. Пусть объект управления описывается системой нелинейных дифференциальных уравнений вида

где фазовые координаты системы (параметры состояния); — управляющее воздействие; — заданные детерминированные функции своих аргументов.

Рассмотрим задачу синтеза управляющего воздействия для объекта (11.21) из условия минимизации критерия качества

где и — заданные функции фазовых координат, определяющие точность, расход энергии или другие показатели качества управления.

Для решения задачи можно воспользоваться методом динамичен кого программирования, предложенным Р. Веллманом [7] для широкого круга систем, будущее состояние которых определяется их состоянием в настоящем. Метод динамического программирования базируется на принципе оптимальности, который можно сформулировать в следующей форме: оптимальное управление не зависит от «предыстории» системы и определяется лишь ее состоянием в рассматриваемый момент времени.

Рассмотрим оптимальную траекторию в фазовом пространстве координат (рис. 11.4), соединяющую точки Минимальное значение критерия (11.22), соответствующее оптимальной траектории обозначим через По принципу оптимальности участок траектории от любой точки до конечной точки В также является оптимальной траекторией. При этом часть критерия оптимальности (11.22), которая соответствует участку и отрезку времени от до Т, должна иметь минимально возможное значение. Обозначим это значение через

Рис. 11.4. Оптимальная траектория в пространстве фазовых координат

В окрестности точки С выберем точку такую, что время, соответствующее где бесконечно малый промежуток времени.

Для участка траектории отвечающего интервалу времени , можно найти минимальное значение функционала (11.22):

Согласно принципу оптимальности условие для определения оптимального управления можно записать в виде

или

так как функция в явной форме не зависит от управления.

В соответствии с введенными выше участками траектории и интеграл в выражении (11.23) вычислим по частям.

Обозначив

получим

При достаточно малом первый интеграл в выражении (11.24) можно представить в виде

где — величина высшего порядка малости по сравнению с . С учетом этого выражение (11.24) примет вид (в интеграле заменим переменную интегрирования

Так как первое слагаемое правой части выражения (11.25) зависит лишь от значения а второе определяется и значениями в интервале изменения переменной интегрирования, то выражение (11.25) можно записать в виде

Второе слагаемое в правой части выражения (11.26) есть поэтому

Разложим функции в ряд Тейлора в окрестности точки Тогда получим

где — величина высшего порядка малости относительно величины

Так как в соответствии с уравнениями (11.21), то

Подставим последнее выражение в функцию и разложим ее в бесконечно малой окрестности точки в ряд Тейлора. При этом получим

где — величина высшего порядка малости по сравнению с

Формула (11.30) справедлива только в том случае, если существуют частные производные функции по переменным Подставляя выражение (11.30) в уравнение (11.27), получаем

где величина высшего порядка малости по сравнению с После преобразований будем иметь

Устремив к нулю, получим функциональное уравнение Веллмана

так как величина в пределе равна нулю.

Уравнение (11.31) является дифференциальным уравнением в частных производных. Граничное условие для функции получим при

Если то граничное условие принимает вид

Уравнение (11.31) представляет собой необходимое и достаточное условие оптимальности. Основным ограничением для него является требование непрерывности и гладкости оптимальной функции

Если дифференциальные уравнения (11.21) являются линейными:

где — заданные функции времени; возмущения, то функциональное уравнение (11.31) запишется в виде

При получим

Если правая часть уравнения (11.31) непрерывна по управлению и и на управление не наложено никаких ограничений, то для отыскания минимума выражения в квадратных скобках можно приравнять нулю частную производную. Это дает

откуда можно получить соотношение для структуры оптимального управления:

Подстановка соотношения (11.36) в уравнение исключает из него управление и и позволяет получить нелинейное дифференциальное уравнение в частных производных для определения функции

Трудности решения уравнений в частных производных общеизвестны, поэтому не всегда удается отыскать аналитическую зависимость в функции фазовых координат и времени. Однако если решение уравнения в частных производных удается найти, то однозначно определяются частные производные а, значит, и структура алгоритма управления

Пример 11.3. Для объекта с дифференциальным уравнением

найдем оптимальное управление, минимизирующее критерий качества

Используем функциональное уравнение (11.34):

Так как выражение в квадратных скобках непрерывно относительно и, то из условия (11.35) получим, что

или

Подставляя формулу (11.40) в уравнение (11.39), получаем уравнение в частных производных:

или

Решение уравнения (11.41) можно найти, если предположить, что

Так как

то

откуда следует дифференциальное уравнение для определения неизвестной функции

Уравнение 11.42) является дифференциальным уравнением Рикатти с граничным условием

вытекающим из соотношения (11.32).

Введя новую переменную получим

Найдя решение уравнения (11.44) в виде а значит, и можно определить искомое оптимальное управление:

Пример 11 4. Найдем оптимальное управление для объекта с дифференциальным уравнением (11.38) из условия минимизации критерия качества

если на управление наложено ограничение

Используя функциональное уравнение (11.34), получаем

Так как выражение в квадратных скобках является линейной функцией управления, то его минимум обеспечивается при

Подставляя это выражение в уравнение (11.45), находим

или

Уравнение (11.47) является нелинейным уравнением в частных производных. Поэтому задача определения оптимального управления усложняется. Пример 11.5. Определим оптимальные параметры управления

для процесса, описанного дифференциальным уравнением (11.38), из условия минимизации критерия качества

Очевидно в этом случае будем иметь

поэтому

Как видно, оптимальное управление получено в классе с переменной структурой (см. § 8.7). Задача определения функции в этом случае является достаточно сложной.

Рассмотренные примеры синтеза оптимального управления для объекта с дифференциальным уравнением первого порядка показывают, что с использованием метода динамического программирования можно определить класс функций, к которым относится оптимальное управление, но не всегда просто найти параметры оптимального управления.

Для объектов, описываемых сложными нелинейными дифференциальными уравнениями (11.21), задача синтеза оптимального управления с использованием метода динамического программирования оказывается практически неразрешимой.

Коротко остановимся на необходимых условиях оптимальности, которые дает принцип максимума [41].

Если дополнить уравнения (11.21) уравнениями

и ввести в рассмотрение функции

где а также учесть соотношение то функциональное уравнение (11.31) формально можно записать в форме принципа максимума

где — так называемый гамильтониан.

Условие (11.48) представляет собой необходимое условие оптимальности в принципе максимума.

Дифференциальные уравнения для определения функций имеют вид

Исходная система уравнений определяется аналогично:

Итак, условие (11.48) совместно с дифференциальными уравнениями (11.49) и (11.50) позволяет принципиально поставить задачу об отыскании оптимального управления. Необходимые и достаточные условия оптимальности принимают вид:

Систему уравнений (11.52) необходимо дополнить начальными условиями

Определив из условий (11.51) выражение для управления и и подставив его в уравнения (11.52) и (11.53), можно найти систему дифференциальных уравнений для отыскания функций .

Для линейной системы (11.33) при система уравнений (11.51) и (11.52) примет вид

Условие оптимальности (11.51) при этом можно записать следующим образом:

Если удастся найти решение совместной системы уравнений (11.51)-(11.53) или (11.54), (11.55), то задачу синтеза

тимального управления можно считать решенной. Однако этот путь наталкивается на серьезные трудности. Так, из системы уравнений (11.54) следует, что при устойчивом объекте уравнения для функций Дают неустойчивые решения. Кроме того, при заданных функциях достаточно сложной является задача определения зависимостей между функциями и что необходимо для синтеза управления в форме обратной связи. Поэтому принцип максимума в большей степени приспособлен для отыскания программных оптимальных управлений в функции времени, нежели для решения задач синтеза оптимального закона управления.

<< Предыдущий параграф

Следующий параграф >>

Оглавление