2. ПРИНЦИП МАКСИМУМА

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

2. ПРИНЦИП МАКСИМУМА

Пусть закон изменения фазового состояния объекта записывается в виде системы дифференциальных уравнений

где функции непрерывны по совокупности аргументов и непрерывно дифференцируемы по заданы начальные и конечные условия; управление и принадлежит некоторой замкнутой области

Тогда задачу определения оптимальных управлений можно сформулировать так: среди всевозможных допустимых управлений которые переводят фазовое состояние объекта из положения в положение найти такое управление, при котором функционал

принимает минимальное значение.

В случае, когда функционал будет

и задача определения оптимального управления будет обозначать выбор таких управлений, которые обеспечивают минимальное время перехода из начального положения в конечное

Если к фазовым координатам добавить еще одну координату у о определяемую из уравнения

где — подынтегральная функция (XIX.4), то сформулированная задача сводится к определению такого решения системы дифференциальных уравнений

когда фазовая координата достигает наименьшего значения при а другие координаты удовлетворяют заданным начальным и конечным условиям.

Непосредственно из формулировки задачи в случае автономности системы вытекают следующие свойства оптимальных управлений.

При сдвиге характеристики управления вдоль оси времени свойства управлений не меняются (рис. т. е. если управление переводит фазовую точку из состояния в состояние и придает функционалу значение то управления при любом действительном также переводят фазовую точку из состояния в состояние и функционал принимает то же значение

Далее, пусть задана конечная система точек фазового пространства и существует управление которое переводит фазовую точку из состояния в состояние и придает значение функционалу тогда существует управление переводящее фазовую точку из состояния в положение При этом функционал принимает

Рис. XX.4. Функция оптимального управления для стационарных систем со сдвигом во времени

Рис. XX. 5. Иллюстрация свойств оптимального управления

значение Из перечисленных свойств следует, что всякий отрезок оптимальной траектории (аналогично для оптимального управления) является также оптимальной траекторией.

Предположим, что является оптимальным управлением, переводящим фазовую точку из положения в положение а соответствующее этому управлению является оптимальной траекторией. Пусть значения функционала (XX.4) на отрезках оптимальной траектории при соответственно равны (рис. XX.5). В этом случае при управлении функционал (XX.4) принимает значение

Предположим, что управление на отрезке не оптимально; тогда существует управление которое переводит фазовую точку из положения в положение и при этом функционал (XX.4) имеет значение Отсюда следует, что существует новое управление, переводящее фазовую точку из положения в положение и придающее функционалу (XX.4) значение Это противоречит первоначальному условию, что на отрезке оптимально.

Решение поставленной задачи дает теорема — принцип максимума Л. С. Понтрягина, доказательство которой приводится в работе [58]. Прежде чем сформулировать эту теорему, рассмотрим, кроме основной системы дифференциальных уравнений (XX.6), системы уравнений относительно дополнительных переменных

Если на всем отрезке определены управление и траектория то система (XX.7) в силу линейности и однородности допускает единственное решение при любых начальных условиях для Решением системы (XX.7) являются непрерывные функции имеющие всюду непрерывные производные по кроме конечного числа точек, где имеет место разрыв управления

Системы уравнений (XX.6) и (XX.7) объединяются одной записью при введении функции переменных называемой гамильтонианом.

Легко проверить, что системы уравнений (XX.6) и (XX.7) с помощью функции объединяются в одну гамильтонову систему:

где

При фиксированных значениях функция является функцией параметра Обозначим точную верхнюю грань значений функции через

Если точная верхняя грань значений функции достигается в некоторой точке области управления то является максимальным значением функции при заданных и у.

Пусть существует такое допустимое управление при котором траектория проходит в момент времени через начальную точку и в момент времени через точку где произвольное число.

Сформулируем теперь следующую теорему.

Теорема 1 (принцип максимума). Для оптимальности управления и траектории необходимо существование такой ненулевой непрерывной вектор-функции соответствующей функциям и что:

1) при любом на отрезке функция переменного и достигает в точке максимума:

2) в конечный момент времени выполняются соотношения

Кроме того, если величины удовлетворяют системе уравнений (XX.9), (XX.10) и условию 1), то функции переменного являются постоянными, и условие 2) выполняется в любой момент времени на отрезке

Аналогичное необходимое условие получается из приведенной теоремы для оптимальности по быстродействию. В этом случае и функция имеет вид

Поскольку уравнение (XX.9) при не нужно, то гамильтонова система будет иметь вид

где

Гамильтониан запишем в виде

Верхнюю грань значений функции при фиксированных значениях снова обозначим ); тогда на основании соотношения

Условия (XX. 12) и (XX.13) будут иметь вид

Принцип максимума дает необходимые условия оптимальности, поэтому если некоторая траектория удовлетворяет принципу максимума, то это, вообще говоря, еще не значит, что найдено оптимальное решение. В ряде случаев выделение оптимальных решений требует дополнительных условий.

Из всех фазовых траекторий (решений), начинающихся в точке и заканчивающихся в точке принцип максимума позволяет выделить отдельные траектории, которые удовлетворяют условиям

В формулировке принципа максимума имеется неизвестных функций:

Следовательно, для решения задачи нужно иметь начальных значений для решения системы дифференциальных уравнений (XX.9), (XX. 10) и дополнительных соотношений для определения .

Рассмотрим равенство (XX. 12). Очевидно, что из него получается соотношений между неизвестными функциями.

Действительно, если точка является внутренней точкой области то для выполнения условия (XX. 12) необходимо обращение в нуль частных производных:

Если точка лежит на -мерной грани области то должно выполняться условие принадлежности точки этой грани, что дает одно соотношение, и должны обращаться в нуль частные производные по всем направлениям в этой грани, т. е. еще будет соотношений. Аналогично будет и для области с меньшим числом граней. Таким образом, из условий (XX.9), (XX. 10), (XX. 12), (XX. 13) все неизвестные функции могут быть найдены, если заданы начальных условий.

Поскольку функции определены с точностью до общего множителя, функции однородны и один из параметров связан условием то остается только начальных условий. Этими параметрами нужно распоряжаться так, чтобы траектория при заданном проходила через точку и при каком-то проходила через точку Число также является определяемым параметром. Условие прохождения траектории через точки дает соотношений.

Например, если принципу максимума удовлетвбряет только одна траектория и по техническим соображениям оптимальная траектория поставленной задачи должна существовать, то найденное решение и является оптимальным.

<< Предыдущий параграф

Следующий параграф >>

Оглавление