1. ПРИНЦИП МАКСИМУМА КАК НЕОБХОДИМОЕ УСЛОВИЕ ОПТИМАЛЬНОСТИ
Объект управления в большинстве случаев может быть описан системой обыкновенных дифференциальных уравнений
где
— переменные, характеризующие состояние объекта в каждый момент времени [они образуют вектор
их
— управляющие сигналы, образующие вектор управления
— производные по времени от переменных состояния.
Далее предполагается, что на управляющие сигналы наложены ограничения
Действительные ограничения вида
сводятся к ограничениям (XVI.2) с помощью линейных преобразований
Для удобства записи уравнений везде, где это возможно, будем использовать векторные обозначения, т. е. обозначая
а в конечный момент времени
выполнено условие
Оказывается далее, что если функции
удовлетворяют условиям (XVI.3), (XVI.6), (XVI.7), то функция
переменного
постоянна на всем отрезке поэтому проверку соотношения (XVI.8) можно производить в любой момент
Максимум Н в условии (XVI.7) должен искаться только по управляющим сигналам V [с учетом ограничений (XVI.4)], а остальные переменные
должны считаться фиксированными (независимыми от V).
Условие (XVI.7) дает
соотношений между неизвестными функциями
Например, если точка
является внутренней точкой области управления
то эти соотношения имеют вид
соотношений будет и в случае, когда
является граничной точкой
При этом, кроме соотношений, аналогичных (XVI.9), появляются условия нахождения на границе. Следует учесть, что эти соотношения являются конечными, т. е. не содержат производных от неизвестных функций.
С учетом соотношений (XVI.3) и (XVI.6) получим систему
уравнений с
неизвестными. При этом система уравнений (XVI.3) и (XVI.6) является системой
обыкновенных дифференциальных уравнений. Так как число неизвестных равно числу уравнений, то можно ожидать, что все неизвестные функции могут быть найдены из соотношений (XVI.3), (XVI.6) и (XVI.7), если только известны начальные условия
Один из параметров
является несущественным, так как справедливость этих соотношений не нарушается, если функции
умножить на один и тот же постоянный положительный множитель.
Выбором
параметров, определяющих
следует распорядиться так, чтобы фазовая траектория в некоторый момент
проходила через конечную точку
Отсюда получаем
условий для определения неизвестного
неизвестного параметра, определяющего
Общее же число неизвестных параметров равно
т. е. числу уравнений.
Приведенные выше рассуждения показывают, что условия, получаемые с помощью принципа максимума, позволяют выделить отдельные изолированные траектории, которые могут быть оптимальными. Эти рассуждения не являются строгими, однако
для многих классов объектов справедливость их строго доказана. Более того, для большого класса объектов доказано, что условия принципа максимума являются необходимыми и достаточными, т. е. условиям (XVI.7) совместно с условиями (XVI.3) и (XVI.6) удовлетворяют только оптимальные траектории, проходящие через заданные начальную
и конечную
точки. Таким классом объектов являются линейные объекты, описываемые уравнениями
или в векторной форме
где А и В — матрицы, составленные соответственно из элементов
На управляющие сигналы наложены ограничения
Уравнениями (XVI. 10), (XVI. 12) могут быть также описаны некоторые нелинейные объекты, во входных цепях которых имеются безынерционные нелинейные элементы с насыщением. Для пояснения принципа максимума найдем функцию
:
Функция
достигает максимума, если
или -1 в зависимости от того, положительны или отрицательны суммы
Таким образом, оптимальное управление задается соотношениями
где
определяются из системы дифференциальных уравнений
Соотношение (XVI .13) показывает, что оптимальные управляющие сигналы являются релейными, с конечным числом переключений, определяемыми корнями уравнений
на интервале времени
Для линейных объектов
строго доказана достаточность условий принципа максимума для оптимальности управления, если только коэффициенты системы (XVI. 11) ограничивающие условия (XVI. 12) удовлетворяют условию общности положения.
Пусть
— вектор, параллельный произвольному ребру выпуклого многогранника
(в случае, когда
- гиперкуб (XIV.12), все составляющие вектора
кроме одной, равны нулю и
Условие общности положения заключается в линейной независимости векторов
образованных из вектора
путем
преобразования его с помощью матрицы А. Невыполнение условия общности положения означает, что хотя бы для одного ребра многогранника
эти векторы линейно зависимы, т. е. определитель
порядка, составленный из координат этих векторов, обращается в нуль. В случае ограничений (XVI. 12) число ребер
равно
и поэтому вычисляются лишь
таких определителей. Условие общности положения означает, что ни один из этих определителей не обращается в нуль.
При невыполнении условия общности положения оптимальное управление либо не существует, либо оно не единственно. В последнем случае из принципа максимума может быть извлечена информация о виде некоторых из оптимальных уравнений.
Если условие общности положения удовлетворяется, то оптимальное управление существует (при существовании допустимого управления, переводящего объект в требуемое состояние) и является единственным; оно однозначно (с точностью до значений в точках переключений) и определяется с помощью принципа максимума. При этом вычисления могут производиться в следующем порядке.
1. Следует задать некоторые начальные условия по вспомогательным координатам
. И с учетом их решить систему линейных дифференциальных уравнений с постоянными коэффициентами (XVI. 15).
2. С помощью решений системы (XVI. 15) следует образовать управляющие сигналы
3. Найти траекторию
исходящую из заданной точки
и соответствующую образованным входным сигналам. Эта траектория представляет собой решение неоднородной линейной системы обыкновенных дифференциальных уравнений (XVI. 10) с известными функциями
Если траектория
проходит через заданную конечную точку
то управляющие сигналы
по соотношению (XVI. 16) являются оптимальными и вычисления на этом заканчиваются. Если же
не проходит через заданную конечную точку, то следует задать новые значения начальных условий и вновь произвести расчеты по пунктам 1—3. При этом значения начальных условий
обеспечивающих прохождение траектории
через заданную конечную точку
могут находиться методом последовательных приближений, вытекающим из результатов Нейштадта и Итона [2].
Обозначим через Р некоторый вектор начальных условий для вспомогательных переменных
вектор начальных условий объекта, для которых управление (XVI. 15) является оптимальным при
и вреглени переходного процесса, равного Т. Вектор
может быть определен из соотношений
где
решение системы (XVI.15) при начальных условиях, определяемых соотношениями
— управляющие сигналы, образованные с помощью соотношения (XIV. 16) при
Пусть, кроме того,
— значение времени
при котором выполняется соотношение
При заданном Р уравнение (XVI. 17) имеет лишь один корень, поэтому функция
определяется однозначно.
С учетом введенных функций оказывается, что решение системы уравнений
при
приближается к значениям начальных условий вспомогательных переменных
обеспечивающих после выполнения расчетов по пунктам
оптимальное протекание процессов из заданного начального состояния
в заданное конечное состояние
Решение уравнения (XVI. 19) может осуществляться приближенным методом путем замены производной
. В результате получается уравнение для последовательных приближений:
Последовательность шагов
следует выбирать, исходя из соотношения
где
наименьшее неотрицательное целое число, для которого вектор
удовлетворяет неравенству
При этих условиях доказана сходимость вектора Р к искомому вектору начальных условий для вспомогательных координат. Функции
стоящие в правой части уравнений (XVI.20), вычисляются в помощью соотношения (XVI. 17) для значений
возрастающих от 0 до
определяемого из равенства (XVI. 18).
Рассмотренный порядок вычислений справедлив для линейного объекта, описываемого произвольной системой дифференциальных уравнений вида (XVI. 10); поэтому вычисления достаточно сложны. Для конкретных типов объектов вычисления по определению оптимальных управлений могут быть значительно упрощены.
К такому классу объектов принадлежат объекты с действительными корнями характеристического уравнения. В этом случае решения системы (XVI. 15) записываются в виде
где
— действительные числа.
Оптимальные управляющие сигналы (XVI. 14) в этом случае являются релейными с
переключением, так как функции
всех действительных могут лишь
раз менять знак. Знание числа переключений позволяет значительно сократить объем вычислений по определению оптимальных управлений. Наиболее просто эти вычисления проводятся, когда на объект воздействует лишь один управляющий сигнал. Следующие параграфы главы посвящены нахождению оптимальных управлений именно для объектов с одним входом.