ГЛАВА XX. СИНТЕЗ ОПТИМАЛЬНЫХ СИСТЕМ АВТОМАТИЧЕСКОГО РЕГУЛИРОВАНИЯ
1. Задача регулирования. 2. Принцип максимума. 3. Теорема о числе переключений. 4. Примеры применения принципа максимума. 5. Метод динамического программирования, 6. Синтез непрерывных оптимальных систем.
Рассмотренные в гл. XVII—XIX методы синтеза систем автоматического регулирования были связаны с получением корректирующих устройств, обеспечивающих заданные показатели качества и точности процессов регулирования. Эти корректирующие устройства являются линейными. Используемые при таком методе синтеза критерии качества задаются во временной или частотной областях, либо косвенным путем с помощью интегральных оценок. При их синтезе не учитываются ограничения амплитуды сигналов или их мощности.
Постановка задач оптимального управления требует применения функционала качества и позволяет учитывать ограничения, налагаемые на управляющие воздействия или фазовые координаты. Задачи синтеза таких систем решаются с помощью принципов максимума или метода динамического программирования. В этих случаях корректирующие устройства (или законы управления) являются существенно нелинейными. Аналитические методы решения таких задач хорошо разработаны для уравнений объектов регулирования не выше второго порядка. Решение оптимальных задач с объектами регулирования выше второго порядка встречает большие вычислительные трудности, оно может быть получено с привлечением цифровых вычислительных машин.
Перейдем к конкретному рассмотрению задач оптимального управления объектами автоматического регулирования. Прежде всего оценим различные постановки задачи управления.
1. ЗАДАЧИ РЕГУЛИРОВАНИЯ
Переход объекта регулирования из одного состояния в другое можно осуществлять различными способами. В связи с этим возникает задача выбора такого способа регулирования, который с определенной точки зрения окажется наиболее выгодным. Состояние объекта задается в каждый момент времени фазовыми координатами которые меняются с течением времени. Движением объекта можно управлять с помощью функций
Нетрудно себе представить движущийся объект, снабженный «рулями», положение которых можно изменить в допустимых пределах. Предполагается, что, зная состояние фазовых координат объекта в начальный момент времени и выбрав команды управления можно однозначно определить поведение объекта для любого времени
В теории автоматического регулирования управляющие функции принято называть входными переменными, а фазовые координаты — переменными состояния системы регулирования, относительно которых задача регулирования может быть сформулирована следующим образом: в начальный момент времени объект регулирования находится в фазовом состоянии необходимо выбрать такие команды с помощью которых объект перейдет в заданное конечное состояние (рис. XX. 1).
Поскольку в общем случае (см. гл. IX) переменные состояния системы не являются ее выходными координатами, то для корректного решения за
Рис. XX.1. Траектория изменения фазового состояния объекта регулирования
Рис. XX.2. Структурная схема системы автоматического регулирования с регулятором
Рис. ХХ.3. Область изменения функции управления
задачи регулирования необходимо наряду с регулятором ввести в контур управления измерительное устройство, на вход которого подаются выходные координаты объекта регулирования, а с его выхода снимаются переменные состояния и относительно них регулятор формирует управления поступающие на вход объекта (рис. XX.2).
Закон управления можно выбрать из различных условий. В частности, его можно задать таким образом, чтобы переходный процесс был в некотором смысле оптимальным, например, чтобы энергия, необходимая для перехода системы из одного состояния в другое, была минимальной. Если управляющие функции выбраны из условия минимального времени перехода, то такие процессы называются оптимальными по быстродействию. Как правило, параметры подчинены ограничениям. Естественно считать, например, что тяга двигателя не может быть как угодно большой по величине.
Будем полагать, что в пространстве переменных задано некоторое множество и управляющие параметры в каждый момент времени принимают лишь такие значения, чтобы точка принадлежала множеству Множество называют областью управления.
Для технических задач наиболее часто встречаются ограничения вида
В этом случае множеству соответствует -мерный параллелепипед; например, при область управления представляет собой прямоугольник (рис. XX.3).
В более общем случае имеем
и множество представляет собой выпуклый многогранник.
Следует отметить, что при условиях (XX.1) и (XX.2) множество является замкнутым, т. е. параметры могут принимать значения при любом как внутри области так и на ее границе.
Поскольку есть множество в пространстве параметров каждое управление является векторной функцией на отрезке значения которой находятся в области управления На управление накладываются условия кусочной непрерывности и кусочной дифференцируемости. Эти управления называют допустимыми, т. е. для таких управлений каждый компонент непрерывен для всех рассматриваемых за исключением лишь конечного числа точек, где функция может претерпевать разрывы первого рода. Кусочно-непрерывные управления являются безынерционным способом управления (например, рулей), поскольку значения в момент разрыва могут мгновенно перескакивать из одной точки области управления в другую.