Глава 4. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
§ 12. Оптимальное управление в системах с ограниченными ресурсами
1. Вариационные задачи в теории управления.
В § 11 при рассмотрении вопросов управляемости на управляющие силы не накладывались априорные ограничения. Равным образом считались допустимыми любые возможные (при выборе тех или иных управляющих сил) законы изменения во времени фазовых координат системы.
В действительности, однако, ресурсы управляемой системы ограничены. Так, например, возможны ограничения модуля управляющей силы, мощности источника управления и др. По тем или иным причинам может также оказаться, что допустимые отклонения некоторых фазовых координат системы ограничены и т. д.
Выбор закона управления (то есть закона изменения управляющих сил), с учетом указанных выше ограничений, определяется целью управления. В общем случае целью управления можно считать достижение экстремума некоторого функционала, который характеризует собой критерий оптимальности системы
(12.1)
Здесь - -мерный вектор, элементы которого являются фазовыми координатами системы, — -мерный вектор, элементы которого являются входными сигналами, которые должна воспроизводить (или преобразовывать заданным образом) система, — -мерный вектор, элементы которого являются управляющими силами, — время.
Функционал Q является числом, зависящим от вида вектор-функций . Так, например, функционал Q может иметь вид
(12.2)
где — некоторая фиксированная величина. Функционал Q, зависящий согласно (2) от вида функций на интервале времени является мерой качества воспроизведения управляемой системой входного векторного сигнала .
Во многих задачах требуется, чтобы траектория изображающей точки, проходящая через две заданные в фазовом пространстве точки и где T —фиксированная величина (то есть, фазовая траектория, переводящая систему из начального состояния в некоторое заданное состояние , где Т — наперед заданный момент времени), доставляла минимум (или максимум) некоторому функционалу
где G — некоторая ограниченная скалярная функция переменных .
Вид функции определяется для каждой конкретной задачи. Так, например, если задано конечное состояние системы , но не фиксировано заранее значение конечного момента времени , а функция G имеет вид , получим, что , и условие (1) примет вид . Мы приходим, таким образом, к задаче о быстродействии, в которой надо найти такой закон управления и , удовлетворяющий наложенным на и ограничениям, при котором система была бы переведена за минимальное время Т из начального положения в заданное конечное положение .
Изложенное характеризует постановку задач теории оптимального управления. Эти задачи представляют собой вариационные задачи на условный экстремум функционалов, вид которых определяется принятым критерием оптимальности управляемой системы.