3.3.2. РЕШЕНИЕ ЗАДАЧИ РЕГУЛИРОВАНИЯ
Решим задачу построения детерминированного оптимального регулятора с помощью обычных методов вариационного исчисления. Для этого целесообразно переписать критерий (3.45) в форме
где — неотрицательно определенная симметрическая матрица
Предположим, что существует входная переменная, которая минимизирует критерий. Обозначим эту переменную через Рассмотрим теперь входную переменную
где — произвольная функция времени, произвольное число. Выясним, каким образом изменение входной переменной нлияет на критерий (3.65). Вследствие изменения входной переменной будет изменяться состояние, например от (оптимальное поведение) до
Определим . Решение уравнения (3.68) относительно должно удовлетворять дифференциальному уравнению состояния
(3.42), в котором выбирается в соответствии с выражением (3.67). В результате получим
Поскольку оптимальное решепие также должно удовлетворять дифференциальному уравнению состояния, имеем
Подстановка (3.69) и (3.70) и исключение дает
Поскольку начальное состояние не изменяется, если входная переменная изменяется в диапазоне от до , то имеем и решение (3.71) с использованием (1.61) можно записать в виде
где — переходная матрица системы (3.71). Отметим, что не зависит от е. Теперь рассмотрим критерий (3.65). С учетом (3.67) и (3.68) можно записать
Так как — оптимальная входная переменная, вследствие изменения входной переменной в диапазоне от до значения (3.67) величина критерия может только возрасти. При этом предполагается,
что выражение (3.73) как функция должно иметь минимум при Поскольку (3.73) является квадратическим выражением относительно минимум при может существовать только в том случае, если первая производная по равна нулю при Тогда получим
Подстановка (3.72) в (3.74) после изменения порядка интегрирования и переменных дает
Введем обозначение
С учетом этого обозначения интеграл (3.75) можно записать в более компактном виде
Это соотношение справедливо для всех если
Предполагая, что является несингулярной матрицей при можно написать
Если функция известна, то это соотношение позволяет определить оптимальную входную переменную в момент
Преобразуем соотношение (3.76) для в дифференциальное уравнение. При подстановке видно, что
Дифференцируя (3.76) по получим
где использовано соотношение из теоремы 1.2, г (разд. 1.3.1):
Теперь можно составить уравнения в вариациях. Подстановка (3.79) в дифференциальное уравнение состояния дает
Совместно с (3.81) это уравнение образует систему линейных дифференциальных уравнений для компонент компонент . Назовем сопряженной переменной. Тогда граничными условиями для дифференциальных уравнений являются
и
Видно, что граничные условия удовлетворяются на противоположных концах интервала Это означает, что задача является двухточечной краевой. Чтобы решить эту задачу, запишем совместно дифференциальные уравнения (3.83) и (3.81) в форме
Рассмотрим это дифференциальное уравнение состояния линейной системы размерности с переходной матрицей . Представим эту переходную матрицу, соответствующую выражению (3.86), в виде
При таком разбиении можно выразить состояние в промежуточный момент времени t через переменную состояния и сопряженную переменную в конечный момент времени следующим образом:
С учетом конечного условия (3.85) имеем
Аналогично можно написать для сопряженной переменной
Исключая из (3.89) и (3.90), получим
Выражение (3.91) показывает, что существует следующее линейное соотношение между
где
Используя (3.79), получим выражение для оптимальной входной переменной
где
Последнее выражение является решением задачи синтеза регулятора, которое получается в предположении, что оптимальное решение существует. Подытожим полученные результаты следующим образом.
Теорема 3.3. Рассмотрим задачу построения детерминированного линейного оптимального регулятора. Тогда оптимальную входную переменную можно задать с помощью линейного закона
где
Матрица определяется выражением
где получаются путем разбиения переходной матрицы дифференциального уравнения состояния
где
Эта теорема дает решение задачи в форме линейного закона. Закон управления автоматически задает оптимальную входную переменную для любого начального состояния. Интерпретация с
Рис. 3.3. Блок-схема оптимального линейного регулятора с обратной связью.
помощью блок-схемы дана на рис. 3.3, где наглядно показан замкнутый характер решения.
Постановка задачи регулирования, данная в определении 3.2, конечно, не обязательно предполагает замкнутую форму решения. Можно также, как и раньше, получить разомкнутое решение. Выражение (3.89) в момент сводится к виду
Разрешая (3.101) относительно и подставляя результат в (3.90), подучим
На основе (3.79) имеем
Это соотношение описывает программное изменение входной переменной для данного Соответствующее изменение состояния определяется при подстановке полученпого из (3.101), в (3.89):
С учетом преимуществ замкнутого управления, рассмотренных в гл. 2, для практической реализации, конечно, предпочтительнее замкнутая форма решения (3.96) в отличие от разомкнутой формы (3.103). В разд. 3.6, в котором рассматривается задача построения стохастического регулятора, показано, что обратная связь по состоянию является не только предпочтительной, но и просто необходимой.
Пример 3.5. Стабилизация угловой скорости
Задача стабилизации угловой скорости из примера 3.3 (разд.
3.3.1) является наиболее простым нетривиальным применением теории, рассмотренной в этом разделе. Совместные уравнения (3.99) для переменных состояния и сопряженных переменных теперь имеют вид
Для этой системы дифференциальных уравнений можно определить переходную матрицу
где
Чтобы упростить обозначения, представим переходную матрицу в виде
Из (3.103) и (3.104) следует, что в разомкнутой форме оптимальная входная переменная и состояние определяются соотношениями
На рис. 3.4 показаны оптимальные траектории и изменение оптимальной входной переменной для различных значений весомого коэффициента При этом использовались следующие значения
Рис. 3.5. Поведение переменной состояния и нходного воздействия в задаче стабилизации угловой скорости при различных значениях
несколько большей амплитуды входной переменной в конце интервала.
Предположим теперь, что отклонения начального состояния не превышают а амплитуда входной переменной ограничена величиной Тогда на рис. 3.4 и 3.5 следует, что рациональная величинар составляет около 1000. Величина оказывает влияние практически лишь в конце интервала времени
Рассмотрим теперь решение в форме обратной связи. Из теоремы 3.3 следует, что оптимальные траектории рис. 3.4, 3.5 можно получить с помощью закона управления
где переменный скалярный коэффициент определяется выражением
На рис. 3.6 показано изменение коэффициента соответствующее