1. Рассмотрим теперь задачу отыскания управления, обеспечивающего точное или приближенное осуществление заданного процесса. Задача ставится следующим образом. Пусть дано дифференциальное уравнение
где — функции со значениями в банаховом пространстве , функция является, вообще говоря, случайной. Предположим, что в фазовом пространстве задана при ) некоторая траектория . Предполагая, что поступает некоторая информация об изменении функции , играющей роль помехи, требуется поРис. 18. добрать такое управление за счет выбора , чтобы некоторое решение уравнения (8.1) точно или приближенно осуществляло движение по траектории на заданном интервале времени. Задача может быть осложнена ограничением множества возможных значений функции ; это множество может, например, быть ограниченным, компактным, иметь конечную размерность и т. д.
Структурная схема соответствующей автоматической системы дана на рис. 18. На этом рисунке — объект регулирования, назначением которого является получение заданного режима . Чтобы осуществить этот режим вводится звено , предназначенное для выработки управления . При формировании управления используется информация об осуществляемом режиме и помехе , причем информация о последней может поступить с искажением в силу ряда причин. Например, такое искажение может наступить в силу появления запаздываний, инерционности в линии связи , ошибок измерения, случайных ошибок и т. д.
Так как управление рассматриваемой автоматической системы изменяется в соответствии с заранее заданной функциен времени , то рассматриваемая система является программной автоматической системой.
Если бы поставленная таким образом задача программного регулирования имела точное решение, то искомое управление определялось бы из уравнения
Однако уравнение (8.2) во многих случаях является неразрешимым относительно управляющей функции . Неразрешимость указанного уравнения может быть следствием ограничений, наложенных на норму функции , ограничений размерности , наличия неполной или искаженной информации о внешнем воздействии . Может случиться и так, что управление можно выбирать только из какого-либо узко очерченного класса функций, например, кусочно-постоянных функций, тригонометрических полиномов и т. д.
2. В уравнении (8.1) проведем замену ; новое уравнение будет иметь вид
где
В уравнении возмущенного движения функция определяет ошибку приближения программирующей функции, отклонение решения уравнения (8.3) от нуля совпадает с отклонением решения уравнения (8.1) от заданной функции . Основной задачей здесь является оценка в зависимости от . Эту задачу в общем виде мы рассмагривали в § 2, а для случая, когда — линейный оператор относительно , указанная задача решалась в как задача о накоплении возмущений.
Если идет речь об осуществлении заданного режима на бесконечном интервале времени , то, как нетрудно видеть, приближенное решение задачи возможно, если нулевое решение уравнения
устойчиво по отношению к постоянно действующим возмущениям, ограниченным по огношению к той метрике, в которой оценивается ошибка приближения . Теоремы 6.2 и 6.3 дают возможность оценить точность приближения программируемого режима с помощью нормы , взятой в пространствах . Теорема 6.4 позволяет получить соответствующий результат в случае осуществления периодического режима.
Если программируемый режим является разрывным, то для указанных оценок следует привлечь теоремы .
Наконец, если мы хотим осуществить случайный режим, подчеркивая стохастический характер рассматриваемых уравнений, то следует принять во внимание пример 5 из . Проведенные там рассуждения позволяют свести поставленную задачу к детерминированному случаю [114].
Из теоремы 6.5 следует, что устойчивость при постоянно действующих возмущениях гарантируется равномерной асимптотической устойчивостью нулевого решения уравнения (8.4). Отсюда возникает интересная задача.
Назовем режим устойчивым по отношению к уравнению , если нулевое решение уравнения равномерно асимптотически устойчиво. Из предыдущего ясно, что только устойчивые режимы могут претендовать на хорошее приближение при всех .
Очевидно, в случае, когда оператор линеен относительно , всякий режим будет устойчивым, если нулевое решение уравнения равномерно асимптотически устойчиво.
Таким же свойством обладают системы, рассмотренные Н. Н. Красовским [120]. Эти системы определяются тем, что для каждой из них можно указать постоянную симметричную матрицу , имеющую положительные собственные числа, и такую, что симметризованная матрица
где
,
имеет отрицательные собственные числа , удовлетворяющие неравенству во всех точках пространства, . Здесь — проекции векторной функции .
3. Рассмотрим теперь в -мерном линейном векторном пространстве дифференциальное уравнение
Здесь — -мерные векторы, — скалярные функции. Если ставится задача осуществления процесса на промежутке , то замена сведет уравнение (8.5) к уравнению
где
Пусть в области функция удовлетворяет условию Липшица
Тогда согласно теореме 2.6 решение уравнения (8.6) может быть оценено следуюшим образом:
Очевидно, чтобы решить задачу приближенного осуществления процесса , необходимо за счет выбора либо векторов , либо функций , либо тех и других, сделать векторную функцию достаточно малой по отношению к той или иной метрике.
Пусть будет
тогда будем иметь
и, следовательно, задача сводится к задаче аппроксимации функции линейным агрегатом . Указанная задача является очевидно задачей теории приближений. Проще всего такие задачи решаются в метрике , т. е. в терминах теории среднеквадратических приближений. Напомним некоторые основные положения этой теории [121].
В линейном пространстве сопоставим каждой паре элементов некоторое число , которое назовем скалярным произведением. Пусть будут выполнены следующие условия:
a)
b) ,
c) ,
d) тогда и только тогда, когда .
Норму в пространстве введем по правилу
Пространство назовем пространством Гӥльберта. Если , то элементы и будем называть ортогональными.
Систему элементов из назовем линейно независимой, если из
где — вещественные числа, следует для любого значения . Систему элементов назовем ортонормированной, если при при .
Если — система линеино независимых элементов пространства , то можно построить ортонормированную систему , элементы которой являются линенными комбинациями , и наоборот.
Пусть — некоторое -мерное подпространство пространства , т. е. подпространство, порожденное линейно независимыми элементами , и пусть -произвольный элемент пространства . Поставим задачу подбора таких чисел , чтобы величина
была наименьшей.
Такая задача всегда имеет решение и оно единственно. Если
является наилучшим приближением в указанном выше смысле, то справедливо равенство
где — любой элемент из .
Равенство (8.7) означает, что элемент — ортогонален к любому элементу из . Этот факт, очевидно, допускает простую наглядную интерпретацию, если -конечномерное векторное пространство, то в этом случае является проекцией вектора на гиперплоскость .
Беря в качестве любой из порождающих элементов из (8.7), выводим
откуда следует
Система (8.8) дает возможность найти числа . Определитель этой системы
называется определителем Грама. Если элементы линейно независимы, то определитель Грама всегда положителен. С помощью определителя Грама можно найти ошибку приближения, т. е. величину
Справедлива формула
Если система ортонормированная, то имеем
Если система ортонормированных векторов является бесконечной, то ряд
где , называется рядом Фурье. Бесконечная ортонормированная система называется полной, если не существует элемента, отличного от нуля, который был бы ортогонален к каждому элементу рассматриваемой системы.
Если пространство сепарабельно, т. е. в нем имеется счетное всюду плотное множество элементов, то в всегда существует счетная и полная ортонормированнная система элементов. Из (8.10) следует в этом случае неравенство Бесселя
Если пространство сепарабельно и полно, то ряд Фурье любого элемента по полной ортонормированной системе сходится к и имеет место равенство Парсеваля
4. Вернемся теперь снова к нашей задаче, т. е. к задаче аппроксимации векторной функции линейным агрегатом
3адача А. Подобрать векторы таким образом, чтобы ошибка
стала нацменьшей.
Здесь
— проекции вектора . Имеем
где
и задача сводится к минимизации каждой из частных ошибок . Такое разделение можно сделать потому, что выбор величин при одном значении не влияет на выбор этих величин при другом значении .
Рассмотрим пространство , элементами которого являются функции с интегрируемым квадратом на отрезке . Скалярное произведение в введем по правилу
Подпространство , теперь будет подпространством, порожденным функциями . Таким образом, ставится задача отыскания наилучшего среднеквадратического приближения функции линейным агрегатом
Согласно (8.8) для определения величин при данном значении имеем систему
Для определения векторов согласно (8.11) можем получить систему
Квадрат ошибки приближения в данном случае будет равен
Задача В. При заданных векторах найти систему функций , минимизирующих .
Прежде всего следует заметить, что выбор значений функций в данный момент не влияет на выбор значенин этих функций в любой другой момент времени. Поэтому задача сводится к минимизации величины
Теперь уже в качестве гильбертова пространства следует рассматривать пространство -мерных векторов , а в качестве подпространства будет фигурировать подпространство, порожденное векторами .
Согласно (8.8) получаем систему для определения :
Здесь выражения ) означают скалярные произведения соответствующих векторов в обычном смысле.
Согласно (8.9) получим
Задача имеет простую геометрическую интерпретацию. Обозначим через плоскость, порожденную векторами . В -мерном пространстве задана кривая ; требуется найти кривую
которая имеет наименьшее среднеквадратичное отклонение от заданной кривой. Решение задачи состоит в том, что каждую точку искомой кривой мы получаем как проекцию на плоскость соответствующей точки первой кривой . Отсюда следует, что решение задачи не изменится, если в качестве порождающей системы векторов возьмем эквивалентную ей ортонормированную систему. В этом случае получим
3адача С. Найти оптимальную систему векторов и функций минимизирующих б.
Рассмотрим матрицу , элементы которой имеют вид
где — проекции вектора .
Так как матрица симметрична, то ее собстеенные числа вещественны. Более того, собственные числа матрицы неотрицательны. В самом деле, матрица является матрицей знакоположительной квадратичной формы
Отсюда согласно § 10 первой главы выводим, что наименьшее собственное число , как минимум формы на единичной сфере, должно быть неотрицательным. Расположим собственные числа матрицы в порядке убывания
Каждому собственному числу соответствует по крайней мере один собственный вектор . Известно ([5], стр. 20), что систему собственных векторов можно ортонормировать. Таким образом получим ортонормированную систему собственных векторов матрицы .
Теорема 8.1. Ортонорированная система собственных векторов матриы является оптимальной системой управляющих векторов, причем, если система управляющих бункций выбрана согласно (8.13), то
В самом деле, если система векторов ортонормирована, то согласно формуле (8.14) имеем
Необходимо систему векторов подобрать таким образом, чтобы сумма
была наибольшей. Рассмотрим первое слагаемое этой суммы:
Здесь — проекции вектора . Задача сводится к тому, чтобы найти максимум квадратичной формы при условии
Согласно первой главы искомый максимум равен наибольшему собственному числу и достигается для собственного вектора , отвечающего этому числу. Чтобы сделать максимальным следующее слагаемое,
при дополнительных условиях , нужно взять собственный вектор , отвечающий следующему собственному. числу. Согласно экстремальной теории квадратичных форм ([5]), максимум будет равен . Если , то в качестве следует выбрать среди бесконечного множества собственных векторов кратного корня вектор, ортогональный к . Пользуясь аналогичными рассуждениями, получим полное решение нашей задачи.
Так как
есть инвариант квадратичной формы , то формула (8.15) непосредственно вытекает из формулы (8.14).
Заметим теперь, что добиться точного осуществления траектории путем выбора оптимальной системы управляющих функций и управляющих векторов можно при только в том случае, если
Но это означает, что уравнение
имеет нулевой корень кратности . Условия существования такого корня имеют вид . Геометрически эти условия означают, что кривая лежит в -мерном линейном подпространстве пространства . Если же величина
не равна нулю, то она равна минимуму квадрата среднеквадратичного отклонения кривой от -мерной гиперплоскости пространства .
Таким образом, величина в данном случае является -м поперечником кривой в пространстве [122].
Для вычисления по формуле (8.15) необязательно нужно знать корни . Известно ([123], стр. 80), что
где -любой контур плоскости комплексного переменного, охватывающий только указанные корни уравнения . В частности, может быть окружностью радиуса с центром в начале координат, если известно, что . Для определения минимального количества управляющих функции, позволяющих осуществить траекторию с заданной точностью, полезно использовать принцип аргумента или какойлибо другой известный метод (например, метод Штурма) определения числа корней уравнения , лежащих в интервале . Если это число равно , то управляющих функций и управляющих векторов можно будет подобрать так, что будет иметь место неравенство . Лучшую оценку точности приближения дает в этом случае снова формула (8.15). Во всяком случае, полезно помнить, что приближение при помощи управляющих функций будет тем точнее, чем меньше будут по абслютной величине коэффициенты уравнения при степеня , не превосходящих .
5. В случае, когда интервал времени, на котором мы осуществляем заданный процесс, полубесконечен, т. е. задан неравенством , необходимо обратиться к лемме 6.2 (неравенство (6.17)) и к теореме 6.5. Если мы хотим оценивать величину по норме , то можем выбрать управляющие векторы таким образом, чтобы минимизировать
В этом случае, очевидно, при переменном векторы превращаются в векторные функции . Эти векторные функции можно сделать кусочно-постоянными, если минимизацию проводить только на интервалах , где -целое число. Задача наилучшего приближения в и в том и в другом случаях не будет решена точно, однако найденное управление может оказаться практически удовлетворительным.
6. Может случиться так, что на величину управляющих векторов наложены некоторые ограничения. В работе [124] указан способ решения задачи в этом случае. Различные другие подходы к рассматриваемой здесь задаче освещены в статьях [125-131].
В задаче осуществления процесса мы предполагали все время, что начальные точки действительной и осуществляемой траектории совпадают. Если начальное состояние не соответствует желаемому, то предварительно следует осуществлять переходный процесс [124]. Однако более перспективный способ состоит в том, что переходный процесс и процесс осуществления движения по заданной траектории производятся одновременно. В этом случае надо задать семейство переходных кривых, которое определяет поле направлений в фазовом пространстве. Это семейство может быть задано также дифференциальными уравнениями. Заданная система дифференциальных уравнений также определяет некоторое поле направлений, которое зависит от управления. Управление находится из условия минимизации в каждый момент времени квадратичного отклонения между соответствующими векторами указанных направлений [130].
Впрочем, следует заметить, что аналогичный результат получится, если управление выбирать исходя из требования максимума скорости убывания некоторой функции Ляпунова, составленной для уравнений возмущенного движения.