Главная > АСИМПТОТИЧЕСКИЕ МЕТОДЫ НЕЛИНЕЙНОЙ МЕХАНИКИ (Н. Н.МОИСЕЕВ)
<< Предыдущий параграф
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

Задачей оптимальной коррекции мы будем называть следующую задачу теории оптимального управления. Определить векторы $x(t)$ (фазовый вектор) и $u(t)$ (управление), доставляющие минимум или максимум функционалу $J(x, u)$ при следующих ограничениях:
a) дифференциальные связи
\[
\dot{x}=A x+D u
\]
б) условия на концах
\[
x(0) \in \varepsilon_{0}, \quad x(T) \in \varepsilon_{T},
\]

где $\varepsilon_{0}$ и $\varepsilon_{T}$ – некоторые заданные множества;
в) ограничения на управления
\[
u \in G_{u},
\]

где $G_{u}$ – также некоторое заданое множество. В частности, оно может быть открытым, совпадать со всем пространством, а может быть и замкнутым.

Время протекания процесса $T$ либо фиксировано, либо заранее не задано; $A$ и $D$ – это некоторые заданные матрицы, элементы которых в общем случае – функции времени.

Таким образом, задачей коррекции мы называем тот частный случай задачи оптимального управления, в котором дифференциальные связи – это линейные дифференциальные уравнения.

В этом параграфе рассмотрим тот специальный класс задач оптимальной коррекции, для которых система дифференциальных уравнений, полученных применением гринципа максимума Л. С. Понтрягина, также является линейной. Это накладывает определенные ограничения на выбор функционалов. Прежде всего условимся рассматривать только интегральные функционалы
\[
J=\int_{0}^{T} F(x, u) d t .
\]

Тогда к нашей задаче примеңим принцип максимума,

Для того чтобы вектор-функция $x(t)$ и управление $u(t)$ реализовали минимум функционала (9.4) при условиях (9.1)-(9.3), необходимо существование функции $p(t)$
\[
\dot{p}(t)=-\frac{\partial H}{\partial x},
\]

где функция Гамильтона
\[
H=(A x \cdot p)+(D u \cdot p)-F(x, u),
\]

а управление $u$ определяется из условия максимума $H$ по $u(t)$ для любых $x$ и $p$, т. е. $u=u(x, p)$.

Таким образом, задача оптимальной коррекции сводится к решению некоторой краевой задачи для системы уравнений (9.1) и (9.5). Линейность системы (9.1) не гарантирует в общем (лучае линейности системы (9.1) и (9.5). Эту систему уравнений мы условимся называть $\pi$-системой.

Если размерность вектора $x$ равна $n$, то размерность $\pi$-системы равна $2 n$.

Нетрудно убедиться, что существует широкий класс задач, для которых $\pi$-система является линейной. Приведем некоторые примеры.
Задача А. Управление с квадратичным функционалом
\[
J=\int_{0}^{T}(C u-u) d t,
\]

где $C$ – некоторая матрица. Задача управления с квадратичным функционалом довольно часто встречается в технике. Интересным примером является задача оптимальной коррекции космического аппарата, снабженного идеально регулируемым ядерным двигателем *).
Составим функцию $H$
\[
H=(A x \cdot p)+H^{*},
\]

где
\[
H^{*}=(D u \cdot p)-(C u \cdot u) .
\]

Считая, что $G_{u}$ совпадает со всем пространством, мы легко найдем $u(t)$ из условия максимума $H$ по $u$. Это условие можно записать следующим образом:
\[
\tilde{D} p=W u
\]
*) О постановке подобных задач см. подробнее Г. Л. Гродзовски й, Ю. Н. Иванов, В. В. Токарев, Механика космического полета с малой тягой, изд. «Наука», Москва, 1966.

где $W=C+C \mathscr{C}$ ( $\tilde{D}$ и $\tilde{C}$ обозначают транспонированные матрицы). Таким образом,
\[
u=W^{-1} \tilde{D} p \text {. }
\]

Выпишем теперь $\pi$-систему
\[
\left.\begin{array}{l}
\dot{x}=A x+B p, \\
\dot{p}=-\tilde{A} p,
\end{array}\right\}
\]

где
\[
B=D W^{-1} \tilde{D} .
\]

Условия трансверсальности нам дадут $2 n$ краевых условий. Например, задача перехода системы из точки в точку за время $T$ нам даст следующее условие типа (9.2):
\[
x(0)=x_{0}, \quad x(T)=x_{T} .
\]

Задача Б. Рассмотрим задачу Майера: определить минимум функционала
\[
J=(e \cdot x(T)),
\]

где $\boldsymbol{e}$-некоторый заданный вектор.
Если $G_{u}$ совпадает со всем пространством, то рассматриваемая задача смысла не имеет. Если $G_{u}$ – замкнутое множество, то управление носит релейный характер и задача оказываегся нелинейной. Однако подобные задачи являются некорректными в смысле А. А. Тихонова. Это свойство задачи состоит в том, что малым изменениям функционала соответствуют большие изменения управляющей функции $u(t)$. Вместо задачи Б будем рассматривать задачу $b^{\prime}$ : определить минимум функционала
\[
J=(e \cdot x(T))+\alpha \int_{0}^{T}(C u \cdot u) d t .
\]

Для задачи (9.11) л-система будет линейной.
Составим функцию
\[
\begin{aligned}
H & =(A x \cdot p)-(e \cdot A x)+H^{*}, \\
H^{*} & =(D u \cdot p)-\alpha(C u \cdot u)-(e \cdot D u) .
\end{aligned}
\]

Теперь управление может быть определено из уравнения
\[
\tilde{D}(p-e)=\alpha W u .
\]

Выпишем $\pi$-систему
\[
\left.\begin{array}{l}
\dot{x}=A x+B p-B e, \\
\dot{p}=-\dot{A} p,
\end{array}\right\}
\]

где
\[
B=\frac{1}{\alpha} D W^{-1} \tilde{D}
\]

Заменой $p-e=q$ задача $\mathrm{D}^{\prime}$ приводится к задаче А.
Можно привести еще целый ряд подобных примеров, показывающих, что класс вариационных задач, сводящихся к исследованию $\pi$-системы типа (9.8), достаточно широк для того, чтобы стать объектом специального исследования.

Если матрицы $A$ и $B$ постоянные, то общий интеграл системы (9.8) может быть записан в явном виде. Поэтому решение краевой задачи (удовлетворение условий трансверсальности) и вычисление управляющего воздействия сведется к решению некоторой системы линейных алгебраических уравнений.

Если коэффициенты матриц $A$ и $B$ зависят от времени, то задача становится значительно бслее сложной. В общем виде ее решение может быть получено только численными методами.

Случай системы с постоянными коэффициентами был предметом многочисленных исследований и является хорошо изученным. Методы, развитые в этой главе, позволяют столь же детально изучить тот случай, когда матрица $A$ и $B$ зависят от медленного времени $\varepsilon t=\tau$ :
\[
A=A(\tau), \quad B=B(\tau) .
\]

Этот случай достаточно распространен и заслуживает внимания. K нему сводятся, например, многие задачи коррекции орбит искусственных спутников, задачи управления в экономических системах и т. д. Изучению этого случая и будет посвящен этот параграф.
В системе (9.8) сделаем замену
\[
\tau=\varepsilon t
\]

и положим $\lambda=1 / \varepsilon$.
После замены (9.13) система (9.8) примет следующий вид:
\[
\left.\begin{array}{l}
\frac{d x}{d \tau}=\lambda A(\tau) x+\lambda B(\tau) p, \\
\frac{d p}{d \tau}=-\lambda \tilde{A}(\tau) p .
\end{array}\right\}
\]

Система (9.14) является частным случаем систем, содержащих большой параметр, – системой первого ранга. Для построения ее общего интеграла могут быть использованы асимптотические мегоды.

Форма асимптотических представлений общего интеграла зависит от структуры элементарных делителей матрицы $\Gamma-\mu E$
\[
\Gamma=\left\|\begin{array}{rr}
A & B \\
0 & -\tilde{A}
\end{array}\right\| .
\]

Поэтому сначала мы должны установить некоторые свойства матрицы Г в зависимости от свойств матриц $A$ и $B$. Кроме того, для удобства дальнейших исследований приведем систему (9.14) к тому или другому каноническому виду.

Заметим в заключение, что систему (9.14) можно переписать в виде
\[
\left.\begin{array}{l}
\frac{d x}{d \tau}=\lambda
abla_{p} H+B_{p}, \\
\frac{d p}{d \tau}=-\lambda
abla_{x} H,
\end{array}\right\}
\]

где
\[
H=(A x \cdot p), \quad
abla_{z} \varphi=\frac{\partial \varphi}{\partial z} .
\]

Рассмотрим некоторые свойства матрицы $\Gamma$ :
\[
\Gamma=\left\|\begin{array}{cc}
A & B \\
0 & -\tilde{A}
\end{array}\right\| .
\]

Лемма. Совокупность корней характеристического уравнения $|\Gamma-\mu E|=0$ представляет собой объединение совокупностей корней уравнений $|A-\mu E|=0$ и $|A+\mu E|=0$.

Доказательство. В самом деле, по теореме Лапласа, разлагая определитель $|\Gamma-\mu E|$ по всевозможным минорам первых $n$ столбцов, получим
\[
\begin{aligned}
|\Gamma-\mu E|=|A-\mu E| \cdot|-\tilde{A}-\mu E| & =-|A-\mu E||\tilde{A}+\mu E|= \\
& =-|A-\mu E||A+\mu E|,
\end{aligned}
\]

откуда и следует утверждение леммы.
Отметим некоторые особенности спектра матрицы $\Gamma$, вытекающие из уравнения (9.16).
1) Пусть $\mu_{s}$ – корень уравнения $|A-\mu E|=0$ кратности $k$. Тогда – $\mu_{s}$ является корнем уравнения $|A+\mu E|=0$ той же кратности. Если при этом ни один из корней уравнения $|A-\mu E|=0$ не является корнем уравнения $|A+\mu E|=0$, то мы будем говорить, что имеет место условие $a$.
2) Пусть условие $\alpha$ не выполнено. В этом случае среди корней $\mu_{s}$ характеристического уравнения $|A-\mu E|=0$ найдутся такие корни $\mu_{s_{1}} \boldsymbol{\mu}_{s_{2}}$ кратности $k$ каждый, что
\[
\mu_{s_{1}}= \pm \mu_{s_{2}} .
\]

Тогда $\mu_{s_{1}}$ и $\mu_{s_{2}}$ будут корнями характернстического уравнения $|\Gamma-\mu E|=0$ кратности $2 k$ каждый.

Вопрос о приведении матрицы $\Gamma$ к нормальной жордановой форме в общем случае является сложным, так как структура этой формы определяется не только свойствами матрицы $A$, но и свойствами матрицы $B$. Покажем на некоторых простых примерах, как можно осуществить такое приведение.
1) Пусть $\mu_{s}$ – различные корни уравнения $|A-\mu E|=0$ и свойство $\alpha$ выполнено $\left(\mu_{s}
eq 0\right)$. Тогда $\Gamma$ всегда приводится к диагональному виду. Покажем, как это сделать.

Пусть $A$ уже приведена к диагональному виду. Тогда в новых переменных $\xi_{i}$ и $\eta_{i}$ имеем
\[
\left.\begin{array}{l}
\xi_{1}=\mu_{1} \xi_{1}+\sum_{i=1}^{n} d_{1 i} \eta_{i}, \\
\cdot \cdot \cdot \cdot \cdot \cdot \cdot \cdot \\
\xi_{n}=\mu_{n} \xi_{n}+\sum_{i=1}^{n} d_{n i} \eta_{i}, \\
\dot{\eta}_{i}=-\mu_{i} \eta_{l}, \\
\cdot \cdot \cdot \cdot \cdot \cdot \\
\dot{\eta}_{n}=-\mu_{n} \eta_{n},
\end{array}\right\}
\]

где
\[
\left\|d_{i j}\right\|=F^{-1} B F
\]

здесь $F$-матрица перехода от старого базиса к новому. Линейное преобразование
\[
\rho_{i}=\xi_{i}+\sum_{i=1}^{n} \frac{d_{i j}}{\mu_{i}+\mu_{j}} \eta_{j}, \quad \eta_{i}^{*}=\eta_{j}
\]

приводит матрицу системы (9.17) к диагональному виду. Действительно, имеем
\[
\dot{\rho}_{i}=\dot{\xi}_{i}+\sum_{j=1}^{n} \frac{d_{i j} \dot{\eta}_{j}}{\mu_{i}+\mu_{j}}=\mu_{i} \xi_{i}+\sum_{j=1}^{n} d_{i j} \eta_{j}-\sum_{j=1}^{n} \frac{d_{i j} \mu_{j} \eta_{i}}{\mu_{i}+\mu_{j}}=\mu_{i} \rho_{i} .
\]
2) Пусть свойство $\alpha$ не выполнено и среди корней $\mu_{s}$ уравнения $|A-\mu E|=0$ имеется пара корней $\mu_{s}, \mu_{k}$ кратности единица каждый, причем
\[
\mu_{s, k}= \pm a \quad(a
eq 0) .
\]

Матрица Г в этом случае имеет два собственных значения второй кратности каждое. При этом в зависимости от структуры матрицы $B$ матрица $\Gamma$ может приводится либо к жордановой форме, содержащей одну или две клетки второго порядка, либо к диагональному виду.
Среди уравнений системы (9.17) найдутся следующие четыре:
\[
\left.\begin{array}{l}
\xi_{s}=a \xi_{s}+\sum_{i=1}^{n} d_{s j} \eta_{j}, \\
\dot{\eta}_{k}=a \eta_{k}, \\
\xi_{k}=-a \xi_{k}+\sum_{j=1}^{n} d_{k j} \eta_{j}, \\
\dot{\eta}_{s}=-a \eta_{s} .
\end{array}\right\}
\]
a) Пусть $d_{s k}
eq 0, d_{k s}
eq 0$.

Тогда линейное преобразование
\[
\begin{array}{c}
\rho_{s}=\xi_{s}+\sum_{j=1}^{n} \frac{d_{s j} \eta_{j}}{a+\mu_{j}}, \quad \rho_{k}=\xi_{k}+\sum_{j=1}^{n} \frac{d_{k j} \eta_{j}}{a+\mu_{j}}, \\
\eta_{k}^{*}=d_{s k} \eta_{k}, \quad \eta_{s}^{*}=d_{k s} \eta_{s},
\end{array}
\]

приводит (9.18) к следующему виду:
\[
\begin{array}{c}
\dot{\rho}_{s}=a \rho_{s}+\eta_{k}^{*}, \quad \dot{\eta}_{k}^{*}=a \eta_{k}, \\
\dot{\rho}_{k}=-a \rho_{k}+\eta_{s^{\prime}}^{*} \quad \dot{\eta}_{s}^{*}=-a \eta_{s}^{*} .
\end{array}
\]

Таким образом, матрица $\Gamma$, приведенная к нормальной жордановой форме, должна содержать в этом случае две клетки второго порядка.
б) Пусть $d_{s k}=0, \quad d_{k s}
eq 0$. Тогда вместо (9.19) полагаем $\eta_{k}^{*}=\eta_{k}$. В этом случае, как нетрудно видеть, жорданова форма матрицы Г содержит одну клетку второго порядка. То же будет, если $d_{k s}=0, d_{s k}
eq 0$.
в) Если, наконец, $d_{s k}=d_{k s}=0$, то, полагая $\eta_{\varepsilon}=\eta_{k}^{*}, \eta_{s}=\eta_{s}^{*}$, приведем $\Gamma$ к диагональному виду. Этот случай имеет место, например, тогда, когда $B=\gamma E$. Тогда $\left\|d_{i j}\right\|=\gamma E$, т. е. все внедиагональные элементы равны нулю.
3) Пусть условие $\alpha$ выполнено, а среди корней уравнений $|A-\mu E|=0$ имеется корень $\mu_{1}
eq 0$ кратности два, причем старний инвариантный множитель матрицы $A-\mu E$ содержит $\left(\mu-\mu_{1}\right)^{2}$, а все остальные инвариантные множители равны единице и все $\mu_{i}(i>1)$ различны, В этом случае вместо системы (9.17) имеем

В этом случае жорданова форма матрицы Г также содержит клетки второго порядка
\[
\left\|\begin{array}{cc}
\mu_{1} & 1 \\
0 & \mu_{1}
\end{array}\right\| \text { и }\left\|\begin{array}{cc}
-\mu_{1} & 1 \\
0 & -\mu_{1}
\end{array}\right\| .
\]

Нетрудно проверить, что соответствующее линейное преобразование, приводящее Г к жордановой форме, имеет вид
\[
\rho_{i}=\xi_{i}+\sum_{j=1}^{n} \frac{d_{1 j}+a_{1 j}}{\mu_{i}+\mu_{j}}, \quad \eta_{i}^{*}=\eta_{j},
\]

где
\[
\begin{array}{l}
a_{11}=-\frac{d_{21}}{\mu_{1}}, \quad a_{i 1}=0 \quad(i \geqslant 2), \\
a_{12}=\frac{1}{\mu_{1}}\left(d_{11}-d_{22}-\frac{2 d_{21}}{\mu_{1}}\right), \\
a_{i 2}=\frac{d_{i 1}}{\mu_{1}} \quad(i \geqslant 2), \\
a_{1 j}=-\frac{d_{2 j}}{\mu_{j}} \quad(j \geqslant 3) .
\end{array}
\]

Это преобразование единственно.

Categories

1
Оглавление
email@scask.ru