Главная > ТЕОРИЯ УСТОЙЧИВОСТИ ДВИЖЕНИЯ (И.Г.МАМКИЕ)
<< Предыдущий параграф
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

Итак, для решения задачи II об оптимальной стабилизации следует попытаться найти функции $V^{0}$ и $u_{j}^{0}$, удовлетворяющие условиям теоремы IV. При этом необходимо обеспечить выполнение равенства (109.6), которое является уравнением в частных производных относительно искомой функции $V^{0}$. Уравнение (109.6) надо разрешить с учетом дополнительного условия (109.7). В результате получается достаточно трудная задача. Однако, как и в случае общей задачи об устоичивости движения, где также проблема эффективного построения функций Ляпунова весьма нелегка, можно указать некоторые типы уравнений (109.1), для которых функция $V^{0}$ строится в замкнутой форме. Отыскание этих типов уравнений и построение соответствующих функций $V^{0}$ облегчаются известными результатами теории устойчивости движения. В частности, для линейных систем, как и в обычных задачах устойчивости, полезным аппаратом исследования являются функции $V^{0}$ в виде квадратичных форм.

Функции $V^{0}\left(t, x_{1}, \ldots, x_{n}\right)$, удовлетворяющие условиям теоремы IV, будем называть оптимальными бункциями Ляпунова, отвечающими соответствующсй задаче II об оптимальной стабилизации.

Теорема IV может обобщаться в различных направлениях. Если речь идет о проблеме оптимальной стабилизации в целом (см. стр. 480), то в формулировке теоремы IV достаточно потребовать выполнения соотношений (109.6), (109.7) при всех $x_{s}$ ( $-\infty<x_{s}<+\infty$, $s=1, \ldots, n$ ) и добавить условия, обеспечивающие устойчивость движения $x_{s}=0$ в целом. Эти условия указаны в примечании к стр. 38. Поэтому мы не будем приводить здесь соответствующую полную формулировку теоремы IV в этом случае. Tеорема IV также сохраняет свою силу и в тех случаях, когда управляющие воздействия стеснены дополнительными неравенствами (например, $\left|u_{j}\right| \leqslant 1$ ). В таких случаях следует лишь погребовать, чтобы функция $V^{0}$ удовлетворяла неравенству (109.7) при всех значениях $u_{j}$, стесненных заданными ограничениями. Можно, наконец, ослабить условия определенной положительности функции $\omega\left(t, x_{1}, \ldots, x_{n} ; u_{1}, \ldots, u_{r}\right)$, заменив его условием знакоположительности при дополнительных ограничениях в духе критерия асимттотической устойчивости, данного в приложении III. Изменения, которые при этом следует внести в формулировку теоремы IV, очевидны, и мы на них здесь не останавливаемся.

B теореме IV естественно предполагается, что функция $V^{0}\left(t, x_{1}, \ldots, x_{n}\right)$ имеет в области (109.2) непрерывные частные производные $\frac{\partial V^{0}}{\partial t}, \frac{\partial V^{0}}{\partial x_{s}}(s=1, \ldots, n)$. Для задач оптимального управления, однако, интересны случаи, когда это предположение не выполняется при отдельных значениях $t$ и $x_{s}$, заполняющих, может быть, некоторые поверхности. Критерий оптимальности, подобный теореме IV, но работающий с применением таких не гладких функций $V^{0}\left(t, x_{1}, \ldots, x_{n}\right)$, разработан В. Г. Болтянским $\left.{ }^{1}\right)$.

В заключение этого параграфа сделаем еще несколько кратких замечаний о связи теоремы IV с общими методами вариационного исчисления и, в частности, с известными методами математической теории оптимальных процессов.

Критерий оптимальности воздействий $u_{j}^{0}$, который выражается равенством (109.6) и неравенством (109.7), соответствует известному методу в вариационном исчислении, опирающемуся на теорию распространения возмущений ${ }^{2}$ ). Здесь, однако, в отличие от наиболее распространенной формы необходимых условий экстремальности, критерий приведен в форме достаточных условий минимума интеграла (107.1). При этом условия теоремы IV одновременно обеспечивают выполнение предельного соотношения $\lim x_{s}(t)=0$ при $t \rightarrow \infty$. Такая формулировка соответствует характеру основных теорем второго метода Ляпунова исследования устоћчивости движения. Поэтому она и выбрана нами здесь. Естественным результатом отмеченной связи теоремы IV с методами классического вариационного исчисления является тот факт, что соотношение (109.6) имеет форму уравнения в частных производных вида известного уравнения Гамильтона – Якоби.

Фундаментальным методом исследования задач об оптимальном управлении является метод, основанный на принципе максимума Л. С. Понтрягина ${ }^{3}$ ). В теории оптимальных процессов, развитой Л. С. Понтрягиным и его сотрудниками В. Г. Болтянским, Р. В. Гамкрелидзе и Е. Ф. Мищенко, оптимальное управление $u_{j}$ ищется в виде функции только от времени $u_{j}=u_{j}^{0}(t)$ (отдельно для каждых фиксированных начальных условии $x_{s}\left(t_{0}\right)$ ).

Для задачи, аналогичной задаче II, но состоящей в определении управления $u_{j}$ в форме $u_{j}=u_{j}^{0}(t)$, принцип максимума утверждает, что на оптимальном движении $x_{s}^{0}[t]$ системы (109.1), порожденном управлением $u_{j}^{0}(t)$, обязательно выполняется условие
\[
\begin{array}{l}
H\left[\psi_{0}(t), \ldots, \Psi_{n+1}(t) ; t, x_{1}^{0}[t], \ldots, x_{n}^{0}[t] ; u_{1}^{0}, \ldots, u_{r}^{0}\right] \geqslant \\
\geqslant H\left[\Psi_{0}(t), \ldots, \psi_{n+1}(t) ; t ; x_{1}^{0}[t], \ldots, x_{n}^{0}[t] ; u_{1}, \ldots, u_{r}\right],
\end{array}
\]
1) Болтянский В. Г., Достаточные условия оптимальности и обоснование метода динамического программирования. Изв. АН СССР, серия математическая, т. XXVIII, № 3, 1964.
2) См., например, монографию: Гельфанд И. М., фомин С. В., Вариационное исчисление, М., Физматгиз, 1961.
3) См. монографию Л. С. Понтрягина и др., упомянутую в сноске на cтp. 475 .

каковы бы ни были числа $u_{1}, \ldots, u_{r}$. Здесь величина $H$ определена равенством
\[
\begin{array}{l}
H\left[\psi_{0}, \ldots, \psi_{n+1} ; t ; x_{1}, \ldots, x_{n} ; u_{1}, \ldots, u_{r}\right]= \\
=\sum_{i=1}^{n} \psi_{i} X_{i}\left(t, x_{1}, \ldots, x_{n} ; u_{1}, \ldots, u_{r}\right)+ \\
\quad+\psi_{n+1}+\omega\left(t ; x_{1}, \ldots, x_{n} ; u_{1}, \ldots, u_{r}\right) \psi_{0},
\end{array}
\]

а величины $\psi_{i}(t)$ являются некоторым частным решением системы
\[
\left.\begin{array}{rl}
\frac{d \psi_{i}}{d t} & =-\sum_{j=0}^{n} \frac{\partial X_{j}}{\partial x_{i}} \psi_{j} \quad(i=0, \ldots, n), \\
\frac{d \psi_{n+1}}{d t} & =-\sum_{j=0}^{n} \frac{\partial X_{j}}{\partial t} \psi_{j},
\end{array}\right\}
\]

где $X_{0}=\omega$ и $X_{n+1}=1$. При этом на оптимальном движении $x_{s}^{0}[t]$ величина $H$ остается постоянной, т. е.
\[
\begin{array}{l}
H\left[\Psi_{0}(t), \ldots, \Psi_{n+1}(t) ; t ; x_{1}^{0}[t], \ldots, x_{n}^{0}[t] ; u_{1}^{0}(t), \ldots, u_{r}^{0}(t)\right]=0 \\
\text { при } t \geqslant t_{0} \text {. } \\
\end{array}
\]

Связь принципа максимума с теоремой IV определяется следующим обстоятельством: можно проверить, что при выполнении условий теоремы IV на движении $x^{0}[t]$, порожденном оптимальным управлением $u_{j}^{0}[t]=u_{j}^{0}\left(t, x_{1}^{0}[t], \ldots, x_{n}^{0}[t]\right)$, справедливы равенства
\[
\begin{aligned}
\psi_{s}(t) & =-\frac{\partial V^{0}\left(t, x_{1}^{0}[t], \ldots, x_{n}^{0}[t]\right)}{\partial x_{s}} \quad(s=1, \ldots, n), \\
\psi_{n+1}(t) & =-\frac{\partial V^{0}\left(t, x_{1}^{0}[t], \ldots, x_{n}^{0}[t]\right)}{\partial t}, \\
\psi_{0} & =-1 .
\end{aligned}
\]

Но в таком случае понятно, что равенство (110.4) и условие (110.1) имеют тот же смысл, что и равенство (109.6) и неравенство (109.7), соответственно. Подчеркнем, однако, еще раз, что принцип максимума указывает необходимые условия оптимальности управления $u_{j}=u_{j}^{0}(t)$, в то время как теорема IV дает дост $a$ точные условия для оптимального управления $u_{j}$ в форме $u_{j}=$ $=u_{j}^{0}\left(t, x_{1}, \ldots, x_{n}\right)$.

Заметим, наконец, что в случае установившихся движений $x_{s}=0$, т. е. в случаях, когда функции $X_{s}$ и $\omega$ не зависят явно от времени, оптимальную функцию Ляпунова $V^{0}$ и оптимальное управление $u_{j}^{0}$ также следует искать в виде функций, не зависящих явно от времени, т. е. $V^{0}=V^{\lrcorner}\left(x_{1}, \ldots, x_{n}\right), u_{j}^{0}=u_{j}^{0}\left(x_{1}, \ldots, x_{n}\right)(j=1, \ldots, r)$.

Categories

1
Оглавление
email@scask.ru