Главная > ТЕОРИЯ УСТОЙЧИВОСТИ ДВИЖЕНИЯ (И.Г.МАМКИЕ)
<< Предыдущий параграф
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

В этом параграфе мы изложим основную теорему второго метода Ляпунова исследования проблем оптимальной стабилизации. Эта теорема является модификацией теоремы II Ляпунова (см. стр. 195), причем учитываются соображения метода динамического программирования $\mathrm{P}$. Беллмана ${ }^{1}$ ).
Рассмотрим дифференциальные уравнения возмущенного движения
\[
\frac{d x_{s}}{d t}=X_{s}\left(t ; x_{1}, \ldots, x_{n} ; u_{1}, \ldots, u_{r}\right) \quad(s=1, \ldots, n),
\]

где функции $X_{s}$ определены в области
\[
t \geqslant 0, \quad\left|x_{s}\right| \leqslant H
\]

и удовлетворяют в этой области всем условиям, перечисленным в $\S 106$.

Как и в теореме II, нам придется рассматривать функции Ляпунова $V\left(t, x_{1}, \ldots, x_{n}\right)$, определенно-положительные в области (109.2). Существенную роль будет играть одно выражение, которое мы обо-
1) См. его монографию, упомянутую в сноске на стр. 475.

значим символом $B\left[V ; t ; x_{1}, \ldots, x_{n} ; u_{1}, \ldots, u_{r}\right]$ :
\[
\begin{array}{l}
B\left[V ; t ; x_{1}, \ldots, x_{n} ; u_{1}, \ldots, u_{r}\right]= \\
=\frac{\partial V}{\partial t}+\sum_{i=1}^{n} \frac{\partial V}{\partial x_{i}} X_{i}\left(t ; x_{1}, \ldots, x_{n} ; u_{1}, \ldots, u_{r}\right)+ \\
\quad+\omega\left(t ; x_{1}, \ldots, x_{n} ; u_{1}, \ldots, u_{r}\right) .
\end{array}
\]

Здесь $\omega$ – функция, определяющая показатель (107.1) качества регулирования.

Очевидно, если при некотором выборе функции $V\left(t ; x_{1}, \ldots, x_{n}\right)$ и функций $u_{j}=u_{j}^{*}\left(t ; x_{1}, \ldots, x_{n}\right)(j=1, \ldots, r)$ в области (109.2) выполняется равенство
\[
B\left[V ; t ; x_{1}, \ldots, x_{n} ; u_{1}^{*}, \ldots, u_{r}^{*}\right]=0,
\]

то это означает, что производная $\frac{d V}{d t}$ функции $V$ в силу уравнений (106.3) при $u_{j}=u_{j}^{*}\left(t, x_{1}, \ldots, x_{n}\right)$ удовлетворгет в этой области равенству
\[
\frac{d V}{d t}=-\omega\left(t, x_{1}, \ldots, x_{n}\right) .
\]

Основная теорема об оптимальной стабилизации, которую мы в дальнейшем будем называть теоремой IV, может быть сформулирована следующим образом.

Теорема IV. Eсли для дифференциальных уравнений возмущенного движения (109.1) можно найтіи допускающую бесконечно малый высший предел определенно положительную функцию $V^{0}\left(t, x_{1}, \ldots, x_{n}\right)$ ч бункции $u_{j}^{0}\left(t ; x_{1}, \ldots, x_{n}\right)$, удовлетворяющие в области (109.2) условиям:
1) бункиня
\[
\begin{array}{c}
w\left(t ; x_{1}, \ldots, x_{n}\right)=\omega\left(t ; x_{1}, \ldots, x_{n} ; u_{1}^{0}\left(t ; x_{1}, \ldots, x_{n}\right), \ldots\right. \\
\left.\ldots, u_{r}^{0}\left(t, x_{1}, \ldots, x_{n}\right)\right)
\end{array}
\]

является определенно положительной;
2) справедливо равенство
\[
\begin{array}{c}
B\left[V^{0} ; t ; x_{1}, \ldots, x_{n} ; u_{1}^{0}\left(t, x_{1}, \ldots, x_{n}\right), \ldots\right. \\
\left.\ldots, u_{r}^{0}\left(t, x_{1}, \ldots, x_{n}\right)\right]=0 ;
\end{array}
\]
3) каковы бы ни были числа и $_{j}$, справедливо неравенство
\[
B\left[V^{0} ; t ; x_{1}, \ldots, x_{n} ; u_{1}, \ldots, u_{r}\right] \geqslant 0,
\]

то функщии $u_{j}^{0}\left(t, x_{1}, \ldots, x_{n}\right)$ разрешают задачу II об оптимальной стабилизации. При этом выполняется равенство
\[
\begin{array}{l}
\int_{t_{0}}^{\infty} \omega\left(t, x_{1}^{0}[t], \ldots, x_{n}^{0}[t] ; u_{1}^{0}[t], \ldots, u_{r}^{0}[t]\right) d t= \\
=\min \int_{t_{0}}^{\infty} \omega\left(t, x_{1}[t], \ldots, x_{n}[t] ; u_{1}[t], \ldots, u_{r}[t]\right) d t= \\
=V^{0}\left(t_{0}, x_{1}\left(t_{0}\right), \ldots, x_{n}\left(t_{0}\right)\right) .
\end{array}
\]

Примечание. Как отмечено выше в книге (см. стр. 38,195 ), функции $V$, удовлетворяющие условиям теорем Ляпунова об асимптотической устойчивости, не только устанавливают сам факт устоћчивости, но и позволяют оценить область
\[
\left|x_{s}\left(t_{0}\right)\right| \leqslant \eta \quad(s=1, \ldots, n)
\]

тех начальных возмущений $x_{s}\left(t_{0}\right)$, для которых выполняются неравенства
\[
\left|x_{s}(t)\right|<H \quad\left(t \geqslant t_{0}, s=1, \ldots, n\right)
\]

и предельное соотношение
\[
\lim x_{s}(t)=0 \text { при } \quad t \rightarrow \infty .
\]

При $u_{j}=u_{j}^{0}\left(t, x_{1}, \ldots, x_{n}\right)$ в уравнениях (109.1) функция $V^{0}$ удовлетворяет условиям теоремы II об асимптотической устойчивости. Число $\eta$, определяющее область (109.9), в соответствии с изложенным в § 10 может быть, следовательно, наңдено из соотношения $\sup \left\{V^{0}\left(t, x_{1}, \ldots, x_{n}\right)\right.$ при $\left.\left|x_{s}\right| \leqslant \eta\right\}<$
$<\inf \left\{V^{0}\left(t, x_{1}, \ldots, x_{n}\right)\right.$ при $\left.\max \left(\left|x_{1}\right|, \ldots,\left|x_{n}\right|\right)=h\right\}$,
где $h$ – некоторое положительное число, меньшее чем $H\left(t \geqslant t_{0} \geqslant 0\right)$. Будем считать число $h$ фиксированным.

Утверждение теоремы IV, выражаемое неравенством (109.8), надо понимать в следующем смысле: при $u_{j}=u_{j}^{0}\left(t, x_{1}, \ldots, x_{n}\right)$ интеграл (107.1) достигает наименьшего значения для всех начальных условий $x_{s}\left(t_{0}\right)\left(t_{0} \geqslant 0\right)$ из области (109.9), где число $\eta$ выбрано в соответствии с неравенством (109.12).

Доказательство теоремы. При $u_{j}=u_{j}^{0}\left(t, x_{1}, \ldots, x_{n}\right)$ функция $V^{0}$ удовлетворяет всем условиям теоремы II. Ее производная $\frac{d V^{0}}{d t}$ в силу уравнений (109.1) (при $u_{j}=u_{j}^{0}$ ) определяется равенством
\[
\frac{d V^{0}}{d t}=-\omega\left(t, x_{1}, \ldots, x_{n} ; u_{1}^{0}, \ldots, u_{r}^{0}\right)
\]

и, следовательно, является функцией определенно-отрицательной. Поэтому воздействия $u_{j}^{0}\left(t, x_{1}, \ldots, x_{n}\right)$ обеспечивают асимптотическую устоичивость невозмущенного движения $x_{s}=0$ и выполнение предельного соотношения (109.11) для всех начальных условий $x\left(t_{0}\right)$ из области (109.9), (109.12).

Теперь для доказательства теоремы достаточно проверить справедливость соотношения (109.8). Сделаем это. Движения $x_{s}^{0}[t]$ при условии (109.9), (109.12) удовлетворяют неравенству $\left|x_{s}^{0}[t]\right| \leqslant h<H$. Следовательно, вдоль таких движений при всех $t \geqslant t_{0}$ выполняется равенство (109.6) или, иначе говоря, равенство (109.13). Кроме того, вследствие асимптотической устончивости выполняется предельное соотношение
\[
\lim V^{0}\left(t, x_{1}^{0}[t], \ldots, x_{n}^{0}[t]\right)=0 \quad \text { при } \quad t \rightarrow \infty .
\]

Интегрируя равенство (109.13) вдоль движения $x_{s}^{0}[t]$ в пределах от $t=t_{0}$ до $t=\infty$ и учитывая (109.14), получим:
\[
\begin{array}{l}
V^{0}\left(t_{0}, x_{1}\left(t_{0}\right), \ldots, x_{n}\left(t_{0}\right)\right)= \\
\quad=\int_{t_{0}}^{\infty} \omega\left(t, x_{1}^{0}[t], \ldots, x_{n}^{0}[t] ; u_{1}^{0}[t], \ldots, u_{r}^{0}[t]\right) d t .
\end{array}
\]

С другой стороны, пусть $u_{1}^{*}\left(t, x_{1}, \ldots, x_{n}\right), \ldots, u_{r}^{*}\left(t, x_{1}, \ldots, x_{n}\right)$ какие-либо функции, также решающие задачу о стабилизации движения $x_{s}=0$ для начальных возмущений из области (109.9). Примем сначала, что соответствующие движения $x_{s}^{*}[t]$ не выходят при $t \geqslant t_{0}$ из области $\left|x_{s}\right| \leqslant h$. Тогда в процессе движения $x_{s}^{*}[t]$ все время будет выполняться (109.7), или, иначе говоря, будет выполняться неравенство
\[
\frac{d V^{0}}{d t} \geqslant-\omega\left(t, x_{1}^{*}[t], \ldots, x_{n}^{*}[t]\right) .
\]

Здесь $\frac{d V^{0}}{d t}$ производная функции $V^{0}$ вдоль движения $x_{s}^{*}[t]$. Интегрируя неравенство (109.16) от $t=t_{0}$ до $t=\infty$ и снова учитывая предельное соотношение
\[
\lim V^{0}\left(t, x_{1}^{*}[t], \ldots, x_{n}^{*}[t]\right)=0 \quad \text { при } \quad t \rightarrow \infty,
\]

получим:
\[
\begin{array}{l}
V^{0}\left(t_{0}, x_{1}\left(t_{0}\right), \ldots, x_{n}\left(t_{0}\right)\right) \leqslant \\
\leqslant \int_{t_{0}}^{\infty} \omega\left(t, x_{1}^{*}[t], \ldots, x_{a}^{*}[t] ; u_{1}^{*}[t], \ldots, u_{r}^{*}[t]\right) d t .
\end{array}
\]

Аналогичное неравенство получается и в том случае, когда движение $x_{s}^{*}[t]$ на время покидает область
\[
\left|x_{s}\right| \leqslant h \quad(s=1, \ldots, n) .
\]

Действительно, в последнем случае имеет место следующая ситуация. Пусть $\tau>t_{0}$ – момент времени, когда движение $x_{s}^{*}[t]$ в последний раз вошло в область (109.19) и уже при $t \geqslant \tau$ не покидает эту область. Тогда с этого момента вдоль движения $x_{s}^{*}[t]$ все время выполняется условие (109.16). Интегрируя это неравенство от $t=\tau$ до $t=\infty$ и учитывая опять предельное соотношение (109.17), получим: $V^{0}\left(\tau, x_{1}^{*}[\tau], \ldots, x_{n}^{*}[\tau]\right) \leqslant$
\[
\leqslant \int_{\tau}^{\infty} \omega\left(t, x_{1}^{*}[t], \ldots, x_{n}^{*}[t], u_{1}^{*}[t], \ldots, u_{r}^{*}[t]\right) d t .
\]

Но по выбору $x_{s}\left(t_{0}\right)$ из области (109.9), (109.12) справедливо неравенство
\[
V^{0}\left(t^{0}, x_{1}\left(t_{0}\right), \ldots, x_{n}\left(t_{0}\right)\right)<V^{0}\left(\tau, x_{1}^{*}[\tau], \ldots, x_{n}^{*}[\tau]\right),
\]

а вследствие неотрицательности функции $\omega$ имеем:
\[
\begin{array}{l}
\int_{\tau}^{\infty} \omega\left(t, x_{1}^{*}[t], \ldots, x_{n}^{*}[t] ; u_{1}^{*}[t], \ldots, u_{r}^{*}[t]\right) d t< \\
<\int_{t_{0}}^{\infty} \omega\left(t, x_{1}^{*}[t], \ldots, x_{n}^{*}[t] ; u_{1}^{*}[t], \ldots, u_{r}^{*}[t]\right) d t .
\end{array}
\]

Из (109.20) – (109.22) снова следует справедливость неравенства (109.18). Соотношения (109.15) и (109.18) доказывают (109.8). Тем самым теорема IV полностью доказана.

Примечание. В условиях теоремы IV предполагается, что величины $u_{j}$ в уравнениях (109.1) являются функциями от $t$ и $x_{s}(t)$. Однако анализ доказательства этои теоремы показывает, что соотношение (109.8) справедливо и в том случае, когда в (109.8) $u_{j}=u_{j}[t]$ представляют собой любые функции в ремени $u_{j} \leftrightharpoons u_{j}(t)$, обеспечивающие предельное соотношение $\lim x_{s}[t]=0$ при $t \rightarrow \infty$. Действительно, в этом доказательстве по существу нигде не использовалось предположение, что функция $u_{j}^{*}[t]$ имеет форму $u_{j}^{*}[t]=u_{j}^{*}\left(t, x_{1}^{*}[t], \ldots\right.$, $\left.x_{n}^{*}[t]\right)$, а не просто является явной функцией только от времени $t$. Следовательно, теорема IV устанавливает оптимальность управления $u_{j}^{0}=u_{j}^{0}\left(t, x_{1}, \ldots, x_{n}\right)$ как по отношению к управляющим воздействиям вида $u_{j}=u_{j}\left(t, x_{1}, \ldots, x_{i}\right)$, так и по отношению к управляющим возденствиям $u_{j}=a_{j}(t)$ для всех начальных возмущений из области (109.9), (109.12).

Categories

1
Оглавление
email@scask.ru