Главная > АСИМПТОТИЧЕСКИЕ МЕТОДЫ НЕЛИНЕЙНОЙ МЕХАНИКИ (Н. Н.МОИСЕЕВ)
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

Построение теорий, позволяющих найти приближенное решение задач оптимального управления для систем уравнений, содержащих малые параметры, представляет интерес во всех отношениях. Прежде всего, существует большой класс технических задач, в которых дифференциальные уравнения, описывающие движение управляемой системы, содержат малые параметры, и поэтому вопрос о соответствии решения, которое получено при нулевых значениях параметров, точному решению всегда актуален. Более того, практически всегда мы имеем дело с идеализированными моделями управляемых систем, и поэтому развитие теории оптимального управления в том случае, когда дифференциальные ограничения содержат малые параметры, представляется важным с прикладной точки зрения. Далее, задачи оптимального управления относятся к числу некорректных задач. По-видимому, отбрасывание малых величин в некоторых случаях может привести к появлению новых качественных особенностей.

В данной работе мы рассматриваем только один простейший пример таких систем, который относится к частному типу задач, охватываемых излагаемой теорией.

Рассмотрим задачу отыскания такой функции $u(t)$, которая доставляет минимум функционалу
\[
I=\int_{0}^{T} F(x, u) d t
\]

при следующих ограничениях:
a) дифференциальные связи
\[
\dot{x}=\varepsilon X(t, x, u),
\]
б) фазовые ограничения
\[
x \in G_{x},
\]
в) ограничения на управление
\[
u \in G_{u} .
\]

Здесь $x$ и $u$ – некоторые векторы размерностей $n$ и $\dot{m}$ соответственно, вектор $x$ называется фазовым вектором, $u$ – управляющим вектором или управлением, $G_{x}$ и $G_{u}$ – некоторые множества.

K перечисленным условиям должны быть добавлены еще условия при $t=0$ и $t=T$. Условимся их фиксировать
\[
\left.\begin{array}{ll}
t=0 & x=x_{0}, \\
t=T & x=x_{T}
\end{array}\right\}
\]

В такой постановке рассматриваемая задача допускает простую механическую интерпретацию: найти такое управление $u(t)$, которое переводит систему, движение которой описывается системой уравнении (9.7), за зремя $T$ из состояния $x_{0}$ в состояние $x_{T}$ так, чтобы функционал $I$ (стоимость перехода из $x_{0}$ в $x_{T}$ ) был минимален и чтобы фазовая траектория этой системы не покидала допустимой области $G_{x}$.

Предположим теперь, что множество $G_{u}$ включает только такие функции $u(t)$, производная которых мала, а функция $X(t, x, u)$ является периодической функцией времени $l$ периода $2 \pi$. Тогда возникает та ситуация, о которой говорилось в предыдущем разделе.

В этом случае мы можем получить приближенное решение задачи, заменяя уравнения (9.7) осредненными
\[
\dot{x}=\varepsilon \bar{X}(x, u) .
\]

Предположим, что $G_{u}$ не содержит ограничений на производную функцию $u(t)$. Тогда методы усреднения можно использовать одним из следующих способов.
a) Решаем задачу, в которой система уравнений (9.7) заменена системой (9.11); в результате находим функцию $u(t)$. Если окажется апостериори, что производная функция $u(t)$ мала, то у нас есть интуитивная уверенность в том, что управление, найденное при помощи процедуры усреднения системы (9.7), есть некоторое допустимое управление, близкое к оптимальному. Заметим, что для широкого класса технических задач такое «решение задачи» оказывается досгаточным.
б) Если в результате решения оптимальной задачи производная функция $u(t)$ оказывается большой (например, функция $u(t)$ может просто оказаться разрывной), то метод усреднения неприменим. Тем не менее описанная процедура может оказаться полезной для построения возможных управлений. Предположим, что и является скаляром. Введем при помощи уравнения
\[
\dot{u}=\varepsilon \varphi(t),
\]

где $|\varphi| \leqslant \varphi^{*}$, новое управление $\varphi(t)$, а функцию $u(t)$ отнесем к числу фазовых координат, $\varphi^{*}$ – некоторое заданное число. Предположим, что вариационную за-
Рис. 38. дачу с ограничениями (9.11), (9.12) мы можем решить эффективно для любого значения $\varphi^{*}$. Тогда каждому значению $\varphi^{*}$ будет отвечать некоторое значение функционала $I\left(\varphi^{*}\right)$. Если эта зависимость имеет вид, изображенный на рис. 38 , т. е. величина производной $d I / d \varphi^{*}$ оказывается мӓлой, то в целом ряде технических задач этого факта оказывается достаточно для построения возможного управления, близкого к оптимальному (по функционалу).
в) Введение ограничения (9.12) сужает множество $G_{u}$. Остановимся подробнее на том случае, когда подобное сужение множества $G_{u}$ сохраняет задачу в такой форме, что для нее оказывается возможным использовать принцип максимума Л. С. Понтрягина.

Согласно принципу максимума оптимальное управление определяется из условия максимума функции
\[
H=\varepsilon \bar{X}(x, u) p+\varepsilon \varphi q-F(x, u),
\]

где $p$ и $q$-множители Лагранжа (импульсы), которые удовлетворяют следующей системе уравнений:
\[
\left.\begin{array}{c}
\dot{p}=-\frac{\partial H}{\partial x}=-\varepsilon \frac{\partial \bar{X}(x, u)}{\partial x} p+\frac{\partial F}{\partial x}, \\
\dot{q}=-\frac{\partial H}{\partial u}=-\varepsilon \frac{\partial \vec{X}(x, u)}{\partial u} p+\frac{\partial F}{\partial u} .
\end{array}\right\}
\]

Из вида функции $H$ следует, что новое управление $\varphi(t)$ должно быть выбрано из условий
\[
\left.\begin{array}{lll}
\varphi=\varphi^{*}, & \text { если } & q>0, \\
\varphi=-\varphi^{*}, & \text { если } & q<0 .
\end{array}\right\}
\]

Итак, в рассматриваемом случае задача сводится к решению некоторой краевой задачи для системы уравнений (9.11), (9.12) и (9.13). Краевые условия – это условия трансверсальности. Например, если рассматривается задача о переходе системы из состояния $x_{0}$ в состояние $x_{T}$, то краевая задача будет формулироваться следующим образом:
\[
t=0\left\{\begin{array}{l}
x=x_{0}, \\
q=0,
\end{array} t=T\left\{\begin{array}{l}
x=x_{T}, \\
q=0 .
\end{array}\right.\right.
\]

Примечание. Если исходная постановка вариационной задачи допускает применение принципа максимума, то можно сначала выписать всю систему уравнений сопряженной задачи
\[
\dot{p}=-\varepsilon \frac{\partial X}{\partial x} p,
\]

где $u$ определяется из условия
\[
H=\max _{u} H(x, p, u, t)=\max _{u}\{\varepsilon X(x, u, t) p-F(x, u)\} .
\]

Правые части полученной системы уравнений будут периодическими функциями $t$. Множител: Лагранжа будут функциями, которые изменяются медленно. Условие (9.18) нам покажет, будет ли функция $u(t)$ также изменяться медленно. В последнем случае мы сможем применить метод усреднения непосредственно к (9.7) и (9.17).

Categories

1
Оглавление
email@scask.ru