Главная > Прикладные задачи фильтрации и управления
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

§ 3.16. Области «нечувствительности» терминального управления при учете энергозатрат

Рассмотренные в § 3.14 и 3.15 задачи оптимизации стохастического терминального управления приводили к разрывным управлениям. Скачки в величинах управлений происходили при пересечении границы области

«нечувствительности» или границы области прекращения измерений.

1. При специальном виде терминальной функции потерь еще один пример разрывных оптимальных управлений дает описанная в § 1.11 задача минимизации энергозатрат, если отсутствуют ограничения на векторы управлений, а величина энергозатрат пропорциональна сумме модулей векторов управлений [7]. Пусть четная, выпуклая вниз положительная функция переменных такая, что неограниченно растет с ростом Кроме того, положим, что неособенная матрица; для применимости леммы 3.2 такой же считаем и матрицу риск является терминальным: Но

Из (3.142) и леммы 3.2 найдем

Поэтому минимальный терминальный риск 5° равен не зависит от векторов управлений в момент и эти векторы следует использовать для минимизации средних энергозатрат на отрезке

Положим, что в следовательно, энергозатраты на интервале равны Поэтому суммарные энергозатраты, например масса топлива, израсходованного при управлении двигателем ракеты, пропорциональны величине

Величину следует считать риском, ответственным за энергозатраты, а для выбора минимизирующих векторов управлений в моменты используем рекуррентные уравнения главы 1, которые в данном случае примут вид

четная, выпуклая вниз функция и; таким же

свойством обладает функция так как

Поэтому, следуя индукции, проведенной в § 2.6, найдем, что выпуклая вниз функция и, что обеспечивает сходимость алгоритмов нелинейного или стохастического программирования при минимизации в задаче (3.144); выпуклой и четной будет и функция

Покажем, что существует окружающая точку область «нечувствительности» оптимального управления: если то Положим Так как выпуклая вниз функция, то по известному свойству таких функций

где градиент функции Из (3.145) и (3.146) получим

Положим где произвольный единичный вектор в Тогда из (3.147)

Пусть — область векторов для которых Если то при любом векторе (любом направлении вектора и) положительно второе слагаемое в правой части (3.148). Это слагаемое минимально (равно 0) при 0; в этом случае неравенство (3.148) переходит в равенство

Итак, если то функция достигает минимума при следовательно, область «нечувствительности» управления.

Остается показать, что область непуста. Учтем, что

где вектор градиента функции Так как то, дифференцируя это равенство, получим, что нечетная вектор-функция:

Отсюда получим

так как из (3.34)

Итак, точка принадлежит Так как компоненты вектора непрерывно зависят от то является некоторой областью, окружающей начало координат.

Границы области приближенно описываются уравнением

Если разложить вектор-функцию в ряд в окрестности точки то, учитывая (3.150), приближенно можно записать где некоторая матрица. Поэтому приближенно является эллипсоидом в если (3.151) переписать в виде и допустить, что Из (3.151) видно, что с уменьшением элементов матрицы (с уменьшением случайных возмущений на интервале элементы матрицы увеличивается и, следовательно, область стягивается в точку. Это соответствует следующим интуитивным представлениям: если известно, что система незначительно возмущается на интервале то для экономии энергозатрат незачем откладывать управление до момента

Пусть вектор оптимального управления, минимизирующий вектор с малой величиной Так как

то

Так как выпукла вниз по и, то из (3.152) видно, что необходимым и достаточным условием оптимальности вектора служит равенство

соответствующее алгебраическим уравнениям относительно компонент вектора

Из (3.153) видно, что

Поэтому при вектор оптимального управления таков, что конец вектора находится на границе области Поэтому, если вектор удовлетворяет уравнепию (3.151), то следовательно, (3.151) — точное уравнение для границы области

Следует подчеркнуть, что существование области «нечувствительности» управления явилось следствием пропорциональности энергозатрат на интервалах модулю векторов управлений; если энергозатраты пропорциональны квадрату модуля, то легко показать, что векторы оптимальных управлений линейно зависят от векторов и области «нечувствительности» отсутствуют.

2. Задача оптимизации терминального управления при учете ограничения на располагаемую энергетику общая постановка которой описана в § 1.8, также имеет область «нечувствительности» оптимального управления, если энергозатраты связаны с управлением использованной выше зависимостью.

Из общих уравнений (1.76) — (1.78) видно, что для линейных динамических систем рекуррентные уравпепия оптимизации имёют вид

где а — коэффициент пропорциональности,

четная, выпуклая вниз терминальная функция потерь. Разложим функцию в ряд и окрестности точки считая малой величину

где соответственно градиент по и производная по функция

произвольный единичный вектор в Ясно, что величина отрицательная: с увеличением располагаемой энергетики и при отсутствии ограничений на управления величина среднего терминального риска должна уменьшаться. Отсюда получим, что если вектор содержится в области для которой

то минимальное значение второго слагаемого в правой части (3.154) равно 0, достигается при следовательно, область «нечувствительности» оптимального терминального управления. Эта область непуста, так как четная функция (легко доказывается по индукции), градиент является нечетной функцией и, следовательно, Поэтому область содержит точку и ее граница описывается уравнением

3. Наметим решение рассматриваемой задачи при наиболее часто встречающемся на практике случае Здесь выкладки существенно усложняются.

Пусть функция из леммы — матрица размерности матрица размерности у которой столбцы — единичные векторы, перпендикулярные друг другу и столбцам матрицы При заданной а матрицу легко найти по известным правилам линейной алгебры. Так как ограничение на вектор и отсутствуем, то из (3.73) следует, что функцию можно представить в виде

где некоторая функция переменных. Рассмотрим теперь задачу (3.29) при и последовательно будем использовать Найдем где функция переменных. Тогда

Допустим, что

Отсюда получим

где функция переменных. Если при этом то оптимальное управление, минимизирующее будет определять не компонент вектора и, а их линейных комбинаций. Продолжая описанный процесс, далее получим некоторое число I, для которого матрица имеет ранг, равный числу строк. В этом случае (аналогично тому, как ранее при Поэтому минимальный терминальный риск равен и не зависит от векторов управлений в моменты Эти векторы, а также компоненты векторов управлений в упомянутых выше линейных комбинациях используются для минимизации средних энергозатрат на Если бы столбцы матрицы линейно зависели от столбцов матрицы то управление в момент не влияет на и может быть использовано для уменьшения энергозатрат.

Аналогичная ситуация возникает, если при некотором столбцы матрицы линейно зависят от столбцов матрицы

Намеченный путь синтеза оптимального управления по векторному критерию (по критерию точности и по критерию энергозатрат) легко конкретизируется, если Он может быть использован при решении задачи § 3.17 при

1
Оглавление
email@scask.ru