Главная > Теория автоматического управления, Ч.II (Воронов А.А.)
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

Принцип оптимальности Кротова.

Сначала рассмотрим задачу оптимального управления с фиксированным временем: моменты фиксированы. Пусть произвольная скалярная функция, которая определена, непрерывна и имеет непрерывные частные производные по всем своим аргументам на прямом произведении Допускается, чтобы частная производная по времени имела разрывы 1-го рода в конечном числе точек на интервале Построим функции

где — правая часть уравнения (10.70); — функции, входящие в функционал (10.71). Введем обозначения

Относительно функции также предполагается, что она обладает такими свойствами, что соответствующая ей функция определена и непрерывна всюду на — кусочно-непрерывна на . Функцию обладающую указанными выше свойствами, будем называть функцией Кротова.

Принцип оптимальности Кротова можно сформулировать следующим образом: для того чтобы допустимая последовательность была решением задачи (10.70), (10.71), достаточно существования такой функции Кротова

Символ обозначает сходимость по мере.

Для доказательства этого принципа введем в рассмотрение множество пар из кусочно-непрерывных на функций и удовлетворяющих ограничению и определим на нем функционал:

Очевидно, допустимое множество является подмножеством с Поэтому функционал (10.76) определен и на причем на в силу уравнения из условия (10.70)

и функционалы (10.71) и (10.76) совпадают:

Обозначим

В силу непрерывности

и, следовательно,

Из неравенства

следует, что I является нижней гранью функционала Если выполняются соотношения то, очевидно,

Таким образом, является точной нижней гранью функционала (10.71) и достигается на последовательности . Следовательно, эта последовательность является решением задачи (10.70), (10.71), что и доказывает принцип оптимальности Кротова. Если , т. е. решением является допустимая пара, принцип оптимальности Кротова формулируется следующим образом: для того чтобы допустимая пара была решением задачи (10.70), (10.71), достаточно существования такой функции Кротова что

где по-прежнему определяются соотношениями (10.74) и (10.75).

Как решается задача оптимального управления на основе принципа оптимальности Кротова? Допустим для простоты рассуждения, что. решение существует в классе допустимых пар. Подход, основанный на принципе оптимальности Кротова, состоит в том, что вместо непосредственного отыскания допустимой пары , доставляющей минимум критерию оптимальности, отыскиваются функция Кротова и допустимая пара, удовлетворяющие условиям (10.77). В общем случае такой подход сводит вариационную задачу к задачам нелинейного программирования в конечномерном пространстве.

Как следует из формулировки принципа оптимальности Кротова, существует достаточно большой произвол в выборе функции . Этот произвол иногда позволяет преодолеть те трудности, которые при других методах преодолеть не удается. Способ задания функции определяет метод решения. Путем определенного способа задания функции можно получить уравнение Беллмана и принцип максимума Понтрягина.

Рассмотрим два различных способа задания функции Кротова. Пусть область ограничения можно представить в виде прямого произведения: . Тогда первое соотношение в (10.77) можно представить в виде

Один из возможных способов задания функции Кротова заключается в таком ее выборе, что функция не зависит от . При таком способе соотношение (10.78) принимает вид

При другом способе функцию Кротова выбирают таким образом, чтобы функция не зависела от и . В этом случае соотношение (10.78) записывается в виде

Способ задания функция зависит от задачи, и успех ее решения в значительной степени определяется тем, как задается функция Кротова.

Пример 10.13. Рассмотрим задачи из

Первая задача:

Здесь и, x — скаляры. Составим функцию

Так как концы траектории закреплены, функция не рассматривается. Выберем функцию так, чтобы функция не зависела от управления. Это условие будет выполнено, если

где — произвольная гладкая функция. В этом случае и соотношение (10.80), принимает вид

откуда . В силу уравнения объекта . Пара является допустимой и удовлетворяет достаточным условиям оптимальности. Следовательно, это пара является искомым решением.

Заметим, что решить рассмотренную задачу методом динамического программирования или используя принцип максимума Понтрягина не удается.

Вторая задача: пусть уравнения, ограничение и краевые условия те же, а критерий оптимальности имеет вид

В этом случае

Примем . Тогда и максимум этой функции достигается при и равен нулю, т. е. Пара не удовлетворяет заданному уравнению , следовательно, не является решением.

Попытаемся найти допустимую последовательность пар на которой достигается нижняя грань функционала, равная нулю. Рассмотрим последовательность пар

Функции при каждом фиксированном являются соответственно кусочно-непрерывными и кусочно-гладкими, удовлетворяют всем условиям задачи. Таким образом, последовательность пар является допустимой. Последовательность равномерно стремится к нулю, а все члены последовательности принимают только значения ±1. Поэтому

Таким образом, приведенная выше последовательность удовлетворяет достаточным условиям оптимальности и, следовательно, является искомым решением.

Рассмотрим задачу с нефиксированным временем. Пусть фиксировано, может изменяться в интервале условия совпадают с (10.70), а критерий оптимальности имеет вид

Обозначим

В данном случае, если решение существует в классе допустимых пар, принцип оптимальности Кротова формулируется следующим образом: для того чтобы допустимая пара

была решением задачи (10.70), (10.81) с нефиксированным временем, достаточно существования функции Кротова и времени таких, что:

2°) почти всюду на

Это утверждение доказывается аналогично принципу оптимальности Кротова для задачи с фиксированным временем [11].

Установим связь между достаточными условиями в методе Кротова и уравнением Беллмана в методе динамического программирования.

Рассмотрим задачу (10.63). Обозначим

Допустим, удалось найти такую функцию Кротова, что функция не зависит от х, а функция не зависит от Тогда

В последнем соотношении опущена операция минимизации по начальной точке так как она фиксирована. Для задачи (10.63) функция

и не зависит от если

Очевидно, условие 3° в принципе оптимальности Кротова совпадает с (10.82), условия 1° и 2° принимают вид

или, так как не зависит от управления,

При последнее соотношение совпадает с уравнением Беллмана (10.65), а соотношение (10.82) — с условием (10.66). Таким образом, при специальном выборе функции Кротова достаточные условия совпадают с уравнением Беллмана с соответствующим краевым условием.

Categories

1
Оглавление
email@scask.ru