Принцип оптимальности Кротова.

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

Принцип оптимальности Кротова.

Сначала рассмотрим задачу оптимального управления с фиксированным временем: моменты фиксированы. Пусть произвольная скалярная функция, которая определена, непрерывна и имеет непрерывные частные производные по всем своим аргументам на прямом произведении Допускается, чтобы частная производная по времени имела разрывы 1-го рода в конечном числе точек на интервале Построим функции

где — правая часть уравнения (10.70); — функции, входящие в функционал (10.71). Введем обозначения

Относительно функции также предполагается, что она обладает такими свойствами, что соответствующая ей функция определена и непрерывна всюду на — кусочно-непрерывна на . Функцию обладающую указанными выше свойствами, будем называть функцией Кротова.

Принцип оптимальности Кротова можно сформулировать следующим образом: для того чтобы допустимая последовательность была решением задачи (10.70), (10.71), достаточно существования такой функции Кротова

Символ обозначает сходимость по мере.

Для доказательства этого принципа введем в рассмотрение множество пар из кусочно-непрерывных на функций и удовлетворяющих ограничению и определим на нем функционал:

Очевидно, допустимое множество является подмножеством с Поэтому функционал (10.76) определен и на причем на в силу уравнения из условия (10.70)

и функционалы (10.71) и (10.76) совпадают:

Обозначим

В силу непрерывности

и, следовательно,

Из неравенства

следует, что I является нижней гранью функционала Если выполняются соотношения то, очевидно,

Таким образом, является точной нижней гранью функционала (10.71) и достигается на последовательности . Следовательно, эта последовательность является решением задачи (10.70), (10.71), что и доказывает принцип оптимальности Кротова. Если , т. е. решением является допустимая пара, принцип оптимальности Кротова формулируется следующим образом: для того чтобы допустимая пара была решением задачи (10.70), (10.71), достаточно существования такой функции Кротова что

где по-прежнему определяются соотношениями (10.74) и (10.75).

Как решается задача оптимального управления на основе принципа оптимальности Кротова? Допустим для простоты рассуждения, что. решение существует в классе допустимых пар. Подход, основанный на принципе оптимальности Кротова, состоит в том, что вместо непосредственного отыскания допустимой пары , доставляющей минимум критерию оптимальности, отыскиваются функция Кротова и допустимая пара, удовлетворяющие условиям (10.77). В общем случае такой подход сводит вариационную задачу к задачам нелинейного программирования в конечномерном пространстве.

Как следует из формулировки принципа оптимальности Кротова, существует достаточно большой произвол в выборе функции . Этот произвол иногда позволяет преодолеть те трудности, которые при других методах преодолеть не удается. Способ задания функции определяет метод решения. Путем определенного способа задания функции можно получить уравнение Беллмана и принцип максимума Понтрягина.

Рассмотрим два различных способа задания функции Кротова. Пусть область ограничения можно представить в виде прямого произведения: . Тогда первое соотношение в (10.77) можно представить в виде

Один из возможных способов задания функции Кротова заключается в таком ее выборе, что функция не зависит от . При таком способе соотношение (10.78) принимает вид

При другом способе функцию Кротова выбирают таким образом, чтобы функция не зависела от и . В этом случае соотношение (10.78) записывается в виде

Способ задания функция зависит от задачи, и успех ее решения в значительной степени определяется тем, как задается функция Кротова.

Пример 10.13. Рассмотрим задачи из

Первая задача:

Здесь и, x — скаляры. Составим функцию

Так как концы траектории закреплены, функция не рассматривается. Выберем функцию так, чтобы функция не зависела от управления. Это условие будет выполнено, если

где — произвольная гладкая функция. В этом случае и соотношение (10.80), принимает вид

откуда . В силу уравнения объекта . Пара является допустимой и удовлетворяет достаточным условиям оптимальности. Следовательно, это пара является искомым решением.

Заметим, что решить рассмотренную задачу методом динамического программирования или используя принцип максимума Понтрягина не удается.

Вторая задача: пусть уравнения, ограничение и краевые условия те же, а критерий оптимальности имеет вид

В этом случае

Примем . Тогда и максимум этой функции достигается при и равен нулю, т. е. Пара не удовлетворяет заданному уравнению , следовательно, не является решением.

Попытаемся найти допустимую последовательность пар на которой достигается нижняя грань функционала, равная нулю. Рассмотрим последовательность пар

Функции при каждом фиксированном являются соответственно кусочно-непрерывными и кусочно-гладкими, удовлетворяют всем условиям задачи. Таким образом, последовательность пар является допустимой. Последовательность равномерно стремится к нулю, а все члены последовательности принимают только значения ±1. Поэтому

Таким образом, приведенная выше последовательность удовлетворяет достаточным условиям оптимальности и, следовательно, является искомым решением.

Рассмотрим задачу с нефиксированным временем. Пусть фиксировано, может изменяться в интервале условия совпадают с (10.70), а критерий оптимальности имеет вид

Обозначим

В данном случае, если решение существует в классе допустимых пар, принцип оптимальности Кротова формулируется следующим образом: для того чтобы допустимая пара

была решением задачи (10.70), (10.81) с нефиксированным временем, достаточно существования функции Кротова и времени таких, что:

2°) почти всюду на

Это утверждение доказывается аналогично принципу оптимальности Кротова для задачи с фиксированным временем [11].

Установим связь между достаточными условиями в методе Кротова и уравнением Беллмана в методе динамического программирования.

Рассмотрим задачу (10.63). Обозначим

Допустим, удалось найти такую функцию Кротова, что функция не зависит от х, а функция не зависит от Тогда

В последнем соотношении опущена операция минимизации по начальной точке так как она фиксирована. Для задачи (10.63) функция

и не зависит от если

Очевидно, условие 3° в принципе оптимальности Кротова совпадает с (10.82), условия 1° и 2° принимают вид

или, так как не зависит от управления,

При последнее соотношение совпадает с уравнением Беллмана (10.65), а соотношение (10.82) — с условием (10.66). Таким образом, при специальном выборе функции Кротова достаточные условия совпадают с уравнением Беллмана с соответствующим краевым условием.

<< Предыдущий параграф

Следующий параграф >>

Оглавление