Главная > Дифференциальные игры
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

10.5. ЭКИВОКАЛЬНЫЕ ПОВЕРХНОСТИ

Речь пойдет о сингулярных поверхностях типа В этом параграфе мы опишем общие условия существования экивокальной поверхности, но последующий более тонкий анализ будет ограничен случаем На самом деле одного простого примера достаточно, чтобы пролить свет на всю теорию.

Эти поверхности названы экивокальными (двусмысленными), так как один из игроков может выбрать в каждой их точке две различные оптимальные стратегии.

Эти поверхности, в отличие от уже рассмотренных, не имеют аналога в вариационном исчислении. Они не могут появиться в играх с одним игроком. Мы предполагаем, что теория дифференциальных игр должна существенно отличаться от любого расширения классических теорий.

Предположим, что в некоторой дифференциальной игре по интуитивным или иным соображениям оптимальные траектории ведут себя так, как показано на рис. 10.5.1. Траектории, достигающие принадлежат некоторому семейству (1); имеется еще другое семейство (2). Оптимальная игра требует, чтобы точка х, указанная на рисунке, двигалась сначала по траектории семейства (2), а затем переключалась на траекторию семейства (1). Траектории (1) дают истинное решение основного уравнения, которое можно продолжить до и выше того места, где ожидается пересечение с траекториями (2).

Нас интересует механизм переключения с одного типа траекторий на" другой.

Для удобства будем называть траектории (1) первичными, а заполненное ими множество — первичной областью; траектории (2) будут, естественно, называться вторичными.

Пусть поверхность, на которой совершается переключение (на рисунке это может быть одна из пунктирных кривых). Достигнув по вторичной траектории, точка х должна либо пересечь ее, либо остаться на ней, либо вернуться обратно.

Третья возможность немыслима, если только утверждается, что вторичные траектории оптимальны и являются носителями единственной в данной области оптимальной стратегии.

Вторая возможность, изображенная на рис. 10.5.1, а, означает, что играет роль полупроницаемой поверхности: однажды достигнув ее, х движется по ней.

Рис. 10.5.1. (см. скан)

Мы будем называть управления, приводящие к такой игре, траверсирующими стратегиями.

Оставшаяся возможность (рис. 10.5.1,б) приводит к тому, что играет роль поверхности переключения: х пересекает Здесь мы будем говорить о проникающих стратегиях.

Сделаем теперь четыре предположения.

А1. Выбор поверхности, которая играет роль (5°, находится целиком в распоряжении одного из игроков. Для определенности пусть это будет

А2. Выбор того, будет ли х проникать сквозь или останется на ней, находится в ведении другого игрока. Назовем его и учтем, что только он выбирает между проникающей и траверсирующей стратегиями.

Рассмотрим теперь некоторое «гладкое» однопараметрическое (параметром будет служить к) семейство поверхностей, каждое из которых может играть роль Под «гладкостью» мы подразумеваем то, что различные члены этого семейства не пересекаются и при увеличении к поверхности гладко передвигаются в некотором общем направлении (см. множество пунктирных кривых на рисунке).

Рис. 10.5.2.

A3. Пусть начиная с некоторой фиксированной точки х вторичной области, выбирает траверсирующую стратегию, оптимальную со всех других точек зрения. Пусть выбирает различные к (члены нашего семейства кандидатов в а в остальном действует оптимально. Тогда плата является убывающей функцией от k.

А4. При тех же предположениях, за исключением того, что на этот раз выбирает проникающую стратегию, плата является возрастающей функцией от k.

Графики этих двух функций от к показаны на рис. 10.5.2. Так как максимизирующий игрок, то для каждого к из двух возможных стратегий он выберет ту, которая дает более высокую плату. Тем самым плата будет представлена некоторой точкой на верхней кривой (жирно начерченной на рисунке). Следовательно, выберет к на рисунке), при котором достигается минимум этой верхней кривой: эта точка соответствует пересечению исходных кривых.

Итак, так как описанная ситуация имеет место для всех гладких семейств и всех допустимых начальных точек во вторичной

области, то оптимальная поверхность должна обладать следующим свойством:

Для каждой точки поверхности оптимальная игра проникающего или траверсирующего типа ведет к одной и той же плате. Это общее значение является ценой игры.

Поверхность, для которой выполнено это условие, будет называться экивокальной поверхностью.

Для в единственном случае, который мы изучали сколько-нибудь детально, оказалось, что условие экивокальной поверхности приводит к обыкновенному дифференциальному уравнению первого порядка. Итак, вообще говоря, экивокальную поверхность можно провести через любую точку. Какую начальную точку следует выбрать для данной конкретной игры, часто становится ясно в процессе ее решения. В общем случае возможна аналогия между этим вопросом и вопросом о выборе барьера (см. § 8.5).

Считая по-прежнему положим, что стратегии удовлетворяют высказанным предположениям. Предположим, что имеет линейную вектограмму, и его оптимальными стратегиями в первичной и вторичной областях служат крайние значения (трудно представить себе какую-нибудь другую возможность). Для движения вдоль экивокальной поверхности требуется промежуточное значение Предположим далее, что платой является время захвата хотя нетрудно распространить дальнейшие результаты на случай произвольного положительного Предположим также, что вектограмма аддитивна, т. е. результирующая скорость точки х равна сумме векторов, соответствующих, выборам обоих игроков.

Лемма 10.5.1. В вышеописанной обстановке оптимальная траверсирующая стратегия на экивокальной поверхности максимизирует компоненту скорости, перпендикулярную к базовой линии -вектограммы в направлении, противоположном направлению движения х по поверхности.

Доказательство. При очевидно, что для лучше допустить такое движение по экивокальной поверхности, при котором скорость вдоль этой поверхности по возможности мала. Пусть на рис. 10.5.3 X — точка на экивокальной поверхности, крайние векторы -вектограммы базовая линия), а пунктирная прямая — касательная к экивокальной поверхности в точке Пусть выбирает некоторую скорость (или параллельные и равные ей из своей вектограммы, вид которой нам неизвестен. Выбор должен привести к тому, что результирующая скорость будет касательной

к экивокальной поверхности, т. е. выбирает вектор такой, что вектор лежит на касательной к экивокальной поверхности. Тогда, минимизируя игрок старается максимально отдалить линию от Но это и приводит к стратегии, описанной в лемме.

Рис. 10.5.3.

Если экивокальная поверхность известна, то известно и значение V на ней; вторичные траектории строим обычным способом, используя эти данные в качестве начальных условий. Следующая лемма показывает, что начальные условия для можно вычислить, считая, что использует оптимальную траверсирующую стратегию предыдущей леммы (и, разумеется, использует одно из крайних значений

Лемма 10.5.2. Оптимальная траверсирующая стратегия для на экивокальной поверхности и его оптимальная стратегия во вторичной области непрерывно примыкают друг к другу.

Доказательство. Предположим, что лемма неверна. Пусть оптимальная стратегия для разрывна, а (в силу в качестве экивокальной поверхности выбирает поверхность близкую к настоящей экивокальной поверхности во вторичной области. Это означает, что переключается с крайнего значения на прежде, чем х достигнет экивокальной поверхности. В худшем случае это приведет к потере в плате, которая может быть сделана как угодно малой.

Но поскольку лежит во вторичной области, в силу разрывности противодействие движению х вдоль будет на конечную величину меньше того оптимума, который указан в лемме 10.5.1. Итак, если отклонение вверх достаточно мало, то он

получит плату лучшую, чем цена игры, что невозможно при действии против оптимальной стратегии.

Задача 10.5.1. Дать формальное доказательство по следующей схеме. В качестве уравнений движения взять

Начальные условия для V на экивокальной поверхности (параметр получить при решении уравнения

представляющего собой условие экивокальной поверхности, и основного уравнения

Показать, что решение можно получить из соотношений

(Для применения леммы 10.5.1 заметить, что выражение представляет собой требуемую нормальную скорость.)

Categories

1
Оглавление
email@scask.ru