Главная > Дифференциальные игры
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

А.5. ИГРА «БОМБАРДИРОВЩИК И БАТАРЕЯ»

Этот пример иллюстрирует удивительное многообразие, скрытое в простых на первый взгляд военных (или других) играх. Здесь полное решение расщепляется на девять отдельных случаев, и некоторые из них допускают дальнейшее логическое подразделение. Мы только наметим эту картину, останавливаясь на особенно поучительных моментах.

Атакующий самолет, управляемый игроком осуществляет простое движение по плоскости со скоростью и. Его целью является территория игрока ограниченная береговой линией. Из батареи, находящейся в фиксированной точке стреляет по Игра происходит в соответствии с условиями так что платой является вероятность поражения.

Каждый игрок по-разному ограничен в своих действиях.

Для ограничено время полета, запас горючего или длина траектории; все эти ограничения эквивалентны в силу постоянства скорости. Мы выберем первое: время полета не должно превосходить заданной величины Это ограничение того типа, который обсуждался в § 5.7.

У ограничен запас боеприпасов который он имеет в своем распоряжении для стрельбы по цели Пусть с — максимальная скорость, с которой может стрелять Его управлением будет та часть этой скорости, которую он может выбирать в каждый момент времени. Поэтому мы включим в уравнения движения уравнение

и заменим в этом случае (см. § А.1) на

Таким образом, уменьшение скорости стрельбы пропорционально отражается на уменьшении текущей эффективности оружия.

Задача игрока состоит в выборе такой траектории со временем полета, не превосходящим по которой он из своей точки старта достигнет линии с минимальной вероятностью поражения. В течение этого полета стреляет по нему, так распределяя свое фиксированное количество боеприпасов по времени стрельбы, чтобы максимизировать вероятность поражения.

Решение, по-видимому, не будет иметь большой практической важности, так как разница вероятности поражения для мало отличных друг от друга путей будет, по всей видимости, незначительной (см. обсуждение практических оценок в гл. 11). Зато поучительность решения здесь велика: разнообразие явлений типично для других, особенно военных задач. Кроме того, задача иллюстрирует наличие двух различных и одновременно эффективных видов ограничений.

Рис. А.5.1.

Если не оговорено противное, мы будем считать прямой линией с батареей О, расположенной на ней. Для некоторых целей будет полезнее поместить О впереди тогда мы будем говорить о выдвинутой защите.

В первом из приведенных ниже примеров будет рассмотрен также случай произвольной формы береговой линии.

Положение будем задавать полярными координатами и 0; эти координаты и управление показаны на рис. Другими фазовыми координатами служат время полета игрока и количество боеприпасов, находящихся в распоряжении Итак, уравнения движения имеют вид

Помимо очевидных условий потребуем, чтобы

так что всегда может достичь (по крайней мере по прямой на рисунке), и

в силу симметрии. Очевидно, что будет рассеивающей поверхностью (но никакой мгновенной смешанной стратегии здесь не требуется).

Существуют две естественные возможности для выбора терминальной поверхности:

находится Здесь партия кончается. При этом может существовать или не существовать некоторый избыток боеприпасов Введем следующую параметризацию:

Далее, на поверхности имеем и в соответствии с условиями § 5.7 мы в качестве третьего параметра выбираем

Если то шансов поражения больше не остается. С этого момента стратегия игрока может быть любой (мы предполагаем, что достаточно велико, чтобы позволить ему достичь т. е. что выполнено условие Итак, плоскость есть естественная терминальная поверхность. Здесь параметризация такова:

Следующие три примера — это поучительные, но крайние случаи в том смысле, что они лежат на границе множества решений.

Пример А.5.1. Неограниченный запас боеприпасов. Предположим, что настолько велико, что может вести огонь в полную силу на протяжении всей партии. Тогда можно не считать фазовой координатой. Выберем начальные условия на (с отброшенным третьим неравенством из и положим Тогда задача превратится в иллюстрацию к уже рассмотренному случаю интегральных ограничений из § 5.7, где, конечно,

Если решить систему с то мы получим траектории, которые, как мы знаем, будут оптимальными для даже в том случае, если он свободен от ограничений на Для береговой

линии общего вида эти траектории (такие, как показанная на рис. А.5.2 траектория описываются уравнениями вида где с, — константы.

При мы получаем траектории показанные на рисунке), где ограничение существенно, т. е. время которым располагает оказывается меньшим, чем то, которое необходимо для прохождения Наконец, появляется траектория где времени хватает лишь на то, чтобы пройти по горизонтальному отрезку превращается в равенство).

Рис. А.5.2.

В нашем стандартном случае прямолинейного берега с расположенной на нем батареей абсолютно оптимальная траектория (см. рис. А.5.1) оказывается дугой окружности с постоянным В то же время существенно ограниченные траектории определяются уравнениями

где

Выражение для в конечном виде можно получить, если взять неопределенный интеграл

где а — корни многочлена

Следующее тождество, которое можно получить с помощью уравнений характеристик и основного уравнения, оказывается полезным при интегрировании почти во всех случаях:

Пример А.5.2. Неограниченное время полета. Если может лететь по траектории любой длины, а ограничен как в максимальной скорости стрельбы с, так и в запасе боеприпасов то оптимальная игра становится очевидной: движется по прямой от О до тех пор, пока не истратит все боеприпасы; после этого он любым способом следует к Ясно также, что сразу

начинает стрелять с полной скоростью и продолжает делать это до полного истощения боеприпасов.

Упражнение Используя получить этот результат аналитически.

Разумеется, приведенное выше решение справедливо и при условии, что время ограничено, если только оно достаточно велико, чтобы позволить после радиального полета достичь не уменьшая при этом расстояние Более точно: нужно, чтобы

Равенство приводит к траектории показанной на рис. А.5.3. Здесь дуга окружности.

Рис. А.5.3.

Пример А. 5.3. Ограниченность боеприпасов и неманеврирующий самолет.

Если в должно выполняться равенство, то не остается иного выбора, кроме прямолинейного пути, перпендикулярного к Тогда положение идентично рассмотренному в примере 7.14.1 с имеющейся там полууниверсальной поверхностью.

Интересно изучить обобщение задачи на случай выдвинутой защиты, когда батарея О расположена на расстоянии впереди Предположим сначала, что мало. Тогда будет стрелять в полную силу в то время как будет двигаться в интервале соответствующей длины, симметричном относительно О. Но если то остается достаточно боеприпасов, чтобы начать стрельбу до того, как подойдет к на расстояние Тогда начинает стрелять в полную силу в тот самый момент, когда он окажется способным поддерживать полный огонь до тех пор, пока не достигнет Таким образом, он стреляет на протяжении последнего интервала игры

длительностью Если же то открывает полный огонь немедленно; достигает когда часть боеприпасов еще остается неиспользованной.

Все это приводит к траекториям в пространстве показанным на рис. А.5.4 (на плоскости необходимы только две фазовые координаты), которые читатель без труда сможет истолковать.

Рис. А.5.4.

Проблема Можно ли получить это очевидно верное решение чисто аналитическим путем?

Исследуем теперь более общие решения и найдем возможную -универсальную поверхность. Идеи гл. 7 требуют, во-первых, сведения к случаю терминальной платы. Число фазовых координат станет тогда равным пяти; наша обычная техника оказывается неприменимой, но можно решить эту игру по частям.

Три уравнения (7.13.2) имеют в этом случае вид

где вновь введенная фазовая координата.

Оставляя в стороне очевидно тривиальный случай находим из что Такое движение означает, что траектория является дугой окружности постоянного радиуса с центром в точке О.

Если имеет достаточно боеприпасов для поддержания непрерывного огня с максимальной скоростью, то мы возвращаемся к примеру А.5.1. Поэтому мы предположим, что не всегда Нам придется найти — оптимальный для способ распределения ограниченного количества боеприпасов.

Мы утверждаем, что значение в течение игры должно быть постоянным и при этом таким, чтобы израсходовал весь свой запас как раз в тот момент, когда достигнет Действительно, если распределит свой запас неравномерно, то будет существовать по крайней мере один малый интервал времени, где будет больше, чем среднее значение и некоторый другой, на котором меньше, чем это значение. Если укоротит свой путь на протяжении последнего интервала, летя по хорде, а не по дуге окружности своей оптимальной круговой траектории, и, используя сэкономленное время слегка увеличит на протяжении первого интервала, то он улучшит (уменьшит) плату. Следовательно, такая стратегия не сможет быть оптимальной.

На поверхности, которая должна быть универсальной, постоянны и равны, скажем, Введем параметризацию (в исходном пространстве

На этой поверхности в силу первоначального определения плата равна

Задача А.5.1. Показать, что необходимые условия выполняются на поверхности Доказать непосредственным рассуждением, что эта поверхность универсальна.

Используя в качестве начальных условий, мы можем проинтегрировать уравнения характеристик обычным образом при для получения двух множеств траекторий-притоков.

Траектории-притоки при максимальной скорости стрельбы

Интегрирование показывает, что всегда является возрастающей функцией от следовательно, эти траектории

подходят к универсальной поверхности с внутренней стороны. Заметим также, что они отличаются от траекторий примера А.5.1, где невозрастающая функция от

Не все интегралы уравнений характеристик представляют собой оптимальные траектории. Действительно, если бы траектории, на которых пересекали универсальную поверхность на линии с израсходованными боеприпасами и были оптимальными, то это противоречило бы установленному в примере А.5.1.

Изучим предельное поведение при Среди уравнений траекторий с находим

Рис. А.5.5.

Но это радиальная траектория примера А.5.2. Далее мы видим, что по достижении универсальной поверхности обращается в нуль и продолжает движение по дуге окружности при отсутствии огня Таким образом, мы получаем в точности всю траекторию, приведенную на рис. А.5.3. Эта траектория единственна, если не хватает запаса времени для какой-либо другой. Поэтому этот случай отмечает то критическое значение при переходе через которое исследуемый здесь случай переходит к случаю, рассмотренному в примере

Посмотрим теперь, что случится, если начнет убывать от этого критического значения. Траектории последовательно изменяются, проходя через точки на рис. На участке поддерживается максимальная скорость стрельбы на дугах окружностей стреляет с такой постоянной скоростью чтобы исчерпать все боеприпасы как раз в тот момент, когда достигнет

Посмотрим, что случится при другом предельном переходе, когда Траектории-притоки переходят в дуги окружностей, которые лежат на универсальной поверхности. Это может случиться, только если

Таким образом, нет качественного различия между притоками и универсальными траекториями.

Итак, посмотрим, что происходит, когда начинает движение из заданной начальной точки при фиксированном, но

достаточно большом а располагаемое им время принимает различные значения. Наименьшее допустимое допускает лишь прямолинейную траекторию показанную на рис. А.5.5. При увеличении траектория непрерывным образом переходит в дугу (как в примере А.5.1); плата при этом уменьшается. Предположим, что остается избыток боеприпасов, в точке Большие значения как мы знаем, приводят к траекториям Но поскольку на этом множестве траекторий убывает, мы должны начать с траектории где лежит на на всем протяжении партии. Эта траектория, как мы видим, отлична от и не является оптимальной. Итак, плата для больше, чем для Но плата для меньше (она наименьшая из всех возможных). Следовательно, должна существовать промежуточная траектория, скажем для которой значение платы равно ее значению на

Таким образом, если возрастает выше значения, соответствующего траектории то на некотором интервале времени последняя остается оптимальной, а плата V — постоянной. Это происходит до тех пор, пока не возрастет настолько, чтобы оказалась осуществимой траектория здесь имеет две оптимальные стратегии. (Есть ли здесь рассеивающая поверхность?) Дальнейшее увеличение ведет к траекториям с возрастанием V, пока, наконец, мы не получим траекторию

Чем больше тем больше указанный пробел. Случай бесконечного как в примере А.5.1, приводит к тому, что наилучшей возможной траекторией оказывается и пробел, увеличиваясь до бесконечности, перестает существовать.

Проблема А.5.2. Охарактеризовать множество начальных положений, для которых имеет две оптимальные стратегии. Может ли оно быть получено конструкцией, аналогичной той, которая приведена в § 6.5 и результатом которой является рассеивающая поверхность?

Траектории-притоки при отсутствии стрельбы

Интегрирование уравнений характеристик показывает, что эти траектории прямолинейны. Следовательно, они касаются универсальной поверхности и имеют вид, показанный на рис.

Ясно, что для них выполняется условие

меньше того значения, которое требуется для поддерживания огня с полной скоростью во время прохождения указанной на рисунке пунктирной дуги.

Отметим естественность результата. Траектории таковы, что максимизируется достигающееся на них минимальное расстояние.

Наконец, должен быть еще один класс решений.

Рис. А.5.6.

Рассмотрим пример в котором так что обязан двигаться по прямолинейному горизонтальному отрезку, а невелико, и поэтому стреляет с полной скоростью лишь на конечном интервале. Мы видели, что в результате получается полууниверсальная поверхность.

Рис. А.5.7.

При небольшом увеличении траектории расположены поблизости от прямой траектории и следует ожидать, что между ними будет качественное сходство. Это явление более интересно в случае выдвинутой защиты. Основное новшество состоит в том, что многие оптимальные партии кончаются, когда запас уже исчерпан, а еще не достиг (причины этого интуитивно ясны). Поверхность состоит из положений, находящихся левее

О, где запаса времени в точности достаточно для горизонтального полета до О.

Решения разбиваются на два класса. Один состоит из траекторий, на которых растет вместе с искривляющихся по направлению к Второй содержит поверхность переключения. Типичная оптимальная траектория показана на рис. А.5.7.

Рис. А.5.8.

Здесь В есть точка поверхности точка поверхности переключения. На прямолинейных отрезках и огонь отсутствует. Стрельба ведется только на кривой, которая гладко переходит в и На ней (за исключением самих точек и она симметрична относительно своей средней точки.

Хотя такие траектории и похожи на траектории примера однако мы здесь не изучили деталей распределения огня. Он, по-видимому, также постепенно уменьшается до на притоках к универсальной поверхности.

Эта поверхность в случае выдвинутой защиты включает оптимальную игру, подобную изображенной на рис. А.5.8. Дуга лежит на универсальной поверхности и заканчивается на множестве точек, представленном на рисунке точкой слева от нее, как и раньше, лежат горизонтальные траектории без стрельбы.

Возможность слияния притоков рис. А.5.6 с такой универсальной поверхностью, траектории которой показаны на рис. А.5.1, достаточно очевидна.

ЛИТЕРАТУРА

(см. скан)

(см. скан)

Categories

1
Оглавление
email@scask.ru