Главная > Дифференциальные игры
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

5.5. ИГРА «ИЗОТРОПНЫЕ РАКЕТЫ»

Преследователь движется под действием силы фиксированной величины (точнее есть сила, действующая на единицу массы или удельная сила), направлением которой он управляет Убегающий обладает простым движением, скорость его равна Игра происходит на плоскости, платой является время захвата

Разумеется, нетрудно придумать более сложное и естественное движение для но тогда увеличится число фазовых координат, усложнятся уравнения движения и станет более трудным общее исследование Если рассмотреть те же уравнения движения, но поменять ролями, то мы получим задачу почти той же трудности и во многом аналогичную прежней Если допустить, что игроки могут использовать промежуточные значения навигационных величин, что скорость не превосходит и сила, которая заставляет передвигаться, не превосходит то это Ничего не изменит, поскольку для оптимальных стратегий (читатель может убедиться в этом) игроки используют в каждый момент крайние значения

Задача, вообще говоря, аналогична задаче «шофер-убийца» Но решение последней (несмотря на то, что локальное движение обычно очень простое) включает в себя большое количество сингулярных поверхностей, поэтому рассмотрение ее мы отложим до тех глав, где мы будем лучше подготовлены теоретически Здесь же более сложными оказываются дифференциальные уравнения, зато решение — более гладким, для получения оптимальных траекторий достаточно будет проинтегрировать уравнения характеристик Формально можно сказать, что здесь нет линейных вектограмм, все максимумы и минимумы достигаются на внутренних точках, и нет резких скачков управлений,

которые бы запугали картину Тем не менее мы найдем здесь некоторый аналог маневра разворота (§ 1.5)

Будем считать, что на действует также сила трения, пропорциональная его скорости На это имеются две причины Одна состоит в том, что при отсутствии трения скорость стала бы неограниченной рассматриваемая игра и является идеа лизацпей, допущение неограниченной скорости все же представ ляется чрезмерно нереальным Если сила трения равна скорости, умноженной на то предельное значение скорости равно К этому значению асимптотически стремилась бы скорость при постоянном направтении действующей силы Вторая при чина состоит в том, что при введении трения возникает интерес вопрос при каких обстоятельствах все же возможен захват, если Хотя такие игры качества будут рассмотрены же (гл 8 и 9), ответ на этот вопрос удается получить уже здесь Если читатель предпочитает обойти сложности, связанные с учетом трения, то он может полагать Там, где формально этого сделать нельзя, будут даны пояснения в квадратных скобках

Введем радиус захвата будем считать захват осуществленным, если

Начнем рассмотрение в естественном шестимерном про странстве Позднее мы перейдем к редуцированному трехмер ному пространству В естественном пространстве рассмотрения будут более простыми и наглядными, а выкладки более длинными

Состояние описывается четырьмя координатами (две координаты для положения и две для скорости) Для достаточно задать две координаты положения Пусть х, у — декартовы координаты а компоненты его скорости Координаты обозначим через Пусть управлением первого игрока будет угол между вектором силы и осью у, обозначенный через а угол наклона вектора скорости к оси обозначенный через , будет управлением второго игрока Сравнения движения тогда имеют вид

Первые два уравнения просто показывают, скорость движения Следующие два выражают его ускорение через разность между удельной движущей силой и трением Два последних уравнения описывают простое движение

Поскольку платой является время захвата, здесь Будем обозначать частную производную от V по х через аналогично для Тогда основное уравнение (4 2 1) примет вид

Положив

и

получим (из леммы 2,8)

Теперь можно написагь основное уравнение (4 2 3)

Уравнения характеристик в регрессивной форме находим обычным способом. Имеем

Терминальная поверхность характеризуется условием Введем для ее описания пять параметров:

Здесь координаты произвольны, находится на расстоянии от причем вектор наклонен к вертикали под углом

Найдем теперь допустимую область поверхности Положим т. е.

Тогда для точек из имеем

Допустимая область определяется условием

и состоит из тех точек поверхности для которых

Упражнение 5.5.1. С помощью векторной диаграммы получить этот результат геометрически. Представляя себе область захвата в виде диска с центром в дать наглядную интерпретацию допустимой области (например, может использовать для захвата лишь переднюю по отношению к направлению скорости часть диска и т. д.).

Определим теперь V, на пополнив тем самым множество начальных условий, необходимых для интегрирования. Так как на то

Из последнего уравнения и из первых двух следует, что для некоторого X

Подставив эти значения в основное уравнение типа (4.2.3), получим уравнение для Оно имеет два решения, соответствующих подходу к поверхности (если рассматривать ее как окружность с центром в изнутри и извне. Нас интересует лишь последний случай.

Пусть Для точки х, расположенной на это означает, что находится на расстоянии I прямо над Пусть движется прямо вверх (т. е. возрастает), тогда функция V становится положительной. Следовательно, когда Из второго уравнения (5.5.2) получаем, что

Подстановка в основное уравнение типа (4.2.3) дает

(Заметьте, что на но поэтому нам нужно было определить соответствующий знак Таким образом,

и из (5.5.1) следует, что в допустимой области

Теперь уже можно приступать к интегрированию. Прежде всего можно сразу сказать, что равенства (5.5.2) выполняются вдоль всех оптимальных траекторий (а не только на потому что из уравненийхарактеристик мы знаем, что равны нулю. Проинтегрируем теперь третье и четвертое уравнения из правой колонки уравнений характеристик. Получим

[Если эти соотношения превращаются в ]

Здесь полезно вернуться к оптимальным стратегиям Заметив. что

находим

или

Итак, мы определили, что на оптимальной траектории оба управления постоянны и равны между собой, т. е. движется по прямой, а сохраняет постоянное направление вектора своей движущей силы, причем это направление совпадает с направлением прямой, по которой движется Последнее утверждение означает, что в момент захвата находится точно позади (по отношению к направлению его движения).

Задача 5.5.1. В какой степени на этот результат влияют уравнения движения и в какой — вид Как изменится результат с изменением типа терминальной поверхности (например, если область захвата более сложная, чем См. в дополнении задачу о траектории снаряда, где обсуждаются подобные вопросы.

Теперь задача определения оптимальной стратегии сведена к нахождению упомянутого общего направления. Разумеется, оно должно быть определено для всех точек из У.

Проинтегрируем левые из уравнений характеристик. В результате получим

Для формулы аналогичны, только в них заменяется на на [Если , первые две формулы превращаются в

Следующим шагом для определения полного формального решения является разрешение этих шести уравнений для фазовых координат относительно шести неизвестных . В частности, или будет ценой игры Если обозначить

то с помощью несложных выкладок можно получить

[Для имеем

Теперь можно исключить возводя (5.5.5) и (5.5.6) в квадрат и складывая.

Рис. 5.5.1.

Это естественным образом приводит нас к тому типу координат, который можно использовать в редуцированном пространстве.

Пусть вектор положения относительно т. е. — вектор скорости После возведения в квадрат и сложения получаем

Это уравнение должно быть решено относительно уравнение принимает вид

Заметим, что для каждой конкретной игры фиксированная функция, она не зависит от фазовых координат и определяется только параметрами. На рис. 5 5.1 приведен ее график для

Скоро мы покажем, что левая часть уравнения (5.5.7) содержит все фазовые координаты, которые появляются в соответствующим образом выбранном редуцированном пространстве.

Примем пока как рабочую гипотезу допущение о том, что

смысл этого допущения обсудим позже. Из (5.5.4) следует, что

Тогда наше допущение (5.5.9) требует, чтобы т. е. чтобы предельная скорость была большей, чем скорость (избавим себя от разбора случайной ситуации

Заметим, что при левая часть уравнения (5.5 7) ограничена. Кроме того, она всегда положительна. Действительно, рассматривая ее как квадратный трехчлен, видим, что дискриминант его отрицателен в силу неравенства Шварца

Для любой внутренней точки пространства уравнение (5 5 7) удовлетворяется при некотором положительном В самом деле, при

а для больших знак неравенства изменится на противоположный.

Пусть наименьшее решение уравнения (5 5.7) [Для уравнение (5.5.7) является алгебраическим уравнением четвертой степени. Как и раньше, изменение знака неравенства при переходе от к большим указывает на существование положительного корня.]

Нахождение корней трансцендентного [алгебраического] уравнения (5.5.7) в сущности завершает вычислительные операции, необходимые для получения решения задачи. Функция представляет собой цену игры Подстановка вместо в (5.5.5) и (5 5.6) позволяет найти функцию определенную на всем Оптимальными стратегиями будут

Читатель может самостоятельно провести формальную проверку наших выводов. Если партия начинается в точке х и игроки применяют стратегии (5.5.11), сохраняя их постоянными в течение партии, можно убедиться, что функция подсчитанная для каждой последующей позиции, убывает с единичной скоростью По истечении времени то она обращается в нуль почему мы должны брать наименьший корень) и впервые становится равным

Гораздо больше информации можно извлечь из аналогичных рассмотрений в редуцированном пространстве. Такое пространство здесь трехмерно, так что можно наглядно представить себе всю картину.

Пусть расположены, как показано на рис. 5.5.2, а, где стрелка означает скорость равную по величине Относительные координаты являются соответственно перпендикулярной и параллельной составляющими вектора на направление скорости Примем за фазовые координаты в редуцированном пространстве.

Рис. 5.5.2

Тогда терминальной поверхностью здесь будет цилиндр радиуса I с осью а определяется как полупространство где без внутренних точек цилиндра (см. рис. 5.5.2, б). Поскольку

уравнение (5.5.7) в новых координатах имеет вид

[или ].

Исследуем теперь поверхности (5.5.12) в соответствующие постоянному значению Если зафиксировать также и то (5.5.12) станет уравнением окружности с центром в точке

и радиусом Тогда этими поверхностями будут цилиндры радиуса вертикальные сечения которых представляют собой окружности, а осями являются линии

При эти цилиндры обращаются в

На рис. 5.5.3 схематично показаны такие цилиндры, соответствующие малым значениям а на рис. 5.5.4 уже более аккуратно изображено сечение при для конкретного случая (5.5.8).

Заметим, что окружности постоянных значений когда мало, имеют отчетливо видимую огибающую. Две ветви этой огибающей встречаются с на границе допустимой области.

Рис. 5.5.3.

То, что нам оказывается нужным лишь наименьшее из решений уравнения (5.5.7), здесь соответствует тому, что нам не нужны окружности целиком (для малых V), а только верхние дуги, стягивающие точки огибающих. Таким образом, между огибающими кривыми имеется гладкое семейство кривых постоянных значений V (эти значения отмечены на рисунке), которые сливаются с допустимой областью, где, разумеется,

Когда значение V около 2, огибающие оканчиваются. Начиная отсюда, мы отбрасываем те дуги окружностей, которые проходят через области, уже отмеченные меньшими значениями Для достаточно больших V (на рисунке это не показано) мы оставляем полные окружности.

Огибающие разделяют пространство на две части, и их можно причислить к тому типу поверхностей, который в гл. 8 и 9 будет назван барьером. Здесь барьер касается в точках

границы допустимой области Барьер является поверхностью, которая никогда не пересекается при оптимальном развитии игры и на которой терпят разрывы как V, так и оптимальные стратегии.

Рис. 5.5.4. (см. скан)

Эта поверхность отделяет начальные точки, из которых партия при оптимальном ее ходе сводится к простой прямолинейной погоне, от начальных точек, которые приводят к тому, что по

аналогии с игрой «шофер-убийца» следует назвать маневром разворота.

Если точка расположена между барьерами, как, например, А на рис, 5.5.4, то начинающаяся из нее партия сводится к прямой погоне: убегает прочь от который преследует его по пятам.

Рис. 5.5.5. (см. скан)

В принятом нами редуцированном пространстве для начальной точки, лежащей за барьером, скажем В, оптимальная траектория в сначала отступает от затем скользит вдоль краев барьеров и достигает через узкий промежуток между ними. «Физически» это означает, что кинематические

ограничения делают недостаточно ловким, чтобы сразу прямо преследовать не может настолько отклониться от своего курса, чтобы помешать отступить в сторону. Следовательно, должен сначала уменьшить свою скорость так, чтобы сделать достаточно резкий поворот, а затем следовать за который теперь движется к точке, расположенной в тылу относительно начального положения

Соответствующие этим случаям реальные перемещения изображены на рис. 5.5.5, а, б. Здесь и означают начальные положения игроков, и их положения в момент захвата.

На рис. 5.5.5, б сворачивает к точке, расположенной в тылу тем самым вынуждая последнего к более крутому повороту. Играющий оптимально предвидит этот ход и выбирает наилучшее направление движущей силы (которое совпадает с направлением траектории Несмотря на то что начальное положение на рис. 5.5.5, а незначительно отличается от начального положения на рис. 5.5.5, б, здесь уже не может предпринять такой же маневр; он был бы быстрее схвачен, если бы направился назад, в тыл к Заметьте, что в то время как

Теперь ясно, что означает допущение (5.5.9) о том, что Если бы оно не выполнялось, то «радиус» цилиндра постоянных значений V где-то сжимался бы до нуля и два барьера тогда бы пересекались. Предвосхищая выводы § 9.3, где этот вопрос подробно исследуется, заметим здесь, что если откинуть части барьеров после их пересечения, то оставшаяся поверхность вместе с по-видимому, будет отделять некоторую область в У-Для начальных точек, лежащих внутри этой области, предыдущие рассуждения остаются справедливыми. Внешние же точки таковы, что если партия начинается в них и играет оптимально, то никогда не сможет поймать его.

Таким образом, как уже было отмечено выше относительно (5.5.10), если имеет возможность осуществить захват из каждой начальной точки, то это условие необходимо, но не достаточно [см. упражнение 9.3.1 или утверждение (9.3.7). если ].

1
Оглавление
email@scask.ru