Главная > Дифференциальные игры
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

1.9. ДВА ПРИМЕРА

Рассмотрим здесь две задачи преследования. Обе они кажутся до некоторой степени искусственными, зато они настолько просты, что решения их убедительны и понятны уже сейчас, когда вводятся только начальные положения теории. Обе игры поясняют некоторые идеи, и в особенности природу стратегий.

Раньше уже было введено такое определение захвата: захват считается осуществленным, если расстояние между не превосходит Для простоты положим здесь

Пример 1.9.1. Простейшая игра преследования. Пусть оба игрока, обладают простым движением и перемещаются на плоскости; скорости их равны соответственно Платой является время захвата.

В этой простой постановке, если не предполагать никаких посторонних воздействий, которым подвержены решение игры очевидно. Оба игрока движутся вдоль прямой линии, которая соединяет точки их начальных положений; убегает, преследует его; так продолжается до тех пор, пока не догонит

Этот случай изображен на рис. 1.9.1, а (скорости игроков представлены на рис. Захват происходит в точке, отмеченной значком плата равняется (приближенно) 15,5 единицы времени. Это число есть цена игры, под которой понимается следующее.

Как бы ни действовал он не сможет отсрочить захват более чем на 15,5. Если он предпримет еще какой-нибудь маневр, кроме убегания по прямой, сможет настичь его раньше, чем за 15,5. Соответственно не может осуществить захват за время, меньшее чем 15,5, а если он не осуществляет прямого преследования последний может оставаться на свободе дольше чем 15,5.

Напомним введенное раньше понятие стратегии — управление как функция фазовых координат; мы видим, что представляют собой здесь оптимальные стратегии Для это есть предписание двигаться по направлению к при любом его положении. На рис. 1.9.1, б изображена та же самая игра, когда ведет себя неоптимально; он движется вдоль прямой Тогда преграждает ему путь и в точке X настигает его за 6 единиц времени.

(кликните для просмотра скана)

Но казалось бы, может действовать лучше. Если будет двигаться вдоль прямой то может экстраполировать его будущее положение, вычислить точку столкновения и двигаться прямо в эту точку. Этот исход изображен на рис. 1.9.1, г, где совершает захват за время около 4,3. Почему такой образ действий не является для оптимальной стратегией?

Дело в том, что нет оснований делать какие-либо предсказания относительно поведения Мы сформулировали игру так, что может выбирать направление движения, как хочет. Выбранная математическая модель ни в коем случае не дает права предполагать, что будет упорствовать в своем движении по

Предположим, что забывает о захватнических планах в течение первых двух единиц времени. Затем, спохватившись, он запоздало принимает решение придерживаться оптимальной стратегии, покидает прямую и начинает убегать прочь от На рис. 1.9.1, в и изображено это движение и соответствующее ему поведение точки захвата обозначены символом X, плата равна соответственно 9,3 и 10. Первый способ действия оказывается лучшим; здесь использует лишь свою информацию о положении в данный момент и ничего более.

Поведение изображенное на рис. 1.9.1, в, можно описать следующим образом. В каждый момент действует так, как если бы он встретил в будущем оптимальное противодействие со стороны Такая трактовка оптимальной стратегии относится к обоим противникам во всех играх преследования в нашей формулировке.

Если знает о том, что не всегда обнаруживает преследователя, и мы хотим принять это в расчет, то нужно формулировать новую игру. Можно было бы, например, оценить распределение вероятности времени, в течение которого не реагирует на присутствие В этой новой игре преследования платой должна была бы быть случайная величина — время захвата, а здесь имел бы, возможно, уже другую оптимальную стратегию

С другой стороны, когда замечает, что по забывчивости следует вдоль должен ли он сделать из этого вывод, что совсем не в состоянии обнаружить или уклониться в сторону? Если да, то, конечно, стратегия, рассчитывающая на столкновение и изображенная на рис. 1.9.1, г, является наилучшей. Пересмотренная заново игра может быть построена с учетом оценки вероятности того, что никак не реагирует на присутствие Но такой подход дает немного; это просто случай, когда решение человека-пилота может превзойти формальную стратегию.

Пример 1.9.2) Защита объекта. Оба игрока обладают простым движением и имеют одинаковые постоянные скорости. Цель защитить от нападения объект С, который мы принимаем за некоторую область на плоскости. Платой является расстояние от С до точки, где происходит захват. Задачу иллюстрирует рис. 1.9.2, а, где точки означают начальные положения противников.

Оптимальные стратегии находим следующим образом. Проведем перпендикуляр к отрезку через его середину. Каждую точку верхней полуплоскости игрок достигнет раньше, чем для точек нижней полуплоскости наоборот. Пусть ближайшая к С точка перпендикуляра. Оптимальные стратегии для обоих игроков состоят в движении в точке Здесь происходит захват, и длина пунктирного отрезка есть цена игры.

Посмотрим, что случится, если действует оптимально, а нет; скажем, он решил двигаться вдоль прямой (см. рис. 1.9.2, б). В этом случае всегда направляется в ближайшую к С точку на перпендикуляре (относительно текущего положения Несколько положений этой точки обозначены Заметим, что длина пунктирных отрезков увеличивается. Это соответствует росту штрафа, который платит за свою неудачную стратегию. Каждая длина есть плата, соответствующая текущему моменту, в который мог бы вернуться к оптимальной стратегии и, следовательно, это лучшее, на что он может надеяться.

Поскольку точки последовательно являются целями движения он описывает криволинейную траекторию до тех пор, пока не достигнет С этого момента точка остается неподвижной, оба игрока движутся прямолинейно, и игра становится оптимальной для обеих сторон. Захват происходит в точке, отмеченной значком

Приведенное в примере 1.9.1 рассуждение о том, что игроки не должны делать никаких предсказаний, применимо и здесь. Если заранее уверен, что никогда не покинет прямую то наилучший образ его действий — движение но прямой в точку У (точка пересечения перпендикуляра с прямой Если не уверен в этом, он раньше сворачивает вправо, так как знает, что когда недалеко от начального положения, верхняя правая часть объекта С наиболее уязвима, и движется так, чтобы прикрыть именно ее. По мере продвижения вперед опасность уменьшается, и, наконец, целью становится захват.

(кликните для просмотра скана)

Рис. 1.9.2, в соответствует случаю, когда действует неоптимально, двигаясь вдоль прямой Теперь должен всегда направляться в движущуюся точку Пунктирные отрезки укорачиваются, и когда находится в точке А, точка фактически достигает С. Из точки А он движется прямо по направлению к и действительно достигает С, а уже ничего не может сделать, чтобы остановить его ( находится в В, когда находится в А).

1
Оглавление
email@scask.ru