Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
6.4. ВОПРОС О ПОСТОЯННО ДЕЙСТВУЮЩЕЙ ДИЛЕММЕЭффект, получаемый от применения мгновенной смешанной стратегии, невелик, так как практически длительность ее применения мала. Но встречаются случаи, когда необходимо придерживаться смешанной стратегии на значительном интервале. Мы будем называть это явление, постоянно действующей дилеммой. Чтобы пояснить суть таких явлений, рассмотрим следующий типичный пример. Пример 6.4.1. Игра преследования в полуплоскости. Пусть обладают простым движением, скорости их равны соответственно Пространство игры представляет собой полуплоскость; ее граница является «стеной», сквозь которую не может проникнуть. Будем рассматривать лишь те начальные положения, когда находится на В качестве платы выбираем время захвата. Будем сперва рассматривать захват как совпадение точек Можно либо считать очевидным тот факт, что для лучше всего всегда оставаться около стены, либо считать это ограничение одним из условий задачи. В последнем случае мы приходим к другой имеющей существенный интерес задаче — о перехвате убегающего, когда тот вынужден двигаться по заданной прямой. Если начальное положение игроков таково, как, скажем, на рис. 6.4.1, а, то оптимальное развитие игры попятно: движется вверх, а выбирает прямолинейную траекторию, которая обеспечивает захват в точке С. Хорошо известно (и это легко проверить), что если осуществляет такой «курс столкновения», угол наклона прямой остается постоянным (отсюда очевидна разумность преследования вторгшегося противника по методу движения «под постоянным углом»). Упомянутая выше дилемма возникает в случае, когда направление перпендикулярно к Тогда оба игрока сталкиваются с возможностью выбора направлений либо 1, либо 2 (рис. как в примере игры погони с препятствием (см. рис. 6.3.1). Допустим, что игра развивается при условии, что оба игрока делают совпадающие выборы (например, 1 и 1); тогда из принципа движения под постоянным углом следует, что направление остается перпендикулярным к Тогда в каждый момент игры может изменить направление своей скорости на противоположное, не жертвуя при этом оптимальностью своей стратегии. Тот факт, что все время имеет в виду возможность такого изменения направления скорости следовательно, в каждый момент сталкивается с возможностью двух выборов, указывает нам, что в этом примере мы получаем искомый случай постоянно действующей дилеммы. Возможно, читатель отыщет другие примеры игр, где встречаются подобные явления. Как должны при этом действовать игроки? С точки зрения теории, непрерывное применение смешанных стратегий на конечном интервале кажется абсурдным.
Рис. 6.4.1. Но эта трудность вряд ли является основанием для того, чтобы игнорировать выводы теории. Во многих случаях, описывающих реальные явления, бывает, что трудности обусловлены просто неудачной постановкой задачи. Если терминальное многообразие имеет размерность, меньшую чем (а это в самом деле так при условии точечного захвата), то неудобство такой постановки может проявиться в возникновении постоянно действующей дилеммы. Как только восстанавливается подходящая размерность, затруднение сразу исчезает. Причина становится очевидной, если игру перенести в соответствующим образом выбранное редуцированное пространство. Однако вернемся к нашему примеру. Перейдем теперь к -захвату, т. е. восстановим подходящую размерность поверхности Поместим в центр диска радиуса (рис 6 4.2), который является областью захвата. Снова предполагая, что в начале игры мы видим, что «курс столкновения» приводит в некоторую точку С, а в точку лежащую на отрезке и такую, что Заметим, что при развитии игры наклон отрезка меняется: отрезок становится менее горизонтальным, пока не превращается в в момент захвата. Таким образом, перпендикулярность сразу оказывается нарушенной и уже не восстанавливается. Несмотря на простоту этой игры, ее формальный анализ позволяет получить много интересного, что потребуется нам в следующих главах для пояснения некоторых идей.
Рис. 6.4.2
Рис. 6.4.3. Ясно, что редуцированное пространство здесь можно сделать двумерным с координатами х, у, как на рис. 6.4 3, а. Тогда легко записать уравнения движения:
где . Основное уравнение (4.2.1) здесь имеет вид
Обозначив получаем и основное уравнение (4.2.3) есть
Напишем теперь уравнения характеристик
Приняв таким, как показано на рис. 6.4.3, б , получим для
Таким образом,
Следовательно,
Поскольку вектор градиента должен быть направлен внутрь ясно, что нам не требуется знать конкретное значение К. Наконец, получаем
Из условия ясно, что сохраняют те значения, которые они имеют на и тогда интегрирование уравнений
с соответствующими начальными условиями дает уравнения оптимальных траекторий
|
1 |
Оглавление
|