Главная > Дифференциальные игры
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

ГЛАВА 8. Игры качества

Типичным примером игры качества (в отличие от игры степени) является задача преследования в том случае, когда нас интересует не вопрос оптимизации некоторой непрерывной платы, а условия, при которых игрок может осуществить захват или игрок -избежать его.

До сих пор, насколько нам известно, существовал лишь один подход к задачам подобного рода. Мы назвали его «методом явной политики». Этот метод состоит в том, что, например, возможность захвата доказывается на основе изучения конкретной стратегии игрока которая приводит к цели. Недостаток этого метода в том, что почти во всех случаях он не дает способа определить наилучшее решение для каждого из игроков; искать такое решение значит блуждать в темноте. Вообще редко можно найти все решения одной частной задачи, не говоря уже о решении всех задач целого класса.

Новым при рассмотрении такого рода задач здесь является введение гиперповерхности, называемой нами барьером; в пространстве начальных положений барьер отделяет точки, для которых можно осуществить захват, от тех точек, для которых возможно избежать его. Оптимальное развитие игры для точек, лежащих на барьере, приводит к достижению терминальной поверхности без пересечения ее. Такие исходы мы будем называть нейтральными, рассматривая их как промежуточные между захватом и избежанием его. Преимущество нейтральных исходов над всеми остальными состоит в том, что для них существуют вполне определенные оптимальные стратегии.

Игры качества, как и игры степени, исследуются с помощью дифференциальных уравнений: находятся оптимальные стратегии и траектории и, следовательно, барьеры. Тогда общий ответ на вопрос, произойдет или нет захват, зависит от того, разделяет ли барьер пространство игры на две части.

Одно из главных затруднений состоит в определении соответствующих начальных условий, или, другими словами, способов стыковки барьера с терминальной поверхностью. Нам удалось обнаружить три различных условия, одно из которых

оказывается довольно тонким. Они охватывают все практические вопросы, с которыми нам пришлось столкнуться, однако, по-видимому, не исчерпывают всех возможностей.

Важные задачи, решенные этими методами, будут приведены в следующей главе, здесь же мы ограничимся простыми иллюстрациями.

8.1. ВВЕДЕНИЕ

В играх степени игроки стремятся максимизировать и минимизировать определенную плату, которая, как предполагается, может принимать континуум допустимых числовых значений. Для любой партии конкретное значение платы не установлено вплоть до окончания игры, под которым понимается достижение точкой х терминальной поверхности Таким образом, вся теория игр степени строится на допущении, что поверхность достигается.

В этой главе рассматриваются игры качества, в которых суть задачи представляет вопрос о возможности окончания.

Почти всегда предполагается, что один игрок хочет окончить игру, а его противник нет. Эти противоположные желания и составляют конфликт игры. Однако возможно и даже полезно исследовать другие обстоятельства. Например, задача об избежании столкновения двух самолетов. Оба пилота хотят предотвратить «окончание», означающее в данном случае столкновение. Хотя такие задачи не относятся к области дифференциальных игр, их можно исследовать теми же методами.

При рассмотрении всех случаев игр качества мы будем использовать язык задачи преследования. То есть мы будем считать, что окончания (т. е. захвата для игры преследования) желает игрок а игрок желает избежать окончания.

Чтобы рассматривать игры качества в общей схеме, можно каждому возможному исходу поставить в соответствие определенное числовое значение, тем самым возвращаясь к подходу к таким играм с точки зрения платы. Например, +1 соответствует отсутствию окончания, или избежанию захвата;

— 1 соответствует окончанию, или захвату.

Это дает возможность оставаться минимизирующим и максимизирующим игроками.

При выбранных таким образом значениях платы цена игры в соответствии с общей теорией игр равна

+1, если существует такая стратегия для что при ее использовании независимо от стратегии никогда не произойдет окончания; (8.1.1)

— 1, если существует некоторая стратегия для применяя которую, он независимо от стратегии обязательно добьется окончания игры. (8.1.2)

На практике нам не потребуется это формально введенное понятие числовой платы. Тем не менее отметим, что определение двух этих стратегий как оптимальных для вполне согласуется с общепринятыми определениями.

В отличие от игр степени для большинства рассмотренных примеров оптимальные стратегии определяются неоднозначно; более того, существует бесконечно много оптимальных стратегий. Рассмотрим, например, любую достаточно простую задачу преследования, в которой кинематические характеристики намного лучше, чем так что он может осуществить захват из любой начальной точки (т. е. для всех Поскольку нас интересует захват вообще независимо от времени, ясно, что может сколь угодно долго «бездельничать»; никаких предпочтительных управлений не существует. Аналогично если преимущество на стороне то имеет полную свободу действий, за исключением того момента, когда над ним нависнет угроза захвата, но и тогда он может ускользнуть, подпустив врага так близко, как он захочет.

Чтобы доказать, что имеет возможность осуществить захват или что имеет возможность избежать его, достаточно найти одну конкретную стратегию, позволяющую игроку добиться соответствующего исхода независимо от действий противника. Такой наиболее очевидный подход к решению игр качества мы будем условно называть «методом явной политики». В качестве примера рассмотрим

Пример 8.1.1. Игра двух автомобилей. Точки движутся на плоскости, скорость каждой точки фиксирована (или ограничена), кривизна траекторий ограничена. Значения этих четырех ограничений могут быть различными. Захват, как обычно означает, что При каких условиях может поймать

Если скорость больше, чем а ограничение на кривизну траектории по крайней мере такое же, то всегда может осуществить захват. В самом деле, сначала может приблизиться к начальному положению а затем следовать за ним по его траектории.

Вообще говоря, такой способ нахождения соответствующего поведения игроков имеет существенный недостаток, ибо не дает систематического метода отыскания этого поведения. В каждой задаче мы должны заново проявлять изобретательность. Например, кажется разумным утверждение, что может осуществить захват при незначительно меньшей, чем кривизне траектории, большей скорости и достаточно большом значении радиуса захвата Однако как найти поведение с помощью которого можно было бы показать это?

В этой главе мы предлагаем подход, который обладает, по-видимому, достаточной общностью и может быть применен почти во всех случаях. С помощью незначительного и естественного изменения критерия мы выделяем в такое подмножество, где оптимальные стратегии вполне определены или даже единственны. Искусственные политики, такие, как в примере 8.1.1, при этом становятся ненужными.

1
Оглавление
email@scask.ru