Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
3.3. ИГРЫ НА УНИЧТОЖЕНИЕВ простейшем случае имеются всего лишь две фазовые координаты, х и у, которые означают силы двух противников. Игра оканчивается, когда какая-нибудь из этих координат сведена к нулю; платой для выжившего игрока является количество его уцелевших сил. Примем за Возможности выбора игроков, выраженные в «уравнениях движения», позволяют им либо быстрее вести партию к окончанию, либо возможно быстрее истощать силы врага. Для каждого из игроков эффект возрастает с ростом его собственной мощи или с уменьшением мощи противника. Трудно, разумеется, с помощью всего лишь двух фазовых координат и вышеописанных допустимых перемещений получить модель, сколько-нибудь схожую с реальностью. Поэтому мы не требуем, чтобы у рассматриваемой игры существовал какой-то реальный прототип. Однако мы сохраним низкую размерность пространства Рассматриваемый пример является образцом того случая, когда дифференциальная игра может быть хорошо приближена дискретной. Диаграммы, построенной по приведенной в предыдущем параграфе схеме, у этой игры нет; она ближе к дифференциальной игре с терминальной платой. Пример 3.3.1. Простейшая игра на уничтожение. Пространство игры Противники ходят поочередно. Можно представлять себе фишку х, расположенную в начале игры в некотором узле решетки (как и в непрерывном случае, каждая точка может служить начальным положением). Игроки движутся попеременно, выбирая одно из допустимых перемещений согласно соответствующей вектограмме. Партия оканчивается, когда х достигает или пересекает
Рис. 3.3.1. Будем считать, что середине отрезка между двумя узлами решетки соответствует величина платы, большая по модулю. Будем решать эту игру, как и раньше, находя функцию Выделим сперва те точки, начинаясь в которых, игра должна закончиться за один ход, независимо от выбора игроков. Тогда для каждого партнера можно определить значение V в этих точках, выяснив, какой из возможных исходов является для него наилучшим. В результате получаем диаграмму, приведенную на рис. 3.3.2. Например, в точке в распоряжении
Рис. 3.3.2 Этот первый шаг можно рассматривать как часть общей процедуры, подчиняющейся следующему правилу. Двигаясь из точки х и зная значения цены игры для противника во всех точках, куда он может переместиться за один ход, игрок выбирает ту точку, где значение цены максимально (если это Повторное применение этого правила полностью определяет V для обоих игроков. Например, если Теперь оптимальные стратегии известны сразу для двух игроков; игрок выбирает решение в соответствии с нашим правилом. На рис. 3.3.4 изображены оптимальные траектории для двух соседних начальных точек (11, —14) и (10, —14), в которых V (для Рис. 3.3.3 (см. скан) Если в какой-либо точке игрок имеет более одного оптимального хода, все они показаны на рисунке. Таким образом, на рисунке изображены все оптимальные траектории, исходящие из выбранных начальных точек. Укажем одну трудность, незначительную для рассмотренного случая, но которая может оказаться серьезной в других вариантах. Сформулируем ее в виде задачи Задача 3.3.1. Заметим, что на нижней вектограмме для хода, возможен такой исход, когда оба игрока упорно останавливают свой выбор лишь на этих ходах, так что х колеблется между двумя точками и партия никогда не оканчивается Припишем не имеющей конца партии плату, равную нулю. Рис. 3.3.4. (см. скан) Показать теперь, что при оптимальном ходе игры партия всегда оканчивается, и указать, как находить V для пары критических точек. Исследовать общий вопрос о критерии оптимальности для подобного рода бесконечных колебательных движений. Задача 3.3.2. Заметим, что на рис. 3.3.4 при движении из точки (11, —14) (верхняя картинка) траектория Выяснить, хотя бы приближенно, какие факторы определяют количество ходов игрока, допускаемых оптимальной стратегией. Предположим теперь, что нас не интересует количество уцелевших сил игрока, но мы просто хотим знать, который из игроков — разумеется, если борьба ведется до конца, — оказывается уничтоженным. Тогда мы имеем игру качества, в которой игрок, уничтоживший своего противника, является победителем. Конечно, полученное раньше решение позволяет сразу же решить и эту новую игру; мы просто находим величину V и смотрим, какого она знака. Но нет ли прямого метода, позволяющего решить игру качества без отыскания решения для всего множества Для определенности будем предполагать, что Пример 3.3.2. Игра на уничтожение (игра качества). Описанная выше игра на уничтожение, рассматриваемая как игра качества, имеет решение, показанное на рис. 3.3.5, где отмеченные узлы решетки образуют барьер. С каждой отмеченной кружком точкой барьера (за исключением начала координат) связаны одна или несколько стрелок, обозначающих оптимальную стратегию для начала координат). Предположим, что
Рис. 3.3.5. Тогда точка х должна достичь оси у, и, таким образом, либо выигрывает Далее, заметим, что барьер является самой нижней «кривой», обладающей только что описанным свойством. Это замечание поясняет следующее построение: предположим, что точки барьера построены на прямых прошедшая такую проверку, будет новой точкой барьера. Это построение, разумеется, можно начинать с нулевой точки. Приведенное построение также поясняет утверждение о свойстве нижних от барьера точек. Оно состоит в том, что если начальная точка расположена ниже барьера, то Упражнение 3.3.1. Построить барьер для случая, когда
|
1 |
Оглавление
|