Главная > Исследование операций
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

7. ИГРА 2Х2

Наиболее простым случаем конечной игры является игра 2x2, где у каждого игрока две стратегии. Рассмотрим игру с матрицей:

Здесь могут встретиться два случая:

1) игра имеет седловую точку;

2) игра не имеет седловой точки.

В первом случае решение очевидно: это — пара стратегий, пересекающихся в седловой точке. Нетрудно доказать, что если игра 2x2 имеет седловую точку, то в этой игре всегда какая-нибудь из стратегий может быть отброшена как заведомо невыгодная или дублирующая. Не будем этого доказывать. Предоставим читателю доказать это положение или убедиться в его справедливости на ряде произвольно выбранных примеров.

Рассмотрим второй случай: предположим, что в матрице 2x2 седловой точки нет. При этом нижняя цена игры не равна верхней: . Решение должно быть в смешанных стратегиях. Найдем это решение, т. е. пару оптимальных смешанных стратегий:

Сначала определим оптимальную смешанную стратегию .

Согласно теореме об активных стратегиях (см. § 5), если мы будем придерживаться этой стретегии, то, независимо от образа действий противника (если он только не выходит за пределы своих активных стратегий), выигрыш будет оставаться равным цене игры v. В игре 2x2 обе стратегии противника являются активными (иначе игра имела бы седловую точку). Значит, если мы придерживаемся своей оптимальной стратегии , то противник может, не меняя выигрыша, применять любую из своих чистых стратегий. Отсюда имеем два уравнения:

из которых, принимая во внимание условие получим:

Цену игры v найдем, подставляя значения в любое из уравнений (7.1):

Аналогично находится оптимальная стратегия противника:

из уравнений

(откуда

Пример 1. Найти решение игры «поиск» (см. пример 1 § 2). Решение. Игра 2 X 2 с матрицей не имеет седловой точки:

Ищем решение в смешанных стратегиях. По формулам (7.2), (7.3), (7.5) получаем:

Следовательно, оптимальная стратегия каждого игрока состоит в том, чтобы случайным образом чередовать свои чистые стратегии, пользуясь каждой из них с вероятностью 1/2; при этом средний выигрыш будет равен нулю (этот вывод уже был получен нами из интуитивных соображений). В следующем примере мы рассмотрим игру, решение которой не является столь очевидным.

Пример 2. Игра «Два бомбардировщика и истребитель».

Сторона А посылает в район расположения противника В два бомбардировщика I и II; I летит спереди, II — сзади. Один из бомбардировщиков (заранее неизвестно, какой) должен нести бомбу, другой выполняет только функцию сопровождения. В районе противника бомбардировщики подвергаются нападению истребителя стороны В (рис. 9.2). Оба бомбардировщика вооружены пушками. Если истребитель атакует задний бомбардировщик, то по нему ведут огонь пушки только этого бомбардировщика, поражающие истребитель с вероятностью 0,3. Если же истребитель атакует передний бомбардировщик, по нему ведут огонь пушки как переднего, так и заднего бомбардировщика; совместно они поражают его с вероятностью

Если истребитель не сбит ответным огнем бомбардировщиков, то он поражает выбранную им цель с вероятностью 0,8.

Задача бомбардировщиков — донести бомбу до цели; задача истребителя — воспрепятствовать этому.

Требуется найти оптимальные стратегии сторон:

— Для стороны А — какой бомбардировщик сделать носителем?

— Для стороны В — какой бомбардировщик атаковать?

Решение. Составим матрицу игры, для чего найдем средний выигрыш при каждой комбинации стратегий. Выигрыш — вероятность непоражения носителя.

1. — носитель l, атакуется 1.

Носитель не будет поражен, если бомбардировщики собьют истребитель, или же если они его не собьют, но и он не поразит свою цель. Вероятность того, что оба бомбардировщика вместе поразят истребитель, равна 0,51, поэтому

2. — носитель II, атакуется I;

3. — носитель 1, атакуется II;

4. — носитель II, атакуется II;

Матрица игры с добавочным столбцом и строкой:

Нижняя — цена игры верхняя Игра не имеет седловой точки; решение достигается в смешанных стратегиях. По формулам (7.2), (7.3), (7.5) находим (с точностью до третьего знака после запятой):

(В данном случае , в силу того )

Рис. 9.2

Итак, оптимальные стратегии сторон и цена игры найдены:

т. е. наша оптимальная стратегия состоит в том, чтобы в 58,8% всех случаев (с вероятностью 0,588) делать носителем l, а в 41,2% случаев — II. Аналогично противник должен с вероятностью 0,588 атаковать первый бомбардировщик, а с вероятностью 0,412 — второй. При этом сторона А будет выполнять свою задачу — доносить бомбы до цели — с вероятностью 0,768, что больше нижней цены игры 0,608 и меньше верхней цены игры 1.

Решению игры 2X2 можно дать удобную геометрическую интер претацию Пусть имеется игра с матрицей:

Возьмем участок оси абсцисс длиной единица (рис. 9.3). Левый конец участка (точка с абсциссой будет изображать стратегию правый конец участка — стратегию все промежуточные точки участка будут изображать смешанные стратегии игрока А, причем вероятность стратегии будет равна расстоянию от точки до правого конца участка, а вероятность стратегии — расстоянию до левого конца. Проведем через точки два перпендикуляра к оси абсцисс: ось l — I и ось II — II. На оси l — I будем откладывать выигрыш при стратегии а на оси II — II — выигрыши при стратегии

Рис. 9.3

Рис. 9.4

Рис. 9.5

Пусть противник применяет стратегию она дает на осях I—I и II — II соответственно точки с ординатами Проведем через эти точки прямую BXBV Очевидно, при любой смешанной стратегии наш выигрыш выразится точкой М на прямой соответствующей точке на оси абсцисс, делящей отрезок в отношении Прямую условно будем называть «стратегией

Очевидно, точно таким же способом может быть построена и стратегия (рис. 9.4).

Нам нужно найти оптимальную стратегию т. е. такую, при которой наш минимальный выигрыш (при наихудшем для нас поведении В) обращался бы в максимум.

Для этого построим нижнюю границу выигрыша при стратегиях т. е. ломаную , отмеченную на рис. 9.4 жирной линией. На этой границе будет лежать минимальный выигрыш игрока А при любой его смешанной стратегии; точка в которой этот выигрыш достигает максимума, и определяет решение и цену игры. Нетрудно убедиться, что ордината точки есть не что иное, как цена игры v, ее абсцисса равна а расстояние до правого конца отрезка равно , т. е. расстояния от точки ДО концов отрезка равны вероятностям , стратегий и А в оптимальной смешанной стратегии игрока А.

В нашем случае решение игры определялось точкой пересечения стратегий это не всегда будет так. На рис. 9.5 показан случай, когда оптимальной стратегией игрока А является чистая стратегия хотя это и не соответствует точке пересечения стратегий.

Рис. 9.6

Рис. 9.7

Здесь стратегия игрока явно (при любой стратегии противника) выгоднее стратегии На рис. 9.6 показан случай, когда заведомо невыгодная стратегия имеется у противника.

Геометрическая интерпретация дает возможность наглядно изобразить также нижнюю цену игры а и верхнюю (рис. 9.7). На том же графике можно дать и геометрическую интерпретацию оптимальных стратегий противника В. Действительно, нетрудно убедиться, что доля стратегии в оптимальной смешанной стратегии

равна отношению длины отрезка к сумме длин отрезков и КВХ на оси l — I:

или, что то же,

на оси II — II.

Оптимальную стратегию можно найти и другим, непосредственным способом, если поменять местами игроков А и В, а ьместо максимума нижней границы выигрыша рассмотреть минимум верхней границы (рис. 9.8).

Рис. 9.8

Рис. 9.9

На рис. 9.9 дана геометрическая интерпретация решения игры «два бомбардировщика и истребитель» (пример 2).

1
Оглавление
email@scask.ru