Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
9. РЕШЕНИЕ ИГР mxnДо сих пор мы рассматривали только элементарные игры В случае игр В общем случае, при больших тип, решение игры Действительно, рассмотрим игру Требуется найти решение игры, т. е. две оптимальные смешанные стратегии игроков А и В:
где
— вероятности применения чистых стратегий (некоторые из них, соответствующие неактивным стратегиям, могут быть равными нулю). Найдем сначала оптимальную стратегию Цена игры v нам пока неизвестна. Не нарушая общности, можно предположить ее равной некоторому положительному числу Предположим, что мы (А) применяем свою оптимальную стратегию
Наша оптимальная стратегия Получаем ряд условий:
Разделим неравенства (9.1) на положительную величину v и введем обозначения:
Тогда условия (9.1) запишутся в виде:
где
Мы хотим сделать свой гарантированный выигрыш максимально возможным; очевидно, при этом правая часть (9.4) принимает минимальное значение. Таким образом, задача решения игры свелась к следующей математической задаче. Определить неотрицательные значения переменных
обращалась в минимум. Перед нами — типичная задача линейного программирования. Таким образом, решая задачу линейного программирования, мы можем найти оптимальную стратегию Найдем теперь оптимальную стратегию
где
Требуется так выбрать переменные
Вместо того чтобы максимизировать функцию (9.7), можно, как мы знаем, минимизировать функцию
Таким образом, мы свели задачу решения любой конечной игры Попутно заметим, что из сведения задачи решения игры к задаче линейного программирования вытекают соображения по поводу существования решения игры Действительно, пусть задача о нахождении оптимальной стратегии 1) условия (равенства или неравенства) вообще не имеют допустимых неотрицательных решений; 2) допустимые решения существуют, но среди них нет оптимального, так как минимизируемая функция не ограничена снизу. Посмотрим, как обстоит дело в нашем случае. Нетрудно убедиться, что допустимое решение ЗЛП в нашем случае всегда существует. Действительно, сделаем элементы матрицы
Положим теперь Теперь убедимся, что линейная функция (9.5) не может быть не ограничена снизу. Действительно, все Пример 1. Найти методом линейного программирования решение игры «три пальца» из примера 2 § 4 Решение. Матрица игры имеет вид:
Прибавляя ко всем элементам матрицы одно и то же число
При этом цена игры увеличится на 5, а решение не изменится. Обозначим новую цену игры
Минимизируемая линейная функция
Перейдем от условий-неравенств (9.11) к условиям-равенствам:
Заполним симплекс-таблицу (табл. 9.1). Так как свободные члены отрицательны, то, полагая Таблица 3.1
Таблица 9.2
Таблица 9.3
Таблица 9.4
Применяя аппарат симплекс-метода (см гл. 2, § 7), находим опорное решение (табл 9.2, 9.3, 9.4) Табл 9.4 дает опорное решение ОЗЛП:
Надо проверить, является ли оно оптимальным, т. е. обращает ли в минимум выражение (9.12) Пользуясь табл. 9.4, выразим L через новые свободные переменные
и запишем свободный член и коэффициенты при Таблица 9.5
Из того, что коэффициент при Таблица 9.6
Из табл. 9.6 видно, что функция t принимает минимальное значение
Отсюда Следовательно, цена исходной игры с матрицей (9.9):
Это значение выигрыша достигается при
т. е. для вероятностей стратегий
Таким образом, найдено решение игры — оптимальная стратегия игрока А
и цена игры Оптимальная стратегия игрока В может быть найдена точно таким же способом, если составить условия, аналогичные (9.7), но не по столбцам, а по строкам, заменив в них знаки > на <, а величину L обращать не в минимум, а в максимум Однако в данном случае в этом надобности нет: из симметрии строк и столбцов матрицы ясно, что оптимальная стратегия игрока В должна быть такой же, как и оптимальная стратегия игрока А:
Таким образом, в игре «три пальца» оптимальная стратегия каждого из игроков состоит в том, чтобы с вероятностью 1/4 показывать один палец, с вероятностью 1/2 — два пальца и с вероятностью 1/4 — три пальца При этом средний выигрыш каждого игрока будет равен нулю В этом примере все три стратегии каждого игрока были активными. Такая игра, в которой все стратегии активны, называется полностью усредненной. В следующем примере мы рассмотрим пример не полностью усредненной игры. Пример 2. Игра «вооружение — помехи». Сторона А располагает тремя видами вооружения
Сторона А стремится решить боевую задачу, сторона В — воспрепятствовать этому Найти оптимальные стратегии сторон.
Решение. Избавляясь от дробей, перепишем матрицу в виде: и обозначим цену новой игры с такой матрицей
откуда (переходя к условиям-равенствам)
Требуется найти неотрицательные значения
Решаем задачу симплекс-методом (опуская подробности, приведем сразу оптимальное решение, табл 9.7). Таблица 9.7
Из табл 9.7 видно, что минимум L достигнут и равен
Отсюда находим вероятности
и цену игры:
В данном случае
Таким образом, оптимальная стратегия игрока Л найдена:
т. е., мы должны пользоваться с вероятностью 1/7 первым видом вооружения, с вероятностью 6/7 — вторым, а третий вид вооружения не применять вовсе. При этом вероятность выполнения боевой задачи будет максимальна:
Теперь найдем оптимальную стратегию
т. е. оптимальная стратегия противника состоит в том, чтобы с вероятностью 3/7 пользоваться помехами В заключение заметим, что продемонстрированный в данном параграфе общий метод решения игр
откуда цена игры:
а вероятности
|
1 |
Оглавление
|