Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
§ 5. ОБЩИЕ МЕТОДЫ РЕШЕНИЯ КОНЕЧНЫХ ИГРМы рассматривали до сих пор только самые элементарные игры типа В общем случае решение игры
Рис. 5.1. Принципиальная сторона метода отыскания решения остается при любом Проиллюстрируем это на примере игры 3 X п. Дадим ей геометрическую интерпретацию — уже пространственную. Три наши стратегии Через точки При соответствующих стратегиях
Рис. 5.2. Частоты
Однако такое геометрическое построение даже для случая тем более, что для решения задачи на вычислительных машинах эти методы единственно пригодны. Все эти методы по существу сводятся к решению задачи путем последовательных проб, но упорядочение последовательности проб позволяет построить алгоритм, приводящий к решению наиболее экономичным способом. Здесь мы вкратце остановимся на одном расчетном методе решения игр Для этого дадим сначала общую постановку задачи о нахождении решения игры Требуется найти решение игры, т. е. две оптимальные смешанные стратегии игроков А к В
где Наша оптимальная стратегия должна обеспечивать нам выигрыш, не меньший v, при любом поведении противника, и выигрыш, равный v, при его оптимальном поведении (стратегия S). Аналогично стратегия SB должна обеспечивать противнику проигрыш, не больший v, при любом нашем поведении и равный v при нашем оптимальном поведении (стратегия Величина цены игры v в данном случае нам неизвестна; будем считать, что она равна некоторому положительному числу. Полагая так, мы не нарушаем общности рассуждений; для того чтобы было Пусть мы выбрали свою оптимальную стратегию 5. Тогда наш средний выигрыш при стратегии
Наша оптимальная стратегия
Разделим неравенства (5.1) на положительную величину v и обозначим
Тогда условия (5.1) запишутся в виде
где
Мы хотим сделать свой гарантированный выигрыш максимально возможным; очевидно, при этом правая часть равенства (5.3) принимает минимальное значение. Таким образом, задача нахождения решения игры сводится к следующей математической задаче: определить неотрицательные величины
была минимальной. Обычно при решении задач, связанных с нахождением экстремальных значений (максимумов и минимумов), функцию дифференцируют и приравнивают производные нулю. Но такой прием в данном случае бесполезен, так как функция Ф, которую нужно обратить в минимум, линейна, и ее производные по всем аргументам равны единице, т. е. нигде не обращаются в нуль. Следовательно, максимум функции достигается где-то на границе области изменения аргументов, которая определяется требованием неотрицательности аргументов и условиями (5.2). Прием нахождения экстремальных значений при помощи дифференцирования непригоден и в тех случаях, когда для решения игры определяется максимум нижней (или минимум верхней) границы выигрыша, как мы, например, делали при решении игр Для решения подобных задач, довольно часто встречающихся на практике, в математике разработан специальный аппарат линейного программирования. Задача линейного программирования ставится следующим образом. Дана система линейных уравнений:
Требуется найти неотрицательные значения величин
Легко убедиться, что поставленная выше задача теории игр является частным случаем задачи линейного программирования При С первого взгляда может показаться, что условия (5.2) не эквивалентны условиям (5.4), так как вместо знаков равенства они содержат знаки неравенства. Однако от знаков неравенства легко избавиться, вводя новые фиктивные неотрицательные переменные
Форма Ф, которую нужно обратить в минимум, равна
Аппарат линейного программирования позволяет путем сравнительно небольшого числа последовательных проб подобрать величины Пример 1. Требуется найти решение игры
Чтобы сделать все
При этой цена игры увеличится на 5, а решение не изменится. Определим оптимальную стратегию
где Чтобы избавиться от знаков неравенства, введем фиктивные переменные
Линейная форма Ф имеет вид:
и должна быть сделана как можно меньше. Если все три стратегии В являются «полезными», то все три фиктивные переменные
Складывая
В выражении (5.9) коэффициенты при всех z положительны; значит, любое увеличение привести только к увеличению формы Ф, а мы хотим, чтобы она была минимальна. Следовательно, значениями
Подставляя их в формулу (5.9), находим минимальное значение формы Ф:
откуда цена игры
Подставляя нулевые значения
или, умножая их на
Таким образом, оптимальная стратегия А найдена:
т. е. мы должны в одной четверти всех случаев писать цифру 1, в половине случаев 2 и в остальной четверти случаев 3. Зная цену игры
Для этого воспользуемся нашими любыми двумя «полезными» стратегиями (например,
откуда
Теперь вернемся к первоначальной (не преобразованной) игре. Для этого нужно только от цены игры величину Пример 2. Спортивный клуб А располагает тремя вариантами состава команды
Найти, с какой частотой клубы должны выставлять каждый из составов во встречах друг с другом, чтобы добиться наибольшего в среднем числа побед. Решение. Нижняя цена игры 0,4; верхняя 0,6; решение ищем в области смешанных стратегий. Чтобы не иметь дела с дробями, умножим все элементы матрицы на 10; при этом цена игры увеличится в 10 раз, а решение не изменится. Получим матрицу:
Условия (5.5) имеют вид:
а условие минимума
Проверяем, все ли три стратегии противника являются «полезными». В качестве гипотезы сначала предполагаем, что фиктивные переменные
откуда
Формула (5.12) показывает, что увеличение переменных Чтобы проверить, обращается ли в минимум форма Ф при нулю) переменные через предположительно равные нулю Разрешая уравнения (5.10) относительно
откуда
Из формулы (5.13) видно, что любое увеличение величин
откуда
Подставляя в формулу (5.13), находим цену игры v:
Наша оптимальная стратегия;
«Полезные» стратегии (составы Чтобы найти оптимальную стратегию противника, в общем случае можно поступать так: изменить знак выигрыша на обратный, прибавить к элементам матрицы постоянную величину L, чтобы сделать их неотрицательными, и решать задачу за противника так же, как мы решали ее за себя. Однако то, что нам уже известна цена игры v, несколько упрощает задачу. К тому же в данном конкретном случае задача дополнительно упрощается тем, что в решении участвуют только две «полезные» стратегии противника не равна нулю, и, значит, при стратегии
откуда
оптимальная стратегия противника будет:
т. е. противник не должен пользоваться составом Возвращаясь к первоначальной матрице, определим истинную цену игры
Это значит, что при большом числе встреч число побед клуба А составит 0,457 всех встреч.
|
1 |
Оглавление
|