Главная > Введение в теорию игр
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

3. Стратегии для другого игрока

В приведенном выше примере мы могли определить оптимальную стратегию для первого игрока, но не для второго. Две следующие теоремы позволяют нам определить оптимальные стратегии для обоих игроков.

В этих теоремах символами мы обозначаем частные производные функции соответственно по x и у.

Таким образом,

и

Поскольку мы ограничиваемся функциями, определенными на замкнутом единичном квадрате , то производные согласно этим определениям, не имели бы смысла. Поэтому под мы будем подразумевать предел выражения (4), когда z принимает лишь положительные значения, а под мы будем подразумевать предел этого выражения, когда принимает лишь отрицательные значения. Аналогично определяются .

Теорема 12.5. Пусть М — платежная функция непрерывной игры, непрерывная по двум переменным; существует для любых х и у в единичном квадрате и строго выпукла по у для любого . Пусть — единственная оптимальная стратегия для второго игрока, и v — цена игры. Если или первого игрока имеется оптимальная стратегия где константой может быть любое число, удовлетворяющее условиям:

Если , то у первого игрока имеется оптимальная стратегия следующего вида:

в качестве можно взять любые числа, удовлетворяющие условиям:

Доказательство. Допустим сначала, что . Поскольку есть оптимальная стратегия для второго игрока, мы видим по теореме 10.6, что для всех х

и, следовательно, для всех х

далее, поскольку по теореме 12.2

то существует такое, что

Предположим теперь, что всякое число , удовлетворяющее равенству (7), является таким, что

Тогда для всякого , существует положительное такое, что

Для каждого х мы определяем как верхнюю грань всех чисел , удовлетворяющих неравенству (7). Из непрерывности функции М следует непрерывность функции по в замкнутом интервале [0, 1]; кроме того, всегда положительна и, следовательно, имеет положительный минимум.

Пусть — мицимальное значение . Если мы выберем так, что , то

и, следовательно, по теореме 12.2

Мы пришли к противоречию. Следовательно, существует число , которое удовлетворяет равенству (7), и, кроме того,

Пусть теперь — любое число из интервала [0, 1], удовлетворяющее условиям (7) и (9); покажем, что есть оптимальная стратегия для первого игрока. Но поскольку — выпуклая функция от то из (7) и (9) вытекает, что v есть минимум функции , так что для всякого у

и, следовательно, по теореме 10.6, есть оптимальная стратегия для первого игрока, что и требовалось доказать. Этим завершается доказательства для случая .

Доказательство для случая аналогично. Допустим теперь, что . Как и в случае , мы видим, что для всех х

и для некоторого х

Если бы любое х, удовлетворяющее условию (11), было таким, что

то мы пришли бы к противоречию, как и в случае .

Итак, имеется число х, которое удовлетворяет условию (11), и, кроме того,

то есть имеется число такое, что

Аналогично мы убеждаемся в том, что имеется число такое, что

Рассмотрим теперь функцию

Мы замечаем, что

и

Поскольку функция непрерывна, мы заключаем, что существует а, удовлетворяющее соотношениям

Для завершения доказательства теоремы нам нужно лишь показать, что если и — любые числа, удовлетворяющие условиям (13), (14) и (15), то функция распределения

есть оптимальная стратегия для первого игрока. Из того, что функция непрерывна по у для любого х, мы заключаем, что функция

выпукла по у. Кроме того, из уравнения (15) мы видим, что производная функции равна нулю при . Следовательно, принимает минимальное значение в точке . Итак, поскольку на основании (13) и (14) мы имеем:

то мы видим, что v есть минимальное значение функции , то есть для всех у:

или

Теперь теорема вытекает из теоремы 10.6.

Так же можно доказать следующую теорему, аналогичную только что доказанной.

Теорема 12.6. Пусть М — платежная функция непрерывной игры, непрерывная по двум переменным; существует для любого и любого у в единичном квадрате; строго вогнута по для любого у; I — единственная оптимальная стратегия для первого игрока, и v — цена игры. Если или , то имеется оптимальная стратегия для второго игрока, в качестве константы можно взять любое число, удовлетворяющее условиям:

Если , то имеется оптимальная стратегия для второго игрока, имеющая следующий вид:

причем в качестве констант можно взять любые числа, удовлетворяющие условиям

1
Оглавление
email@scask.ru