Главная > Введение в теорию игр
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

3. Стратегии для другого игрока

В приведенном выше примере мы могли определить оптимальную стратегию для первого игрока, но не для второго. Две следующие теоремы позволяют нам определить оптимальные стратегии для обоих игроков.

В этих теоремах символами мы обозначаем частные производные функции соответственно по x и у.

Таким образом,

и

Поскольку мы ограничиваемся функциями, определенными на замкнутом единичном квадрате , то производные согласно этим определениям, не имели бы смысла. Поэтому под мы будем подразумевать предел выражения (4), когда z принимает лишь положительные значения, а под мы будем подразумевать предел этого выражения, когда принимает лишь отрицательные значения. Аналогично определяются .

Теорема 12.5. Пусть М — платежная функция непрерывной игры, непрерывная по двум переменным; существует для любых х и у в единичном квадрате и строго выпукла по у для любого . Пусть — единственная оптимальная стратегия для второго игрока, и v — цена игры. Если или первого игрока имеется оптимальная стратегия где константой может быть любое число, удовлетворяющее условиям:

Если , то у первого игрока имеется оптимальная стратегия следующего вида:

в качестве можно взять любые числа, удовлетворяющие условиям:

Доказательство. Допустим сначала, что . Поскольку есть оптимальная стратегия для второго игрока, мы видим по теореме 10.6, что для всех х

и, следовательно, для всех х

далее, поскольку по теореме 12.2

то существует такое, что

Предположим теперь, что всякое число , удовлетворяющее равенству (7), является таким, что

Тогда для всякого , существует положительное такое, что

Для каждого х мы определяем как верхнюю грань всех чисел , удовлетворяющих неравенству (7). Из непрерывности функции М следует непрерывность функции по в замкнутом интервале [0, 1]; кроме того, всегда положительна и, следовательно, имеет положительный минимум.

Пусть — мицимальное значение . Если мы выберем так, что , то

и, следовательно, по теореме 12.2

Мы пришли к противоречию. Следовательно, существует число , которое удовлетворяет равенству (7), и, кроме того,

Пусть теперь — любое число из интервала [0, 1], удовлетворяющее условиям (7) и (9); покажем, что есть оптимальная стратегия для первого игрока. Но поскольку — выпуклая функция от то из (7) и (9) вытекает, что v есть минимум функции , так что для всякого у

и, следовательно, по теореме 10.6, есть оптимальная стратегия для первого игрока, что и требовалось доказать. Этим завершается доказательства для случая .

Доказательство для случая аналогично. Допустим теперь, что . Как и в случае , мы видим, что для всех х

и для некоторого х

Если бы любое х, удовлетворяющее условию (11), было таким, что

то мы пришли бы к противоречию, как и в случае .

Итак, имеется число х, которое удовлетворяет условию (11), и, кроме того,

то есть имеется число такое, что

Аналогично мы убеждаемся в том, что имеется число такое, что

Рассмотрим теперь функцию

Мы замечаем, что

и

Поскольку функция непрерывна, мы заключаем, что существует а, удовлетворяющее соотношениям

Для завершения доказательства теоремы нам нужно лишь показать, что если и — любые числа, удовлетворяющие условиям (13), (14) и (15), то функция распределения

есть оптимальная стратегия для первого игрока. Из того, что функция непрерывна по у для любого х, мы заключаем, что функция

выпукла по у. Кроме того, из уравнения (15) мы видим, что производная функции равна нулю при . Следовательно, принимает минимальное значение в точке . Итак, поскольку на основании (13) и (14) мы имеем:

то мы видим, что v есть минимальное значение функции , то есть для всех у:

или

Теперь теорема вытекает из теоремы 10.6.

Так же можно доказать следующую теорему, аналогичную только что доказанной.

Теорема 12.6. Пусть М — платежная функция непрерывной игры, непрерывная по двум переменным; существует для любого и любого у в единичном квадрате; строго вогнута по для любого у; I — единственная оптимальная стратегия для первого игрока, и v — цена игры. Если или , то имеется оптимальная стратегия для второго игрока, в качестве константы можно взять любое число, удовлетворяющее условиям:

Если , то имеется оптимальная стратегия для второго игрока, имеющая следующий вид:

причем в качестве констант можно взять любые числа, удовлетворяющие условиям

Categories

1
Оглавление
email@scask.ru