Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
21-2. НЕКОТОРЫЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ИГРПоследние 10—15 лет быстро развивается специальная математическая дисциплина, получившая название теории игр [Л. 21-1]. В этой теории рассматриваются игры в широком смысле слова как последовательности подчиненных определенным правилам и статистическим зависимостям шагов сторон-игроков. Основное содержание теории игр при современном ее состоянии состоит в строгом математическом обосновании существования оптимальных стратегий в определенных классах игр. Хотя прикладное значение теории игр применительно к игровым системам автоматического управления еще невелико, мы приведем некоторые понятия и положения этой теории, как имеющей непосредственное отношение к обоснованию существования оптимальных алгоритмов управляющих машин. Ходы в теории игр делятся на личные и случайные. Личные ходы производятся на основе определенных алгоритмов — стратегий игроков, случайные ходы подчиняются лишь определенным распределениям вероятностей. Так, при карточной игре сдача карт является случайным ходом, а все другие ходы игроков — личными ходами. При игре в шахматы все ходы личные. Как личные, так и случайные ходы подчинены определенным правилам игры. Каждый ход представляет собой выбор одного решения из заданного множества вариантов. Решение, принятое при личном ходе, называется выбором. Стратегией игрока называется инструкция, однозначно определяющая каждый личный его ход (выбор) в любой ситуации, возможной в рамках правил игры. Стратегию игрока часто называют алгоритмом игрока. В играх, где число возможных ходов и выборов велико, стратегии игроков и тем более какая-либо инструментальная реализация исчерпывающих алгоритмов крайне затруднены или неосуществимы, так как они требуют колоссального объема памяти запоминающих устройств. Так, например, для записи стратегии игрока в шахматы
Рис. 21-2. Множества стратегий игроков конечной игры с двумя сторонами. потребовалось бы описать огромное количество вариантов, подавляющее большинство которых не встретится в каждой данной конкретной игре. Столь же велико и число возможных стратегий. Это обстоятельство, весьма существенное при построении Алгоритмов игровых управляющих машин (§ 21-4), не может, однако, служить препятствием успешному применению понятия стратегии или исчерпывающего алгоритма в общей математической теории игр. Если число возможных ходов и выборов в каждом ходе конечно, то игра называется конечной. Теория конечных игр разработана наиболее полно. Если игра конечна, то число возможных стратегий каждого из игроков также конечно, хотя, быть может, и весьма велико. Множество возможных стратегий игрока I обозначим Для игр с двумя сторонами, которые главным образом рассматриваются в современной теории игр, множества возможных стратегий Если игра содержит лишь личные ходы (т. е. не имеет случайных хрдов), то задание стратегий игроков полностью определяет исход игры. Таким образом, если выбраны стратегии Для игр, содержащих как личные, так и случайные ходы, выбор стратегий игроков определит распределение вероятностей Различные исходы игры для игроков неравноценны. Для описания
Рис. 21-3. Возможные стратегии игроков и значения функции выигрыша нормальной формы игры. интересов игроков в множестве возможных исходов игры вводится функция выгоды. Понятие функции выгоды для игровых систем автоматического управления в некоторой мере уже было пояснено. В теории игр понятие функции выгоды имеет сходное, но не тождественное указанному значение. Под функцией выгоды Если сумма функций выгоды игроков согласно правилам игры постоянна:
то игра называется игрой с постоянной суммой. Заменой
игра с постоянной суммой преобразуется в игру с нулевой суммой:
Для игры с двумя сторонами условие нулевой суммы имеет вид:
Функция
в играх с нулевой суммой называется функцией выигрыша. Эта функция совпадает с функцией выгоды I игрока и противоположна по знаку функции выгоды II игрока. Все дальнейшие положения относятся к играм с двумя сторонами и нулевой суммой [см. 21-1]. Приведенные понятия и определения позволяют рассматривать в теории игр весьма простую и единую форму игры — так называемую нормальную форму игры. Игра в нормальной форме состоит из пространства (множеств) возможных стратегий
Рис. 21-4. К определению точной нижней и точной верхней цен игры. представлены здесь точками осей Если игра конечна, то множество значений функции выигрыша
Элементы этой матрицы равны значениям функции выигрыша в точках, соответствующих номерам строк и столбцов:
Еще одним фундаментальным понятием теории игр является оптимальная стратегия. Чтобы дать строгое определение оптимальной стратегии, необходимо ввести определения так называемых верхней и нижней цен игры. Точной нижней границей Если представить множество чисел точками на числовой оси, то точной нижней границе множества Каждая функция имеет некоторое множество значений, и понятия точных верхней и нижней границ непосредственно распространяются на функции. Обратимся теперь к рис. 21-3, поясняющему нормальную форму игры. Первой игрок распоряжается лишь смещением вдоль оси Первый игрок, задавая х, стремится сделать функцию выигрыша Вместо пространственной картины и поверхностиможно рассматривать семейство сечений этой поверхности плоскостями На рис. 21-5 представлены сечения плоскостями Точная верхняя граница множества значений точных нижних границ функции выигрыша при
Рис. 21-5. Семейство сечений поверхности Для случая, представленного на рис. 21-5, нижняя чистая цена игры совпадает с Нижняя чистая цена игры имеет следующий смысл. Первый игрок правильным выбором своей стратегии всегда может обеспечить значение функции выигрыша не ниже нижней чистой цены игры X при любой возможной стратегии второго игрока. Таким образом, нижняя чистая цена игры является верхней гранью выигрыша, который первый игрок может себе гарантировать. На рис. 21-6 представлено семейство сечений поверхности Второй игрок соответствующим выбором своей стратегии всегда может сделать значение функции выигрыша первого игрока Точная нижняя граница множества значений точных верхних границ функции выигрыша при
Таким образом, второй игрок может лимитировать выигрыш первого игрока значением Я. Для указанного на рис. 21-6 случая верхняя чистая цена игры Нижняя и верхняя чистые цены игры обозначены также на рис. 21-3. Легко видеть, что в рассматриваемой игре они совпадают:
Величина
Рис. 21-6. Семейство сечений поверхности Равенство (21-4) справедливо для широкого класса игр, именуемых играми, имеющими чистую цену. Оптимальной стратегией первого игрока в игре, имеющей чистую цену Оптимальной стратегией второго игрока в игре, имеющей чистую цену Ввиду важности понятия оптимальных стратегий целесообразно дать дополнительные пояснения. Оптимальной стратегией первого игрока (в играх, имеющих чистую цену) называется такая стратегия этого игрока, которая при любой возможной стратегии второго игрока гарантирует первому игроку выигрыш не ниже чистой цены. Оптимальной стратегией второго игрока (в играх, имеющих чистую цену) называется такая стратегия этого игрока, которая при любой возможной стратегии первого игрока дает значение функции выигрыша (выигрыш первого игрока), не большее чистой цены Если для наглядности принять, что значение функции выигрыша первого игрока
то согласно принятому условию всегда будет иметь место ничейный исход игры. Выше было указано, что для конечных игр, в которых число возможных стратегий первого и второго игроков конечно, функция выиг рыша
где элементы матрицы равны:
Элемент расположен в Элемент, минимальный (наименьший) в своей строке и максимальный (наибольший) в своем столбце называется седловым элементом матрицы. Матрица конечной игры, имеющей чистую цену и имеющей, стало быть, оптимальные стратегии, всегда содержит седловой элемент. Седловой элемент матрицы конечной игры, имеющей чистую цену, равен этой чистой цене Я:
и индексы этого элемента Значительная часть теории игр посвящена математическому определению классов игр, имеющих оптимальные стратегии. В частности, вводится понятие игр с полной информацией. В играх с полной информацией игрок при каждом личном ходе знает выборы и исходы всех предыдущих личных и случайных ходов. Доказано [Л. 21-1], что всякая игра с полной информацией имеет чистую цену; матрица конечной игры с полной информацией всегда имеет седловой элемент. Наряду с нормальной формой игры и понятием стратегии в теории игр вводится понятие усреднения игры Мы рассмотрели лишь некоторые понятия и положения современной теории игр, составляющие небольшую часть этой теории. Однако приведенные понятия и положения в достаточной мере характеризуют эту математическую дисциплину. Теория игр занимается вопросами существования оптимальных стратегий, т. е. оптимальных исчерпывающих алгоритмов, и методами нахождения этих стратегий в условиях, когда правила игры строго Как отчасти вытекает из предыдущего изложения и будет дополнительно пояснено, во многих случаях применения игровых систем автоматического управления указанные условия не выполняются. Правила игры не определены строго, а множества возможных стратегий практически необозримы. Поэтому для решения практических задач синтеза алгоритмов многих игровых систем управления необходимо видоизменение подхода и специальное развитие теории игр. Наиболее перспективен с практической точки зрения метод поэтапного оптимального выбора, т. е. оптимального выбора в каждом шаге. В связи с этим уместно привести сведения о динамическом программировании и линейном программировании.
|
1 |
Оглавление
|