Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
Приложение. Стохастические игрыПонятие стохастической игры было впервые введено Шэпли [105]. Стохастическая игра представляет собой случайный процесс с дискретным временем и дискретным пространством состояний, у которого случайные переходы из одного состояния в другое зависят от поведения обоих игроков. Число состояний предполагается конечным. На каждом шаге игра может находиться в одном из Для стохастических игр Шэпли ввел понятие остановки, заключающееся в том, что для каждого состояния
остановки игры в состоянии выигрыш игрока I, приходящийся на одну партию. Такая игра изучалась Джилетти [601. Проиллюстрируем результаты, полученные Шэпли [105], на примере стохастических игр с остановкой. В случае, когда один из игроков не имеет возможности выбора стратегии (такой игрок называется пассивным), стохастическая игра сводится к марковскому процессу принятия решений. Таким образом, стохастические игры представляют особый интерес с точки зрения марковских процессов принятия решений. С этой позиции стохастические игры без остановки изучали Гоффман и Карп [62]. Дальнейшее развитие стохастические игры получили в работах Эверетта [55], Закриссона [121], Чарнза и Шройдера [22] и др. Стохастическая игра с остановкой задается начальным состоянием и набором из
элементы которых удовлетворяют условиям
Так как произвольная стратегия в общем случае зависит от всей предыстории игры, то весьма трудно придумать для нее удобное обозначение. Однако мы ограничимся стратегиями, не зависящими от предыстории и времени, т. е. стационарными рандомизированными (смешанными) марковскими стратегиями, задаваемыми наборами из
где при каждом
является распределением вероятностей. Аналогично можно записать стационарную стратегию у игрока И. Если Рассмотрим сначала матричную игру (см. [112]). Для данной матричной игры В обозначим
Возвращаясь к стохастической игре
где
где Определим преобразование
где
В качестве нормы вектора а выберем
Тогда из
В частности, причем предельный вектор
Следовательно, Чтобы показать, что Теорема
Теорема Доказательство. Пусть игра В исходной же игре
и, следовательно, этот выигрыш не меньше, чем
Поэтому суммарный выигрыш игрока I больше или равен
Так как все сказанное справедливо при любых достаточно больших то отсюда следует, что Нелинейность оператора
Эта система имеет единственное решение. В самом деле, для линейного преобразования
справедливо соотношение
что соответствует неравенству Следовательно, применяя правило Крамера, находим
Теорема П.3. Каждая игра
Любая стационарная стратегия, оптимальная для всех Доказательство довольно просто следует из теоремы Можно показать, что множество всех оптимальных стационарных стратегий игры Литература(см. скан)
|
1 |
Оглавление
|