Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше
Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике
§ 10.25. Игры автоматов
Обучение
автомата оптимальному поведению можно рассматривать как игру автомата с
природой.
Но
автоматы могут играть и между собой, если погрузить их в одну и ту же среду
(рис. 10.16). Стратегии игроков-автоматов представляют собой состояния. Число
стратегий определяется памятью автоматов. Теперь штраф или поощрение
соответствуют выигрышу или проигрышу автомата.
Рис. 10.16.
Игры
автоматов определяют коллективное поведение обучающихся автоматов. Для игр
автоматов с нулевой суммой остается справедливой основная теорема о минимаксе,
и мы можем применить полученные выше алгоритмы обучения решению игр и алгоритмы
обучения автоматов. Мы надеемся, что для прос1ейших задач, связанных с играми
автоматов, читатель сам выпишет алгоритмы, определяющие стратегии играющих
автоматов.