Главная > Адаптация и обучение в автоматических системах
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

§ 10.25. Игры автоматов

Обучение автомата оптимальному поведению можно рассматривать как игру автомата с природой.

Но автоматы могут играть и между собой, если погрузить их в одну и ту же среду (рис. 10.16). Стратегии игроков-автоматов представляют собой состояния. Число стратегий определяется памятью автоматов. Теперь штраф или поощрение соответствуют выигрышу или проигрышу автомата.

Рис. 10.16.

Игры автоматов определяют коллективное поведение обучающихся автоматов. Для игр автоматов с нулевой суммой остается справедливой основная теорема о минимаксе, и мы можем применить полученные выше алгоритмы обучения решению игр и алгоритмы обучения автоматов. Мы надеемся, что для прос1ейших задач, связанных с играми автоматов, читатель сам выпишет алгоритмы, определяющие стратегии играющих автоматов.

 

1
Оглавление
email@scask.ru