Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше
Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике
§ 10.26. Некоторые задачи
Среди
задач, связанных с играми, мы выделим задачу построения алгоритмов обучения
решению игр в тех случаях, когда элементы платежной матрицы не постоянны, а
представляют собой случайные величины, либо неизвестны. Последний случай
охватывает так называемые игры вслепую.
Важным
во всех задачах обучения и адаптации является ускорение сходимости алгоритмов
за счет использования более полных данных о среде, получаемых во время работы
автомата. Обычно это сводится к надлежащему выбору характера изменения и . Существуют ли иные
возможности учета предшествующего опыта для ускорения сходимости?
Было
бы желательно оценить эффективность различных алгоритмов обучения порогового
элемента, а также пороговых цепей, составленных из пороговых элементов. Задачи
идентификации и управления, очевидно, переносятся и на конечные автоматы.
Систематическое исследование этих возможностей представило бы определенный
интерес.
Весьма
интересные задачи возникают в связи с играми автоматов. К ним относятся
поведение автоматов, получающих информацию не только об исходе партий, но и об
использованных в этих партиях стратегиях, и игры автоматов вслепую, когда
платежная матрица неизвестна. Представляет интерес рассмотреть игры автоматов
с ненулевой суммой и, наконец, игры большого числа автоматов. Естественно, при
адаптивном подходе предполагается достаточно малая априорная информация,
которая не позволяет непосредственно применить довольно развитый аппарат
марковских цепей.