Главная > Работы по теории информации и кибернетики (1963)
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

«Играющие машины»

Создание играющих машин является весьма интересной проблемой, привлекающей большое внимание. Правила игр дают весьма ограниченный круг условий, при которых машина может работать с совершенно определенной целью. Дискретная природа большинства игр хорошо согласуется с возможностями цифровой вычислительной техники, причем не требуется громоздкого перевода непрерывных величин в цифровую форму, необходимого для преобразования внешних физических воздействий в случае исполнительных и чувствующих автоматов.

Играющие машины могут быть разделены на следующие группы по признаку нарастания сложности.

1. Машины типа «словаря». Здесь ответный ход машины заранее определяется для каждой возможной позиции, которая может возникнуть в игре, и регистрируется в «словаре» или в функциональной таблице. Когда возникает определенная позиция, машина просто отыскивает соответствующий ход в словаре. Ввиду непомерных требований, предъявляемых к памяти, этот тип машин не представляет интереса и осуществим лишь для исключительно простых игр, как, например, «тик-так-тое».

2. Машины, использующие строго определенные игровые формулы. Для некоторых игр, например, таких, как Ним, известна строгая математическая теория; поэтому при помощи сравнительно простых соотношений можно в любой позиции, которая может создаться в игре, рассчитать ход, нужный для выигрыша партии. Механизация этих соотношений обеспечивает выбор наилучшего хода в игре.

3. Машины, применяющие общие принципы приблизительной оценки. Для большинства игр, представляющих интерес, неизвестно простое и точное решение, но существуют различные общие принципы игры, которые справедливы в большинстве позиций,

возникающих в процессе игры. Это относится к таким играм, как шашки, шахматы, бридж, покер и т. д. Могут быть сконструированы машины, которые используют эти общие принципы при оценке сложившейся ситуации. Поскольку нет непогрешимых принципов, то ни машины, ни люди не могут быть непогрешимы.

4. Обучающиеся машины. Здесь машине даются только правила игры и иногда элементарная тактика игры вместе с некоторыми методами улучшения этой тактики в результате опыта. Среди многочисленных методов, предложенных для включения в программу обучения, можно указать:

а) метод «испытаний и ошибок» с запоминанием удачных и устранением неудачных вариантов;

б) подражание более успешно играющему партнеру;

в) «обучение» путем поощрения или штрафа или путем сообщения машине сведений о характере допущенных ошибок;

г) анализ машиной ошибок, допущенных самой машиной, с целью выработки общих принципов поведения.

Было сконструировано много машин первых двух и лишь несколько машин третьего типа. Машина четвертого типа, обучающаяся игре, напоминает замечания Марка Твена о погоде. Это прямой вызов специалистам по программированию и по конструированию машин.

Из машин, относящихся к третьему типу (применяющих общие принципы), интерес представляют следующие две. Первая из них сконструирована Э. Ф. Муром и автором данной статьи для игры в настольную игру, известную под названием «Геке». Эта игра происходит на доске, разделенной на правильные шестиугольники. Два игрока по очереди ставят черные и белые фигуры на незанятые шестиугольники. Вся доска в целом образует ромб и цель черных — соединить верхнюю и нижнюю стороны ромба непрерывной цепью черных фигур, а цель белых — соединить две боковые стороны ромба непрерывной цепью белых фигур. После изучения этой игры было установлено, что вполне хорошие ходы могут быть получены в результате следующего процесса. Создается поле двумерного потенциала, соответствующее игральной доске, с положительными зарядами вместо белых фигур и отрицательными зарядами вместо черных фигур. Верхняя и нижняя стороны являются отрицательными, а боковые стороны — положительными. Ход, который должен быть сделан, соответствует некоторой седло-вой точке этого поля.

Для того чтобы испытать эту тактику игры, был сконструирован прибор аналогового типа, состоящий из схемы на сопротивлениях и устройства для локализации седловой точки. Этот общий метод

с некоторыми улучшениями, подсказанными практикой, оказывается вполне состоятельным. Машина выигрывает 70% игр у своего партнера — человека. Она часто удивляла своих конструкторов, выбирая странные, на первый взгляд непонятные ходы, которые при дальнейшем анализе оказывались, однако, вполне оправданными. Обычно считают, что машины справляются, с длинными запутанными вычислениями и пасуют перед общей оценкой обстановки. Как ни странно, оценка позиций этой машиной была хорошей; основным ее недостатком является выбор заключительных ходов в комбинационной игре. Любопытно также отметить, что машина «игрок в Геке» нарушает обычную процедуру счета, а именно в этой машине по существу дискретная задача решается с помощью аналоговой системы.

Недавно Стрэчи программировал игру в шашки с помощью универсальной вычислительной машины, используя метод «общего принципа». Он использовал прием, предложенный автором этой статьи для игры в шахматы, — исследование возможных вариантов на несколько ходов и минимаксную оценку окончательных позиций. Ниже приводится простая партия, сыгранная машиной и Стрэчи с пояснительными замечаниями Стрэчи. (В скобках указаны позиции шашек противника, снимаемых при данном ходе.)

В шахматной нотации партия запишется следующим образом:

(см. скан)

Замечания Стрэчи:

а) Пробный ход с моей стороны—единственная преднамеренная жертва шашки, которую я сделал. Я ошибочно думал, что этот ход вполне безопасен.

b) Непредусмотренный мною.

c) Лучше, чем

d) Ход, сделанный наугад (нулевое значение). Показывает на отсутствие конструктивного плана.

e) Другой ход, сделанный наугад, имеющий нулевое значение. Фактически гораздо лучше.

f) Плохой. В конечном счете позволяет мне пройти в дамки. Ход был бы лучше.

g) Промах с моей стороны.

h) Извлекающий прямую выгоду из моей ошибки.

i) Плохой. Открывает путь дамке.

j) Жертва для того, чтобы получить дамку (а не преградить мне путь в дамки). Хороший ход, но невозможный до того, как ход от будет сделан наудачу.

к) Другой неудачный ход с моей стороны.

m) Бесцельный. Тактика ухудшается к концу игры,

n) Слишком поздно.

р) Бесполезный ход. Игра на этом заканчивается, поскольку исход ее очевиден.

Совершенно очевидно, что, не обладая качествами чемпиона, машина все же играет лучше многих людей. Стрэчи указывает на различные недостатки в программе, особенно в определенных позициях в конце игры, и предлагает возможные улучшения.

1
Оглавление
email@scask.ru