1.2. Агенты — носители искусственного интеллекта

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

1.2. Агенты — носители искусственного интеллекта

1.2.1. Взаимодействие агента с внешней средой

Агент воспринимает внешнюю среду с помощью датчиков и воздействует на нее посредством исполнительных органов подобно тому, как человек воспринимает внешнюю среду или просто среду с помощью органов чувств и воздействует на нее с помощью таких частей тела, как руки, ноги и т.п. В понятия датчиков и исполнительных органов закладывают самый широкий смысл. Например, датчиком может быть некий аналог уха, воспринимающий речевые сообщения, а исполнительным органом — органы речи, позволяющие передавать сообщения на каком-либо языке. Обычно воздействие агента на среду называют реакцией, а восприятие агентом среды

— восприятием. Если каждый исполнительный орган сопоставить с одноименной выходной переменной принимающей множество значений у., и каждое такое значение назвать микроревкцией, то реакция будет представлять собой набор значений Аналогично, если каждый датчик х сопоставить с одноименной входной переменной принимающей множество значений а, называемых микровосприятиями, то восприятие будет представлять собой набор значений ат. Поведение агента состоит в переработке восприятий в реакции. Эта переработка осуществляется агентом с помощью специального решателя, функционирующего на основе заложенных в него знаний. Не существует какой-либо общепринятой классификации агентов. В зависимости от сложности решаемых задач выделим следующие четыре типа агентов: комбинационные; последовательностные; целенаправленные; целевыбирающие.

1.2.2. Комбинационный агент

Поведение комбинационного агента внешне выглядит достаточно простым. В определенный момент времени агент получает с датчиков восприятие характеризующее состояние среды. На основании только этого восприятия и неизменяемых в процессе всего существования агента знаний, хранящихся в его памяти, он в этот же момент времени с помощью исполнительных органов формирует реакцию Конечно, при практической реализации агента на формирование реакции по данному восприятию требуется время, но теоретически считается, что все происходит мгновенно в момент времени и этот момент времени нас может даже не интересовать. Существенно лишь то, что комбинационный агент не порождает новые знания. Каждый раз, когда надо вырабатывать очередную реакцию по вновь поступившему восприятию, он использует одни и те же знания, хранящиеся в его памяти.

1.2.3. Последовательностный агент

Комбинационный агент может быть успешно использован в среде, в которой одного восприятия в данный момент времени достаточно для выработки реакции в тот же момент времени. Предположим, например, что агентом является водитель автомобиля, движущегося по многорядному шоссе в крайнем правом ряду. Впереди него движется другой автомобиль, который неожиданно начинает резко тормозить (зажжены его тормозные огни). В этой среде правилами агента, сформулированными на естественном языке, могли бы быть следующие.

• Если зажжены тормозные огни у движущегося впереди автомобиля и левый ряд свободен, то обогнать его без торможения слева.

• Если зажжены тормозные огни у движущегося впереди автомобиля и левый ряд занят, а скорость автомобиля агента невелика, то для того, чтобы не врезаться в движущуюся впереди машину, затормозить и продолжать движение в том же ряду.

• Если зажжены тормозные огни у движущегося впереди автомобиля, левый ряд занят, а скорость автомобиля агента такова, что любое собственное торможение без съезда на обочину приведет к столкновению, то экстренно затормозить и съехать на обочину.

Предположим, что вследствие критической ситуации комбинационный агент способен в данный момент времени установить только факт наличия у движущегося впереди автомобиля зажженных тормозных огней и факт наличия помехи слева, но не в состоянии считать со спидометра и оценить скорость своего автомобиля. В этом случае он может использовать только первое правило из трех. Для того чтобы иметь возможность применить два других правила, необходимо в подобной ситуации каждый раз успевать считывать со спидометра скорость своего автомобиля. Тогда количество используемых правил может быть увеличено.

Другой путь повышения числа используемых правил — регулярный контроль в безаварийной ситуации скорости своего автомобиля по спидометру и запоминание его последнего показания. Это нужно для того, чтобы извлечь из своей памяти последнее показание спидометра, когда это понадобится. Естественно, предполагается, что она с тех пор не изменялась. В момент принятия решения определение скорости происходит за счет восприятия, запомненного в некоторый предыдущий момент времени. Агентов, которые используют запомненную в предыдущие моменты времени информацию, называют последовательностными.

1.2.4. Целенаправленный агент

Поведение целенаправленного агента принципиально отличается от комбинационного и последовательностного, поскольку их поведение основано на восприятиях в настоящий или предыдущий момент времени и использовании правил, учитывающих только эти восприятия или производные от них состояния. Например, тот же комбинационный или последовательностный агент, являющийся водителем автомобиля, должен попасть в определенное место по известному ему адресу не позднее назначенного времени. Он плохо знает город, но имеет карту и движется к нужному месту, ориентируясь по ней. Он видит, что впереди перекресток, от которого улицы отходят только налево и направо, и, повернув на любую из них, можно, в конце концов, достичь места назначения. Оба маршрута кажутся равноправными, хотя по каким-то непонятным для водителя причинам основной поток машин поворачивает налево. Правый поворот всегда проще и водитель решает повернуть направо. Однако он не знает, а на карте это не помечено, что, повернув направо, из-за ремонта на одной из улиц, он столкнется с ситуацией, когда машины вынуждены двигаться в один ряд, следовательно возникают постоянные заторы. И именно поэтому большинство других машин, водители которых лучше знают город, на перекрестке повернули налево. Таким образом решение агента о повороте направо, скорее всего, приведет к тому, что он опоздает к месту назначения.

Комбинационным или последовательностный агент в этой ситуации мог бы принять правильное решение, если бы имел правило, учитывающее факт поворота большинства машин на перекрестке налево, на основании которого его реакцией также был бы поворот налево. Однако в реальной жизни, во-первых, трудно предусмотреть абсолютно все правила, а во-вторых, среда может изменяться, одни правила могут становиться излишними или даже неверными, а других правил может недоставать. Поэтому сколько бы ни пополнялась база правил комбинационного или последовательностного агента, невозможно гарантировать достаточность числа правил для выработки реакции в не предусмотренной заранее ситуации. Кроме того, их число может стать слишком большим.

В этих условиях для того, чтобы не попасть впросак, агент должен как-то предвидеть будущее. Комбинационный (или последовательностный) агент использует информацию только о прошлом и настоящем и не способен предвидеть ситуацию. Целенаправленный же агент прежде, чем принять решение, на основании известной ему цели (в нашем примере места назначения и времени, к которому он туда должен прибыть) заранее планирует свои реакции. Иными словами, на основании имеющихся у него правил агент заранее до того, как он начнет действовать, пытается построить план, гарантирующий ему достижение цели, или обнаруживает, что такого плана не существует. В случае обнаружения недостижимости цели он может запросить дополнительные правила и продолжить или повторить процесс поиска. План является последовательностью пар восприятие — реакция (или только реакций), называемых также действиями и ведущих к цели. Если план найден, то целенаправленный агент его выполняет и достигает цели.

Таким образом, решатель целенаправленного агента использует не раз и навсегда данное ему множество правил, предписывающих, какие реакции выдавать в ответ на восприятия, а всякий раз для каждой вновь возникающей цели порождает план достижения именно этой цели. Исходными для работы такого решателя могут быть также правила, описывающие не реакции агента на конкретные восприятия, а некие общие законы его поведения в среде, законы поведения самой среды и законы порождения планов достижения целей.

1.2.5. Целевыбирающий агент

Целенаправленный агент в состоянии составить план достижения цели. В принципё, планов достижения цели может быть несколько и из них надо выбрать лучший по определенным критериям. Например, целенаправленный агент—водитель может наметить несколько путей достижения места назначения, но расход топлива при этом может быть различным. Следовательно, желательно уметь оценить планы с точки зрения расхода топлива и выбрать из них наилучший. Таким образом, целевыбирающий агент, помимо возможности построения планов достижения целей, так же, как это делает целенаправленный агент, способен на большее. Во-первых, при наличии одной цели он может выбирать из множества всех конкурирующих

планов достижения цели наилучший, иногда и без полного построения всех планов. Во-вторых, при наличии нескольких конкурирующих целей, достижение каждой из которых заранее нельзя оценить с полной уверенностью, он способен определить степень успеха достижения каждой цели в зависимости от ее важности. В-третьих, на основании предшествующего опыта, он может обучаться и корректировать или пополнять свои знания.

<< Предыдущий параграф

Следующий параграф >>

Оглавление