ПЕРСЕПТРОН
(от англ. to percept - воспринимать) — обучаемая распознающая система, реализующая корректируемое линейное решающее правило в пространстве фиксированных случайно выбранных признаков входных сигналов. Обычно признаки являются линейными пороговыми функциями от входных сигналов. Обучение П. заключается в последовательной коррекции положения разделяющей гиперплоскости по текущим результатам распознавания входных сигналов; методы коррекции по своей идее близки к градиентным методам оптимизации и обычно сводятся к изменению положения разделяющей гиперплоскости при каждой ошибке распознавания таким образом, чтобы нормаль к этой плоскости смещалась в направлении ошибочно распознанного вектора признаков.
П. предложил в 1957 амер. ученый Ф. Розенблатт в качества простейшей модели мозга. Чаще всего рассматриваются П. осуществляющие распознавание оптических изображений. В простейшем случае схемы таких П.
подобны изображенной на рисунке. Распознаваемое изображение проектируется на сетчатку из светочувствительных элементов (-элементов). Выходные сигналы последних соответствуют зачерненностям отдельных участков изображения. Выходы .-элсмснтов связываются со входами т. н. ассоциативных элементов (-элементов). Каждая связь . характеризуется некоторым числом (весом связи) на которое умножается передаваемый сигнал Ассоциативные А - элементы представляют собой многовходовые пороговые элементы.
Структурная схема трехслойного персептрона.
Выходной сигнал такого элемента принимает одно из двух возможных значений (напр., «1» или «0») в зависимости от того, превышает или нет алгебр, сумма его входных сигналов заданный порог , если в противном случае.
Структура связей А-элементов с сетчаткой выбирается случайным образом в соответствии с заданным распределением вероятностей. Выходные сигналы А - элементов также умножаются на некоторые веса и подаются на входы решающих элементов (Л-элементов). Их выходные сигналы формируют код решения П. Обычно каждому из классов изображений (образов), которые должен различать П., ставится в соответствие один из решающих элементов и для любого распознаваемого изображения отличен от нуля выход только одного Я-элемента, напр, того, для которого алгебр, сумма входных сигналов максимальна. Алгоритм распознавания, реализуемый этим П., осуществляет линейное разделение классов (образов) в пространстве выходных сигналов Л-элементов, выступающих в роли некоторых признаков входных изображений. Обучение такого простейшего П. (называемого трехслойным, или П.) заключается в изменении по определенным правилам значений весов связей между А- и -элементами.
Различают режим обучения и режим самообучения П. При обучении класс распознаваемого изображения указывается извне, напр. человеком-«учителем». Наиболее часто встречается т. н. обучение с коррекцией ошибок, при котором изменение весов производится только в случае ошибочного решения П. (в простейшем случае, если изображение класса к ошибочно отнесено к классу I, то веса заменяются на а веса на . В режиме самообучения указание о классе поступает с выхода самого П. и изменение весов производится непрерывно. При некоторых ограничивающих условиях доказаны теоремы о сходимости определенных алгоритмов обучения П. Сходимость означает, что обучение потребует конечного числа коррекций весов. Условия, при которых справедливы эти теоремы, равносильны требованию линейной разделимости классов изображений в пространстве выходных сигналов --элементов.
Экспериментальные исследования П. как путем моделирования на ЦВМ, так и путем создания специализированных устр-в (напр., амер. макеты «Марк 1» и «Конфлекс ), показали, что в тех случаях, когда изображения одного класса «накрывают» в основном одни и те же группы -элементов, после
достаточно продолжительного обучения может быть достигнута вероятность правильного распознавания, значительно превышающая вероятность случайного отгадывания при распознавании графических изображений типа букв, «вписанных» в поле зрения сетчатки).
Практическое значение трехслойных П., несмотря на относительную простоту их теоретического и экспериментального изучения, весьма незначительно. Экстраполяционные возможности таких П., т. е. умение правильно распознавать изображения, не участвовавшие в обучении, полностью определяются структурой связей S- и А-элементов. Поскольку эти связи являются случайными, то характер экстраполяции, осуществляемой П., лишь случайно может совпасть с требуемым. Серьезные трудности вызывает также режим самообучения. Поскольку фактически не определено, какой именно классификации должен «самообучиться» П., результирующая классификация, как правило, не имеет ничего общего с ожидаемой (напр., объединение всех входных изображений в один класс).
Теория трехслойных П. получила значительное развитие в работах амер. кибернетиков М. Минского и С. Пейперта. Они строго доказали, что трехслойные П. в принципе не могут решать многие из задач распознавания образов. К таким задачам, в частности, относится распознавание симметрии или подобия геом. фигур, обнаружение известной фигуры на фоне других фигур, выявление связности фигуры и т. п. Даже при сравнительно малом числе элементов сетчатки для решения подобных задач с помощью трехслойных П. требуются физически нереализуемые объемы аппаратуры (по числу необходимых А-элементов и значениям весов связей) и длительности обучения (по числу отдельных коррекций весов).
Во многих работах были попытки улучшить рабочие характеристики П. путем усложнения его структуры (напр., переходом к многослойным схемам, в которых сигналы от сетчатки последовательно передаются через несколько «слоев» А - элементов и лишь затем поступают на входы А-элементов) или путем - усложнения процедуры обучения (напр. коррекцией весов других связей, кроме связей А- и -элементов, и т. п.). При подобных усовершенствованиях теряются такие привлекательные стороны трехслойных П., как простота и ясность схемной организации и процедуры обучения. Полноценный теоретический анализ столь сложных схем и алгоритмов обучения П- становится несравненно более трудной (и почти неразработанной) задачей. Вопрос о возможностях многослойных П. в настоящее время остается открытым. Известны лишь отдельные более или менее удачные результаты экспериментальных исследований некоторых вариантов таких схем (напр., четырехслойного П. «ПАПА» итал. ученого А. Гамба). Хотя успехи в теории и практике П- еще невелики, схема П. исторически сыграла большую роль, поскольку привлекла внимание многих исследователей к необходимости строгой формулировки и подробного теоретического анализа вопросов моделирования разумного поведения и, в частности, вопросов обучения и самообучения кибернетических устройств.
Лит.: .