7.2.3. Режим распознавания сети Хопфилда
По завершении подбора весов сети их значения “замораживаются”, и сеть может использоваться в режиме распознавания. В этой фазе на вход сети подаете» 1 тестовый вектор х и рассчитывается ее отклик в виде
(в начальный момент
причем итерационный процесс повторяется
последовательных значений .у
вплоть до стабилизации отклика. Итерационный процесс стабилизации отклика системы состоит из определенного количества циклов и в значительной степени зависит от размеров сети и от распределения локальных минимумов.
В процессе распознавания образа по зашумленным сигналам, образующим начальное состояние нейронов сети Хопфилда, возникают проблемы с определением искомого конечного состояния, соответствующего одному из запомненных образов. Неоднократно итерационный процесс будет сходиться не к искомому, а к ошибочному решению. Этому есть много объяснений. Во-первых, значение энергетической функции, заданной выражением (7.2), зависит от произведения состояний двух нейронов и симметрично относительно, поляризации. Одно и то же энергетическое состояние приписывается обеим поляризациям
при условии, что они одновременно изменяют свои значения на противоположные. Поэтому для трехнейронной сети состояния
характеризуются идентичной энергией, и оба состояния считаются одинаково хорошим решением задачи. Переход из одного состояния в другое возможен при простой одновременной замене поляризации всех нейронов.
Другая причина выработки сетью Хопфилда ошибочных решений заключается в возможности перемешивания различных компонентов
запомненных образов и формирования стабильного состояния, воспринимаемого как локальный минимум. Следовательно, смешанное состояние соответствует такой линейной комбинации нечетного количества образов, которая сопровождается стабильным состоянием сети. Оно характеризуется более высоким энергетическим уровнем нейронов, чем искомое состояние.
При большом количестве образов образуются косвенные локальные минимумы, не соответствующие ни одному из запомненных образов, но определяемые сформированной структурой энергетической функции сети. Процесс распознавания может сойтись к одному из таких локальных минимумов, вследствие чего полученное решение не будет соответствовать состоянию ни одного из нейронов, принимавших участие в процессе обучения.
Рис. 7.2. Образы цифр, использованные для обучения сети Хопфилда
На рис. 7.2 и 7.3 демонстрируется эффективность функционирования сети Хопфилда на примере образцов 10 цифр, представленных в пиксельной форме размерностью
Поэтому количество нейронов сети Хопфилда составляет 49, а количество обучающих выборок - 10. Обучение проводилось с использованием программы
с применением трех описанных выше методов: по Хеббу, методов проекций и
-проекций. На этапе обучения
Рис. 7.3. Зашумленные образы цифр, использованные для тестирования сети Хопфилда
обрабатывались представленные на рис. 7.2 идеальные (незашумленные) образцы, дающие безошибочное восстановление. Обученная сеть подверглась тестированию на 20 сильно зашумленных образах, показанных на рис. 7.3.
Результаты распознавания сильно отличались в зависимости от применяемого метода обучения. В случае обучения по Хеббу только один образ был распознан безошибочно, а остальные не привели к искомому решению, поскольку процесс распознавания завершался в точках локальных минимумов, очень далеких от образов, использованных для обучения. Методы проекций и Д-проекций дали возможность почти безошибочно распознать каждый из запомненных образов.
В завершение обсуждения сети Хопфилда следует упомянуть, что, помимо упомянутой выше программной реализации, существуют также ее аппаратурные реализации на основе стандартных элементов микроэлектронной технологии. Исходной точкой являются описание сети в виде дифференциального уравнения (7.1) и его реализация в виде специализированной аналоговой цепи. Мы не будем подробно останавливаться на сети Хопфилда этого типа, а интересующимся ею можно порекомендовать такие публикации, как [46, 53, 54, 55, 113, 182].