1.6. Краткое обобщение материалов главы
1.6.1. Как построить нейронную сеть
Практически любую задачу можно свести к задаче, решаемой нейронной сетью. В табл. 1.2 показано, каким образом следует сформулировать в терминах нейронной сети задачу распознавания рукописных букв.
Таблица 1.2 (см. скан) Задача распознавания рукописных букв в терминах нейронной сети
Интерес представляет не аналоговое значение выхода, а номер класса (номер буквы в алфавите) Поэтому каждому классу сопоставляется свой выходной нейрон, а ответом сети считается номер класса соответствующий нейрону, на чьем выходе уровень сигнала максимален Значение же уровня сигнала на выходе характеризует достоверность того что на вход была подана соответствующая рукописная буква
Нейронная сеть строится в два этапа
1) Выбор типа (архитектуры) сети
2) Подбор весов (обучение) сети
На первом этапе необходимо определить следующее
• какие нейроны использовать (число входов, функции активации),
• каким образом следует соединить нейроны между собой,
• что взять в качестве входов и выходов сети
Нет необходимости придумывать нейронную сеть «с нуля» так как существуют несколько десятков различных нейросетевых архитектур, причем эффективность многих из них доказана математически Наиболее популярные и изученные из них - это многослойный персептрон, нейронная сеть с общей регрессией, сети Кохонена и другие, которые будут рассмотрены ниже
На втором этапе производится обучение выбранной сети посредством настройки ее весов Количество весов может быть велико, поэтому обучение представляет собой сложный и длительный процесс Для многих архитектур разработаны специальные алгоритмы обучения, наиболее популярный из которых алгоритм обратного распространения ошибки