Главная > Нейронные сети для обработки информации
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

4.6. Примеры использования персептронной сети

Однонаправленные нейронные сети с сигмоидальной функцией активации широко применяются на практике, составляя важное звено процесса выработки решений. В настоящем подразделе мы ограничимся обсуждением нескольких приложений, позволяющим подчеркнуть универсальность и разнородность функций, которые они могут выполнять.

4.6.1. Распознавание и классификация образов

Распознаванием и классификацией образа будем называть его идентификацию и отнесение к соответствующему классу данных. При решении этой задачи нейронная сеть может выполнять функцию как экстрактора (определителя) свойств, так и классификатора, приписывающего образ конкретному классу. Однако чаще всего экстракция свойств производится на отдельном этапе предварительного преобразования измерительных сигналов. Для определения свойств применяются различные методы, в том числе: метод статистических моментов [81], метод преобразования Фурье [30, 151], волновое преобразование [4, 23, 93], преобразование РСА [82], преобразование Карьюнена-Лёве [70] и т.п.

В качестве примера рассмотрим, как персептронная нейронная сеть используется для распознавания и классификации двухмерных образов по их внешним описаниям. На этапе предварительной обработки сигналов будет применяться преобразование Фурье. Описание самого образа должно приводиться к виду, обеспечивающему его независимость от возможного перемещения, ротации и масштабирования. В результате такого преобразования

формируются значения свойств образа, подаваемые для распознавания на вход нейронной сети. Важным достоинством преобразования Фурье считается стабильность трансформации образа, которая в значительной степени обеспечивает независимость распознавания от уровня шумов в исходном сигнале, а также простой и быстрый в реализации алгоритм преобразования.

Начальная обработка данных на основе быстрого преобразования Фурье (FFT)

При распознавании образов, заданных некоторой структурой, подлежащий распознаванию элемент определяется множеством координат его контура. Координатное описание контура представляется комплексным числом

где - номер очередной пары измерительных данных, описывающих образ. Для их обработки будем использовать дискретное преобразование Фурье (DFT) в виде [64]

для где М означает количество точек описания структуры, а — комплексное число, определенное выражением (4.28). Отдельные компоненты преобразования Фурье образуют вектор

Этот вектор также определяет структуру образа, но в совершенно другом пространстве параметров. Компоненты этого описания позволяют легко преобразовывать данные независимо от их положения, масштаба, угла поворота, а также выбранной начальной точки и общего их количества. Следует подчеркнуть, что знания составляющих вектора достаточны для полного восстановления формы кривой с помощью обратного преобразования Фурье (IDFT).

Нулевой компонент преобразования Фурье представляет собой среднее значение (центр тяжести) измерительных выборок поскольку

Приравниванием этого выражения к нулю образ, представленный вектором перемещается на стандартную позицию относительно системы координат, не зависящую от фактического первоначального расположения в пространстве данных. По этой причине вектор после такого преобразования имеет вид: инвариантный относительно смещения.

Использование в преобразовании Фурье различного количество оригинальных выборок отражается на размерности формируемых векторов Для унификации процесса обработки данных количество наиболее значимых компонентов этого преобразования устанавливается априорно. Согласно теории преобразования Фурье [64] наиболее значимыми для отображения структуры компонентами считаются пары координат следующими и т.д. При определении К таких пар формируется редуцированное представление вектора которое независимо от количества измерительных выборок, использованных в преобразовании Фурье, имеет одну и ту же априорно установленную размерность

Инвариантность относительно масштаба образа можно обеспечить нормированием всех высших компонентов разложения Фурье, амплитудой компонента, соответствующего паре Если обозначить коэффициент масштабирования то его можно определить выражением [30, 151]

В этом случае нормализация компонентов вектора выполняется согласно формуле

При таком преобразовании дкнных полученная форма вектора не зависит от размера образа.

Преобразование Фурье состоит из компонентов, допускающих оригинальную качественную интерпретацию. Пары компонентов и т.д. имеют свой эквивалент в обратном преобразовании которое, в частности, для только одной (первой) пары можно представить в виде

Уравнение (4.33) описывает эллипс. Первая пара задает главный эллипс с наиболее длинной осью, вторая пара — следующий по величине и т.д. Поворот кривой относительно начальной позиции вызывает поворот главной оси эллипса. Поэтому для обеспечения неизменности измерительных данных относительно угла их поворота следует нормализовать положение этой оси. Коэффициент нормализации угла поворота может быть определен выражением [30, 151]

где это углы степенного представления комплексных чисел соответственно. Нормализация данных, обеспечивающая их инвариантность

Рис. 4.11. (см. скан) Влияние нормализации и учета ограниченного количества дескрипторов Фурье на представление кривой с большим содержанием шума: а) форма исходной кривой; б) нормализованная форма кривой, содержащая все дескрипторы Фурье; в) нормализованная форма кривой, содержащая только пять пар дескрипторов Фурье


относительно угла поворота, основана на умножении каждого компонента вектора преобразования Фурье на коэффициент

После такого преобразования вектор характеристик образа, подаваемый на вход нейронной сети, не будет зависеть от угла поворота этого образа. Аналогично можно унифицировать выбор точки начального описания образа [151]. Последовательное выполнение описанных преобразований применительно к исходным компонентам вектора обеспечивает полную инвариантность

относительно перемещения, поворота и масштабирования. Компоненты преобразованного таким образом вектора называются дескрипторами образов.

Важным следствием применения преобразования Фурье в качестве препроцессора считается уменьшение зависимости результатов распознавания от шума, возмущающего измерения. Помехи, как правило, имеют характер высокочастотного шума. В преобразовании Фурье это соответствует полосе разложения в высокочастотном диапазоне (компоненты высшего порядка вектора Отсечение этих компонентов вызывает автоматическое уменьшение уровня шума в образе сигнала после его воспроизведения. На рис. 4.11 иллюстрируется влияние конечного количества дескрипторов Фурье на форму воспроизведенных образов [30]: оригинальный зашумленный образ (рис. а); образ, воспроизведенный с использованием всех 64 дескрипторов Фурье (рис. б), образ, воспроизведенный с использованием пяти наиболее значимых нормализованных дескрипторов Фурье (рис. в). Из рисунка видно, что уменьшение количества дескрипторов Фурье автоматически повышает качество воспроизведенного образа. Коррекция качества заметна также и при анализе численных значений дескрипторов Фурье. Из анализа зашумленных данных следует [31], что даже при значительном присутствии шума в измерительных сигналах амплитудные характеристики дескрипторов изменяются очень незначительно. Это очень полезное качество для распознавания образов, скрытых сильными помехами.

Нейронный классификатор

Выходные сигналы препроцессора в виде последовательности компонентов дескрипторов Фурье после преобразования, обеспечивающего инвариантность к перемещению, повороту и масштабированию, становятся входными сигналами для многослойной нейронной сети, играющей роль системы распознавания образов и одновременно выполняющей их классификацию (отнесение каждого образа к соответствующему эталонному классу). Количество входных узлов сети равно количеству дескрипторов Фурье, учитываемых при классификации. Если допустить, что каждый выходной нейрон представляет единственный класс, то их количество также будет постоянной величиной, равной числу классов. Поэтому в соответствии с методикой, предложенной в начале настоящего раздела, подбираться может только количество скрытых слоев и число нейронов в каждом слое.

Классификатор тренируется методом обратного распространения с использованием одного из обучающих алгоритмов на множестве обучающих данных, последовательно представляющих все классы образов, подлежащих распознаванию. В режиме воспроизведения классифицируемый образ, прошедший через все фазы препроцессора, подается на вход сети, возбуждая тот выходной нейрон, который соответствует требуемому классу.

Из-за зашумленности образов на этапе их распознавания выходные сигналы нейронов сети могут принимать непрерывные значения из интервала [0,1] вместо

(кликните для просмотра скана)

ожидаемых бинарных нуль-еяиничных значений (с единицей, обозначающей распознанный класс).

Один из способов решения этой проблемы заключается в том, что в качестве представителя распознанного класса признается наиболее активный нейрон (выработавший самый сильный выходной сигнал). Однако такой подход не позволяет сравнивать активность различных нейронов и приводит к ситуации, в которой решение о победе конкретного нейрона принимается даже тогда, когда активность всех нейронов близка к нулю. Это может приводить к ошибочной классификации.

Наилучшим подходом представляется двухуровневая интерпретация. Вначале проверяется, насколько максимальный сигнал превышает следующий за ним. Если эта разница достаточно велика, победителем признается наиболее активный нейрон. В противном случае, а также если уровни активации всех нейронов не превышают определенного порога, интерпретатор при объявлении результата сообщает, что классификация считается неполной и тем самым предостерегает пользователя от возможной ошибки.

Подобная реализация нейросетевого классификатора была апробирован; при распознавании и классификации многих разнообразных образов, в том числе букв и цифр, предметов, объектов и т.п. На рис. 4.12 представленс тестовое множество объектов различных классов, которые распознавались с использованием персептронной сети. После предварительной обработки этих данных с помощью преобразования FFT были сформированы 18-элементных векторные дескрипторы (пять пар наиболее значимых коэффициентов Фурье для амплитуды и для фазы, при этом имеющие нулевые значения фазовые компоненты не использовались). В ходе многочисленных экспериментов количество скрытых нейронов выбрано равным 8. Применялась простейшая интерпретация результатов. Выходной сигнал в диапазоне рассматривался как нулевой, а свыше 0,5 - как единица. После нормализации компонентов преобразования Фурье эффективность распознавания незашумленных сигналов составила 100 %. Только значительная зашумленность измерительных сигналов (исходные данные зрительно почти не распознавались) с уровнем шума порядка 70 % уменьшила эффективность распознавания до 90 %.

1
Оглавление
email@scask.ru