Главная > Принципы распознавания образов
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

3.2.4. Синтез системы распознавания. Пример

Классификация образов по критерию минимума расстояния широко используется в специализированных устройствах, предназначенных для распознавания символов, в частности в устройствах для считывания кодовых символов с банковских чеков, описанных в гл. 1. Данный пример приводится для того, чтобы достаточно подробно обсудить принципы работы подобных устройств и использовать их для иллюстрации этапов построения несложной системы распознавания, основанной на рассмотренных методах.

Основным принципом распознавания символов комплекта стилизованного шрифта является сопоставление по признакам, упомянутое в § 1.5. Реализовать процесс сопоставления можно посредством классификатора, использующего критерий минимума расстояния. В связи с высокой степенью стилизации и хорошим качеством символов мы, в сущности, имеем дело с задачей разбиения на четырнадцать классов, каждый из которых представляется единственным эталоном. Форма символов гарантирует необходимую степень разделения эталонов. Обозначим векторами точки, соответствующие запоминаемым значениям сигнала, представляющего каждый символ, а вектором — аналогичные точки сигнала от подаваемого на вход системы распознавания символа. Если рассматривать значения сигнала лишь на девяти внутренних вертикальных образующих сетки (см. рис. 1.7), то каждый образ будет представлен девятимерным вектором. Вполне естественно при этом относить образ классификация которого неизвестна, к тому классу, эталон которого является для этого образа ближайшим. Реализация процедуры использует принцип минимума расстояния.

Как было показано в (3.2.4) и (3.2.5), задача с единственным эталоном допускает представление с помощью линейных решающих функций. Это обстоятельство было использовано практически, когда соответствующие решающие функции реализовывались с помощью несложной матрицы резисторов (см. рис. 2.10), что позволило увеличить скорость классификации в устройствах считывания стилизованного шрифта.

Хотя большинство современных коммерческих устройств, предназначенных для считывания стилизованного шрифта, основаны на рассмотренных выше принципах, полезно еще раз проанализировать эту задачу и синтезировать несложную систему распознавания символов, ориентированную на машинную реализацию. Наша цель в этом случае состоит не в обсуждении подробностей и вариантов разработки системы, а заключается скорее в том, чтобы на примере известной задачи систематически

проиллюстрировать общепринятую методику построения системы распознавания образов.

Первым этапом разработки системы является выбор измерительного устройства, которое должно обеспечить преобразование каждого символа в образ, представленный количественными параметрами. Хотя рассмотренная выше схема, вероятно, реализует наиболее эффективный метод измерения, рассмотрим альтернативный вариант, изображенный на рис. 3.6, а. Этот метод, который часто используется в более сложных устройствах, предназначенных для считывания различных наборов шрифта, в частности символов, используемых в печатающих устройствах, сводится к следующему. Символ освещается и его изображение с помощью системы линз (на рисунке показана лишь одна из них) проектируется на матрицу фотоэлементов. Каждый фотоэлемент, входящий в матрицу, срабатывает только при достаточно интенсивном освещении его поверхности. Обозначив выходную величину возбужденного элемента как 0, а невозбужденного — как 1, можно считать, что в результате подобной процедуры измерения для каждого символа получается соответствующая двоичная матрица. Эта матрица, в сущности, дает двоичное изображение символа, в котором нулями представлены белые участки спроектированного изображения, а единицами — черные.

Если матрица фотоэлементов идентична сетчатке, представленной на рис. 1.7 для каждого символа, очевидно, что каждый символ преобразуется в двоичную матрицу размера 9X7. Последнюю в свою очередь можно трансформировать в 63-мерный вектор, считая, скажем, первую строку семью первыми компонентами вектора, вторую строку — семью следующими и т. д. Эта операция, естественно, совершенно не обязательна, однако ради единообразия системы обозначений будем полагать, что все матрицы образов представлены в векторной форме.

Следующий стандартный этап построения системы распознавания связан с выбором набора признаков, характеризующих изучаемые объекты. В данном случае можно опустить этот этап, так как решается простая задача, в которой каждый класс представляется единственным эталоном. Методы выбора признаков, пригодные для решения обширного набора более сложных задач, будут рассмотрены в гл. 7.

И, наконец, следует заняться синтезом собственно классификатора. В данном случае этот этап сводится просто к разработке устройства, обеспечивающего вычисление расстояний от заданного образа до всех эталонов и выбор минимального расстояния для классификации этого образа.

Укрупненная блок-схема реализации на ЭВМ классификатора, действующего по принципу минимума расстояния, приведена

(кликните для просмотра скана)

на рис. 3.6,б. Блок считывания, как отмечалось выше, обеспечивает получение вектора образа для каждого считываемого символа. Отмеченное на схеме входное запоминающее устройство представляет собой просто буфер; как правило, это магнитная лента или магнитный диск, используемый для хранения результатов, полученных на этапе считывания; последние затем поступают в машину для обработки. Эталоны и программы определения минимального расстояния обычно хранятся во внешнем запоминающем устройстве на магнитном диске, магнитной ленте, перфокартах или других подходящих носителях. Блок-схема программы приведена на рис. 3.6, е. Эта программа вводится в машину только в тех случаях, когда она необходима для обработки символов. На заключительном этапе работы системы полученные результаты запоминаются с тем, чтобы их можно было использовать впоследствии, например, для выписывания и ведения счетов, а также осуществления различных операций по взаимным расчетам между отдельными банками.

Система, представленная на рис. 3.6, может быть реализована на любой снабженной соответствующим периферийным оборудованием универсальной вычислительной машине, поскольку требования, предъявляемые системой и к памяти, и к возможностям обработки, явно не очень суровы. Реальные системы распознавания символов обычно выпускаются в виде специализированного вычислительного устройства с тем, чтобы увеличить скорость обработки символов.

Categories

1
Оглавление
email@scask.ru