Главная > Принципы распознавания образов
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

1.2. ОСНОВНЫЕ ПОНЯТИЯ РАСПОЗНАВАНИЯ ОБРАЗОВ

Способность «распознавать» считается основным свойством человеческих существ, как, впрочем, и других живых организмов. Образ представляет собой описание объекта. В каждое мгновение нашего бодрствования мы совершаем акты распознавания. Мы опознаем окружающие нас объекты и в соответствии с этим перемещаемся и совершаем определенные действия. Мы можем заметить в толпе друга и понять, что он говорит, можем узнать голос знакомого, прочесть рукопись и идентифицировать отпечатки пальцев, можем отличить улыбку от злобной гримасы. Человеческое существо представляет собой очень сложную информационную систему — в определенной степени это определяется чрезвычайно развитыми у человека способностями распознавать образы.

В соответствии с характером распознаваемых образов акты распознавания можно разделить на два основных типа: распознавание конкретных объектов и распознавание абстрактных объектов. Мы распознаем символы, рисунки, музыку и объекты, нас окружающие. Процесс, включающий распознавание зрительных и слуховых образов, можно определить как «сенсорное» распознавание. Процессы этого типа обеспечивают идентификацию и классификацию пространственных и временных образов. С другой стороны, мы в состоянии с закрытыми ушами и глазами опознать старый довод или найти решение задачи. Подобные процессы обеспечивают распознавание абстрактных объектов и их можно определить как «понятийное» распознавание в отличие от зрительного или слухового распознавания. В данной книге мы будем иметь дело с распознаванием первого типа. Примерами пространственных образов служат символы, отпечатки пальцев, синоптические карты, физические объекты и рисунки. В разряд временных образов входят речь, переменные сигналы, электрокардиограммы, характеристики цели и временные ряды.

Распознавание человеком конкретных образов можно рассматривать как психофизиологическую задачу, связанную с процессом взаимодействия индивида с определенным физическим раздражителем. Когда индивид воспринимает образ, он реализует процесс индуктивного вывода и устанавливает ассоциативную связь между своим восприятием и определенными обобщенными понятиями или «ориентирами», установленными им на основании прошлого опыта. В сущности распознавание человеком образов можно свести к вопросу оценки относительных шансов на то, что исходные данные соответствуют тому или иному из известных множеств статистических совокупностей, определяющихся прошлым опытом человека и предоставляющих

ориентиры и априорную информацию для распознавания. Таким образом, задачу распознавания образов можно рассматривать как задачу установления различий между исходными данными, причем не посредством отождествления с отдельными образами, но с их совокупностями; последнее осуществляется при помощи поиска признаков (инвариантных свойств) на множестве объектов, образующих определенную совокупность.

В задачах распознавания образов можно выделить два основных направления.

1. Изучение способностей к распознаванию, которыми обладают человеческие существа и другие живые организмы.

2. Развитие теории и методов построения устройств, предназначенных для решения отдельных задач распознавания образов в определенных прикладных областях.

Первое направление связано с такими дисциплинами, как психология, физиология и биология, второе же имеет дело в первую очередь с техникой, вычислительными машинами и информатикой. В нашей книге речь будет идти о вычислительных машинах, информатике и технических аспектах построения автоматических систем распознавания образов.

Проще говоря, распознавание образов можно определить как отнесение исходных данных к определенному классу с помощью выделения существенных признаков или свойств, характеризующих эти данные, из общей массы несущественных деталей. Прогноз погоды можно интерпретировать как задачу распознавания образов. Исходные данные в этом случае принимают вид синоптических карт. Система интерпретирует их, выделяя существенные признаки и формируя на их основе прогноз. Постановку медицинского диагноза также можно рассматривать как задачу распознавания образов. Симптомы служат исходными данными для распознающей системы, которая на основе их анализа идентифицирует заболевание. Система распознавания символов представляет собой систему распознавания образов, в которую в качестве исходных данных вводятся оптические сигналы и которая индентифицирует названия символов. В системе распознавания речи произнесенное слово идентифицируется посредством анализа воспринятого системой звукового сигнала. В табл. 1.1 перечислен ряд задач классификации, а также соответствующие исходные данные и ответы, выдаваемые системой.

Предмет распознавания образов объединяет ряд научных дисциплин; их связывает поиск решения общей задачи — выделить элементы, принадлежащие конкретному классу, среди множества размытых элементов, относящихся к нескольким классам. Под классом, образов понимается некоторая категория, определяющаяся рядом свойств, общих для всех ее элементов.

Таблица 1.1 (см. скан)

Образ — это описание любого элемента как представителя соответствующего класса образов. В случае когда множество образов разделяется на непересекающиеся классы, желательно использовать для отнесения этих образов к соответствующим классам какое-либо автоматическое устройство. Считывание и обработка погашенных банковских чеков являются примером задачи распознавания образов. Подобные задачи могут выполняться и людьми; машина, однако, справляется с ними много быстрее. С другой стороны, некоторые задачи распознавания таковы, что человек едва ли в состоянии решать их. Примером задач такого рода служит выделение из множества морских сигналов и шумов тона подводной лодки посредством анализа подводных звуковых сигналов.

Очевидное, но совсем уж «бесхитростное» решение задачи распознавания заключается в применении к отдельным предъявленным образам ряда простых тестов для выделения признаков каждого класса. Совокупность этих тестов должна различать все допустимые образы из разных классов. Рассмотрим, например, следующие четыре китайских иероглифа:

Эти простые символы можно распознать с помощью тестов, проверяющих наличие вертикальной черточки, горизонтальной черточки, отдельной точки, открытой верхней части, открытой нижней части и последовательности точек, подсчитав затем количества и последовательности черточек. В качестве второго примера рассмотрим следующие пять английских букв:

Эти буквы можно классифицировать, применив тесты на наличие таких признаков, как замкнутая кривая, изгиб, двойной изгиб, вертикальный отрезок, короткий отрезок. На рис. 1.1 приведена функциональная блок-схема, иллюстрирующая описанный подход к распознаванию образов.

Рис. 1.1. (см. скан) Блок-схема простой логической (вопросно-ответной) процедуры классификации символов.

Если следовать такому интуитивному подходу, то построение автоматической системы распознавания образов может показаться довольно простой задачей. Не существует, однако, общей теории, позволяющей определить, какие из всего множества мыслимых тестов следует применить к предъявленным образам. Очень ограниченное количество или небрежный выбор тестов не дадут возможности получить характеристики предъявленных

для распознавания образов, достаточные для отнесения их к соответствующим классам. Слишком много тестов, с другой стороны, необоснованно усложнят вычисления, осуществляемые в процессе дальнейшего анализа. Отсутствует какое-либо общее правило для получения неких ориентиров, способствующих определению набора таких тестов. Подобный подход чрезмерно зависит от опыта и технической интуиции разработчика и поэтому часто не дает удовлетворительного решения задач распознавания образов, встречающихся в практической деятельности.

Рис. 1.2. Иерархия отношений между образами и классами образов.

Тщательное изучение задач, возникающих в процессе распознавания образов, позволяет прийти к более эффективным подходам. Именно эти задачи рассматриваются и анализируются в нашей книге.

Между образами и классами образов существует некое иерархическое упорядочение. Так, на схеме, приведенной на рис. 1.2, буквенно-цифровые символы и китайские иероглифы являются образами, а символы соответствуют классу образов. Буквы алфавитов и цифры являются образами, если буквенно-цифровые символы рассматриваются как класс образов. Печатные и рукописные изображения, например, буквы А являются образами буквы английского алфавита А, которая представляет в этом случае класс образов. Многие информационные системы нуждаются в устройстве для распознавания печатных букв и цифр, набранных различными шрифтами, и рукописных букв и цифр, написанных различными почерками. Это означает, что имеется 62 класса образов, представляющие 26 прописных букв, 26 строчных букв и 10 цифр Разнообразие наборных шрифтов

и способов написания определенной буквы или цифры порождает образы, принадлежащие к определяющему данный символ классу.

Остановимся на задаче распознавания письменных знаков. Конкретная буква или цифра вне зависимости от того, как она напечатана или написана, обладает рядом общих признаков, которые используются в качестве средств ее идентификации. Буквы и цифры идентифицируются и классифицируются согласно отмеченным у них таким признакам. Следовательно, основные функции системы распознавания образов заключаются в обнаружении и выделении общих признаков образов, описывающих объекты, принадлежащие к одному и тому же классу образов, узнавании этого образа в любой другой обстановке и отнесении его к одному из заданных классов.

Categories

1
Оглавление
email@scask.ru