Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
3.2. СТРУКТУРНО-ЛИНГВИСТИЧЕСКИЙ ПОДХОД К ОБРАБОТКЕ ИЗОБРАЖЕНИЙТипичная задача автоматического распознавание образов формулируется примерно так: все множество подлежащих обработке изображений некоторым способом разбивается на конечное число классов, называемых образами. Автоматическому устройству, например ЭВМ, снабженной механизмом восприятия изображений, предъявляется изображение. Устройство должно решить, к какому из классов оно относится. Представлялось вполне естественным, что поскольку необходимо устройств, принимающее решение, то алгоритмы его работьа должны опираться на статистическую теорию решений. Объектьк каждого класса (образы) характеризовались некоторой совокупностью признаков, каждый из которых мог принимать одно из определенного множества значений. Возникала задача: с помощью» семейства поверхностей разбить пространство признаков на непересекающиеся области и сопоставить каждую область одному из образов. Если это сделано, то процесс распознавания представляется достаточно простым: для прдъявленного изображения нужно вычислить значения всех признаков, иными словами, определить некоторую точку в пространстве признаков; затем выявить, в какую из выделенных областей попадает эта точка. Изображение относится к тому образу, которому соответствует найденная область. В этом описании автоматического распознавания образов мы сознательно не использовали ни одного математического обозначения, чтобы показать, сколь проста по своей сути эта задача а ее исходной постановке Тот факт, что сейчас трудно назвать область математики, которая не привлекалась бы к решению этой и близких к ней задач, и что созданные на сегодняшний день автоматические устройства для распознавания образов уступают человеку, говорит о чрезвычайной сложности этой задачи. Описанная процедура распознавания рассматривает каждый образ и каждое конкретное изображение как изолированный объект, пусть довольно сложный, но существующий цельно и независимо от выбранной методики решения задачи. Выбор самих признаков и определение их значений осуществляется, исходя, главным образом, из стремления оптимизировать как разбивку пространства признаков на области, так и процедуру принятия решения при статистическом минимуме ошибки распознавания. Типичной задачей, на которой опробо вались те или иные процедуры распознавания, было распознавание букв некоторого алфавита. Оказалось, что даже в этом «простом» приложении описанный общий подход не всегда обеспечивает надежность распознавания. Он хорошо работает в том случае, когда изображения, представляемые на растре, близки к «идеальным» представителям класса (образа), что на практике случается крайне редко. Учитывая большое число слабо контролируемых факторов качество бумаги, качество пишущего или печатающего инструмента, характеристики фотооптического преобразователя, разнообразие почерков и шрифтов и т. д. — «оказывается чрезвычайно трудно выделить систему устойчивых признаков Многие задачи обработки изображений вообще выходят за рамки упрощенно описанного выше метода классификации по совокупности признаков, который солидаризуясь с переводчиками монографии К. Фу [46], назовем дискриминантным. К числу таких задач относится обработка изображений, не являющихся неделимыми с общечеловеческой точки зрения (например, буква или цифра), но представляющих собой некоторым образом организованную «сцену», состоящую из структурно связанных объектов, которые своим присутствием и конкретным характером межобъектных связей определяют индивидуальные особенности сцены. Анализ фотографий с искусственных спутников Земли земной поверхности с целью выявления природных ресурсов, облачного покрова для предсказания погоды, анализ фотографий пузырьковой камеры для обнаружения определенного физического явления, идентификация личности по отпечаткам пальцев, анализ принципиальной схемы электронного устройства при разработке фотошаблонов для плат печатного монтажа, визуальная проверка плат печатного монтажа для выявления дефектов производства и другие подобные задачи, являясь по сути задачами распознавания, не могут быть сведены к трем простейшим ответам «да», «нет», «не знаю», а требуют глубокого проникновения в структуру изображения — сцены. Задачи такого типа определяются как «анализ сцен». При решении таких задач часто требуется дать ответ на вопрос: находится ли определенный объект в изображении — сцене, находятся ли выделенные объекты сцены в заданном положении, например один выше другого, слева от него, за другим и т. д.? Может потребоваться и описание сцены. Для решения такого рода задач необходимо иметь развитый аппарат описания сцены, ориентированный на иерархическую структуру ее объектов, опирающийся на систему непроизводных (простейших) элементов и отношений между ними. Развитие такого аппарата основывается на аналогии между структурой изображения и структурой фразы в естественном или искуственном языке. Подобно тому, как опираясь на правила грамматики, мы строим фразы из слов, а слова из букв, можно строить изображение (сцену) из объектов, опираясь на отношения между объектами, а объекты составлять из соединяемых по определенным правилам легко выделяемых простейших фрагментов — непроизводных элементов. Если удается найти такую грамматику изображений, то возникает возможность анализировать изображения, пользуясь синтаксическими правилами этой грамматики как при синтаксическом разборе предложений естественного языка. В этом случае говорят о лингвистическом подходе к распознаванию, иногда его называют структурным, а соответствующие формальные средства — языком описаний изображений. Существенно, что эти формальные средства могут быть использованы не только для описания предъявленного изображения, но и для порождения всего класса изображений определяемого выбранными языковыми средствами, подобно тому, как по правилам грамматики естественного языка можно сгенерировать все синтаксически правильные предложения. Поэтому имеет смысл говорить о порождающей грамматике класса изображений. Изоб ражения, относящиеся к некоторому классу, соответствуют предложению (фразе) порождающего языка. Описанная в начале параграфа задача распознавания образов решается попутно в процессе синтаксического анализа. В самом деле, в ходе такого анализа устанавливается, что на заданном изображении группа из таких-то и таких-то непроизводных элементов, соединенных между собой по таким-то и таким-то грамматическим правилам, образует объект на сцене, соответствующий такой-то синтаксической категории. Это и есть решение задачи распознавания, сформулированное лишь на другом языке. Не следует понимать, что лингвистический аппарат описания изображений необходимо применять только для сцен или изображений со сложной иерархической структурой. При соответствующем подборе грамматики он может применяться и для анализа и распознавания таких «простых» образов, как, скажем, буквы и цифры. Подход с позиции теории решений (дискиминантный подход) и лингвистический подход отличаются тем, что в первом для описания и моделирования пользуются статистическими характеристиками образов, а во втором — грамматическими правилами. Эффективность того или иного подхода в значительной мере зависит от особенностей задачи и искусства разработчика. Довольно часто при решении практической задачи приходится прибегать к сочетанию того и другого подхода. Формальные грамматики и языки.Основой для построения языковых моделей сцен и объектов служат аппарат математической лиигвнстикн [13], важнейшие понятия которой рассмотрены ниже. Алфавитом V будем называть любое непустое конечное множество символов. В лингвистике алфавит обычно называют словарем. Цепочка длины Формальный язык Конечное множество правил, определяющих способ образования цепочек языка, называется грамматикой. Порождающей грамматикой называется упорядоченная четверка 1) 2) Р есть конечное множество упорядоченных пар вида 3) Элементы Поскольку не всегда у непосредственно порождается Последовательность цепочек Пусть порождаемый ею язык есть множество Пример. Пусть задана порождающая грамматика Порождающая грамматика Язык Дальнейшие ограничения на правила подстановки дают более узкую грамматику, чем контекстно-свободная, но представляющую большой интерес для теории конечных автоматов. Порождающая грамматика Язык
|
1 |
Оглавление
|