Главная > Алгоритмы машинной графики и обработки изображений
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

Глава 1. ВВЕДЕНИЕ

1.1. МАШИННАЯ ГРАФИКА, ОБРАБОТКА ИЗОБРАЖЕНИЙ И РАСПОЗНАВАНИЕ ОБРАЗОВ

Обработка информации, представленной в виде изображений, на ЭВМ имеет множество разновидностей и массу практических приложений. Эту область обработки информации обычно принято разделять на три направления: машинную графику, обработку изображений и распознавание изображении.

Задача машинной графики — воспроизведение изображении в тех случаях, когда исходной является информация неизобразительной природы, это направление имеет широкий спектр приложений. Сложность программ, так же как и вычислительные затраты, необходимые для получения соответствующих визуальных отображений, существенно зависят от характера конкретной задачи. Примеры визуализации (в порядке усложнения) включают построение графиков функций или экспериментальных данных, вывод информации на экран в получающих все большее распространение машинных играх и синтез сцен, предназначенных для использования в пилотажных тренажерах. Следует обратить внимание на то, что графики являются статическими относительно времени, визуальные отображения, встречающиеся в машинных играх, изменяются во времени, а сцены, используемые в тренажерах, не только изменяются во времени, но должны также создавать иллюзию глубины. Машинная живопись и машинный синтез мультипликационных фильмов представляют собой две сферы приложения машинной графики, требующие не только технической квалификации, но и таланта Сейчас, вероятно, именно в этих сферах наблюдается наиболее быстрое развитие Термин интерактивная машинная графика относится к устройствам и системам, в которые пользователь вводит исходные данные, сформулированные в терминах порождаемого визуального отображения (например, требуется провести на экране прямую между двумя точками, указанными пользователем).

Обработка изображений связана с решением таких задач, в которых и входные, и выходные данные являются изображениями. Одним из примеров служат системы передачи изображений — их разработчики сталкиваются с проблемами устранения шума и сжатия данных. Снимки, полученные с передержкой или недодержкой, как и размытые снимки, могут быть улучшены с помощью методов повышения контраста. Иногда желательно воспользоваться более радикальными преобразованиями. Изображение, характеризующееся большим диапазоном яркостей, можно свести к изображению, на котором будут видны только два уровня яркости. Силуэты, полученные в результате подобного преобразования, можно затем превратить в фигуры, построенные из палочек. В других случаях может возникнуть даже задача построения нового изображения по набору других изображений, как это требуется, скажем, при синтезе изображений поперечных сечений тела человека по рентгенограммам, соответствующим боковым проекциям

Задачей распознавания изображений является применение методов, позволяющих либо получить некоторое описание изображения, поданного на вход системы, либо отнести это изображение к некоторому определенному классу Распознавание зрительных образов представляет собой, в некотором смысле, обратную задачу машинной графики. Процедура распознавания применяется к некоторому изображению и обеспечивает преобразование его в некоторое абстрактное описание: набор чисел, цепочку символов или граф. Последующая обработка такого описания позволяет отнести исходное изображение к одному из нескольких классов Типичным примером прикладной задачи такого рода служит автоматическая сортировка почты, в процессе которой соответствующее устройство изучает почтовый индекс, написанный на конверте, и идентифицирует цифры, его образующие. Автоматизация медицинской диагностики связана с обнаружением на рентгенограммах или иных изображения медицинских объектов отклонений от нормы определенного вида На рис 1.1 сведены воедино отмеченные выше сходство и отличия трех направлений обработки информации, представленной в виде изображений И хотя каждое из этих направлений имеет, по меньшей мере, двадцатилетнюю историю развития, их сходство привлекло внимание лишь недавно Связь распознавания и обработки изображений была впервые осознана благодаря возможности осуществления таких преобразований изображения, в

Рис. 1.1 Схема, иллюстрирующая взаимосвязь машинной графики, обработки изображений и распознавания образов

результате которых упрощается задача его классификации. Осознание существования связей между этими двумя направлениями и машинной графикой произошло позднее. К одному из классов задач, несомненно являющимся предметом общего интереса этих трех направлений, относится получение внутреннего представления изображений в вычислительной машине (структуры данных, хранение и поиск, уплотнение и т. д.). В некоторых других задачах подобная общность интересов менее очевидна: так, при обработке изображений часто возникает задача построения контура, а в машинной графике столь же часто встречается задача заполнения контура. Поскольку эти операции взаимно обратны, то неудивительно, что определенные теоретические проблемы являются предметом общего интереса для этих двух направлений.

Приведем пример, в котором общность этих трех направлений проявляется в самой полной мере.

Пример 1.1. Существенное практическое значение имеет задача передачи изображений документов по каналам связи. Для обеспечения хорошего воспроизведения формы буквенноцифрового символа необходимо преобразовать каждый символ в цифровую матрицу, содержащую, по меньшей мере, 20 строк и 15 столбцов (матрица покрывает и часть чистого пространства, окружающего символ). Для точного воспроизведения типографского шрифта (например, курсива, жирного шрифта и т. п.) требуется более высокая разрешающая способность. Указанная матрица может быть бинарной, и, следовательно, для передачи каждого символа необходимо затратить не менее 300 бит. Обработка изображений заключается в применении преобразований, отображающих в результате эту матрицу в объект, для передачи которого требуется меньше 300 бит, причем применение после приема обратного преобразования обеспечивает получение исходного изображения или, по крайней мере, его хорошего приближения. Использование известных преобразований такого рода может уменьшить число требуемых битов самое большее в шесть раз. Допустим, с другой стороны, что осуществлено распознавание и установлено название каждого символа, которое затем и передается на приемное устройство. Для описания такого названия обычно достаточно 8 бит и, таким образом, объем информации, подлежащей передаче, снижается почти в 40 раз. Приемное устройство, естественно, должно обеспечивать воспроизведение изображений символов, что составляет несложную задачу машинной графики. Отметим также, что для отображения символа можно было бы обойтись матрицей с меньшими размерами: обычно достаточно десяти строк и семи столбцов. Таким образом можно обеспечить «постоянное» сжатие данных. Задача становится более сложной, когда текст содержит иллюстрации. В этих случаях следует изменять систему кодирования в процессе обработки. Система, в которой реализован такой принцип, описана в работе [1.5].

Пример 1.1 служит иллюстрацией задачи, при решении которой необходимо прибегать к обработке изображений, машинной графике и распознаванию. Подобные прикладные задачи становятся все более и более многочисленными по мере снижения стоимости использования вычислительных машин и периферийных устройств. Поскольку каждое из этих направлений достаточно обширно, невозможно охватить все три в одной книге. Вместо этого мы сосредоточим внимание на общих задачах и на тех проблемах, которые являются фундаментальными для обработки информации, представленной в виде изображений. Мы не будем затрагивать проблемы, связаные с аппаратурой, не только по причине

стремительных изменений в области техники такого рода, но и потому, что мы делаем упор на алгоритмы и методы.

Одним аспектом нашей задачи прежде всегда пренебрегали — речь идет о своеобразии природы изображений, которое требует использования иных методов анализа по сравнению с применяемыми для обработки звуковых и электрических сигналов. Распространение методов обработки сигналов с одномерного на двухмерный случай — задача нетривиальная. Ее решение зависит и от физической интерпретации размерности. Так, сигнал, зависящий от времени и некоторой пространственной переменной, требует иной обработки, чем сигнал, зависящий от двух пространственных переменных. Математическое подобие форм сигналов может оказаться обманчивым.

1
Оглавление
email@scask.ru