Главная > Цифровые методы обработки и распознавания бинарных изображений
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

1.2. ЗАДАЧИ ОБРАБОТКИ БИНАРНЫХ ИЗОБРАЖЕНИЙ

Применительно к бинарным изображениям можно перечислить возникающие при их обработке задачи: формирование бинарных изображений из многоградационных, кодирование,

фильтрация, обнаружение и распознавание. Рассмотрим их характерные особенности.

1.2.1. ФОРМИРОВАНИЕ БИНАРНЫХ ИЗОБРАЖЕНИЙ

Получение бинарных изображений из исходных полутоновых достигается при проведении процедуры сегментации исходной многоградационной сцены, которая позволяет представить данную сцену в виде совокупности областей, «удовлетворяющих некоторому критерию однородности» [4]. Существуют два основных подхода к решению этой задачи, каждый из которых объединяет большое количество методов.

Первый подход связан с проведением сегментации путем пороговой обработки неоднородных по яркости изображений, а второй — с выделением границ областей. Методы, реализующие эти подходы, описаны в [4, 5, 19]. Если после сегментации всем точкам сегментированного изображения присваивается один уровень яркости, а всем остальным — другой, то в результате получаем бинарную сцену, в которой изображения объектов имеют яркость, равную 1, а фон — яркость 0. При этом, естественно, в результате неизбежного действия шумов и помех некоторые точки фона будут иметь яркость, равную единице, а точки изображения—нулевую.

Основным источником информации при выборе порога по яркости является гистограмма яркостей точек сцены. В связи с тем, что распределения яркостей фона и изображения имеют разные значения математических ожиданий, то суммарная гистограмма яркостей сцены будет иметь провал, соответствующий яркости границы между фоном и изображением (рис. 1.7-1.9). В результате гистограмма будет двухмодальной, и в соответствии с тем или иным критерием качества можно выбрать значение порогового уровня и достаточно надежно отделить изображения от фона. В реальных сценах изображения каждого объекта могут иметь свои распределения яркостей, а распределение фона характеризуется большим разбросом значений яркостей. В этих условиях двухмодальность гистограммы яркостей сцены практически не наблюдается, и задача сегментации значительно усложняется. В [5] приведен ряд методов, обеспечивающих

Рис. 1.7. Одномерный срез перепада яркости и гистограмма яркостей [4]

Рис. 1.8. Расположение и форма окон обнаружителя границ в сцене

обоснованное принятие решения о принадлежности точки сцены к фону или изображению объектов.

Ситуация с принятием решения еще больше усложняется при нестационарном по яркости фоне. В данном случае необходимо переходить к локально-оптимальным процедурам, когда порог по яркости выбирается не для всей сцены, а для каждого изображения в отдельности. При этом предполагается, что в пределах отдельного изображения нестационарность фона незначительна.

Сегментация изображений методом выделения границ областей состоит в выделении граничных точек изображения.

Рис. 1.9. Взаимное расположение границы изображения и окон обнаружителя

Обычно для этих целей используются дифференциальные операторы в виде масок Превитта, Собела, Кирша и др. Учитывая большую чувствительность таких операторов к шуму, перед сегментацией обычно производится предварительная обработка сцены, направленная на ее улучшение.

После выделения граничных точек изображения переходят к формированию непрерывных границ областей (контуров) путем утоньшения полученных областей граничных точек и к удалению разрывов границ [5].

1.2.2. КОДИРОВАНИЕ БИНАРНЫХ ИЗОБРАЖЕНИЙ

Задача кодирования возникает в связи с представлением бинарных изображений в ЭВМ для их последующей обработки. По сравнению с кодированием многоградационных изображений в данном случае задача значительно легче из-за простоты бинарных изображений. Достаточно полно методы кодирования этих изображений рассмотрены в [17].

Силуэтные изображения кодируются длинами серий. При этом вдоль каждой строки растра изображения просчитывается количество точек одинаковой яркости. Последовательность чисел нулевых и единичных серий представляет собой код, задающий в ЭВМ бинарную сцену в виде последовательности чисел. Обобщением этого метода на двухмерный случай является блочное кодирование.

Для графических изображений применяется векторное кодирование. При этом каждая линия на изображении имеет кусочно-ломаную аппроксимацию. Отрезки ломаной называются векторами и подлежат кодированию. Вектор задается граничными точками и шириной линии. Вопросы кодирования контурных изображений подробно рассмотрены в п. 4.2.

1.2.3. ФИЛЬТРАЦИЯ БИНАРНЫХ ИЗОБРАЖЕНИЙ

Данный вид обработки бинарных изображений, в основном, применяется для улучшения изображений и формирования достаточных статистик для принятия решения об обнаружении изображения объекта в бинарной сцене или об отнесении его к одному из классов. Вследствие того, что бинарные изображения являются частным случаем многоградационных, к ним применимы все способы пространственной фильтрации, достаточно подробно описанные в [5, 45]. Однако простота сцен дает возможность рассмотреть новые виды фильтров. (Вопросам фильтрации силуэтных изображений посвящена глава 3 данной книги, контурных изображений — глава 5.).

1
Оглавление
email@scask.ru