3. Бинарные изображения: геометрические характеристики
В этой главе мы исследуем черно-белые (бинарные) изображения. Их легче получать, хранить и обрабатывать, чем изображения, в которых имеется много уровней яркости. Однако, поскольку в бинарных изображениях кодируется информация лишь о силуэте объекта, область их применения ограничена. В дальнейшем будут сформулированы условия, необходимые для успешного использования методов обработки бинарных изображений. Здесь же внимание акцентируется на таких простых геометрических характеристиках изображений, как площадь объекта, его положение и ориентация. Подобные величины могут использоваться, например, в процессе управления механическим манипулятором при его работе с деталями. Другие аспекты, касающиеся бинарных изображений, например методы итеративной модификации, обсуждаются в следующей главе.
Поскольку изображения содержат большой объем информации, важную роль начинают играть вопросы ее представления. Мы покажем, что интересующие нас геометрические характеристики можно извлечь из проекций бинарных изображений. Проекции гораздо легче хранить и обрабатывать. В большей части данной главы речь пойдет преимущественно о непрерывных бинарных изображениях, характеристическая функция которых равна нулю или единице в каждой точке плоскости изображения. Это упрощает анализ; однако при использовании ЭВМ изображение необходимо разбить на дискретные элементы. Глава заканчивается обсуждением дискретных бинарных изображений и путей уменьшения затрат на передачу, хранение и обработку данных посредством учета пространственных взаимосвязей между элементами.
3.1. Бинарные изображения
Начнем со случая, когда в поле зрения находится единственный объект, а все остальное считается «фоном». Если объект оказывается заметно темнее (или светлее), чем фон, то легко определить характеристическую функцию
которая равна нулю для всех точек изображения, соответствующих фону, и единице для точек на объекте
Рис. 3.1. (см. скан) Бинарное изображение, определяемое характеристической функцией
которая принимает значение «нуль» или «единица».
Часто бинарное изображение получают пороговым разделением обычного изображения. К нему также можно прийти путем порогового разделения расстояния на «изображении», полученном на основе измерений расстояния.
(рис. 3.1). Такую функцию, принимающую два значения и называемую бинарным изображением, можно получить пороговым разделением полутонового изображения. Операция порогового разделения заключается в том, что характеристическая функция полагается равной нулю в точках, где яркость больше некоторого порогового значения, и единице, где она не превосходит его (или наоборот).
Иногда бывает удобно компоненты изображения, а также отверстия в них рассматривать как множества точек. Это позволяет комбинировать изображения с помощью теоретико-множественных операций, например объединение и пересечение. В других случаях удобно поточечно использовать булевы операции, подобные логическому
и логическому или
На самом деле это лишь два различных способа описания одних и тех же действий над изображениями.
Поскольку количество информации, содержащееся в бинарном изображении, на порядок меньше, чем в совпадающем с ним по размерам полутоновом изображении, бинарное изображение легче обрабатывать, хранить и пересылать. Естественно, определенная часть информации при переходе к бинарным изображениям теряется, и, кроме того, сужается круг методов обработки таких изображений. В настоящее время существует достаточно полная теория того, что можно и чего нельзя делать с бинарными изображениями, чего, к сожалению, нельзя сказать о полутоновых изображениях.
Прежде всего мы можем вычислить различные геометрические характеристики изображения, например размер и положение объекта. Если в поле зрения находится более одного объекта, то можно определить топологические характеристики имеющейся совокупности объектов: например, разность между числом объектов и числом отверстий. Нетрудно также пометить отдельные объекты и вычислить геометрические характеристики для каждого из них в отдельности. Наконец, перед дальнейшей обработкой изображение можно упростить, постепенно модифицируя его итеративным образом.
Обработка бинарных изображений хорошо понятна, и ее нетрудно приспособить под быструю аппаратную реализацию, но при этом нужно помнить об ограничениях. Мы уже упоминали о необходимости высокой степени контраста между объектом и фоном. Кроме того, интересующий нас образ должен быть существенно двумерным. Ведь все, чем мы располагаем, — лишь очертания или силуэт объекта. По такой информации трудно судить о его форме или пространственном положении.
Характеристическая функция
определена в каждой точке изображения. Такое изображение будем называть непрерывным. Позже мы рассмотрим дискретные бинарные изображения, получаемые путем подходящего разбиения поля изображения на элементы.