5. Области и сегментация изображения
Многие алгоритмы машинного видения рассчитаны на применение к изображению какой-либо одной поверхности. Если изображение поверхности не заполняет всего поля зрения, то внимание необходимо сосредоточить на той области, которая соответствует этой поверхности. В данной главе мы изучим методы сегментации изображений на области, которые должны представлять собой изображения различных поверхностей. Для этого мы прежде всего обратимся к гистограммам полутоновых уровней и попытаемся использовать проявляющуюся на изображениях пространственную взаимосвязь объектов. Задача выделения различных областей изображения упрощается, если имеется возможность получить интересующие нас изображения в разных областях спектра. Иными словами, информация о цвете помогает делу.
Мы отличаем методы, основанные на подразделении имеющихся областей, от методов, комбинирующих эти области. Во многих случаях только после выделения существенной информации об изображенных объектах можно достаточно надежно произвести сегментацию. К сожалению, большинство методов извлечения подобной информации, как правило, требует, чтобы изображение уже было сегментировано. Мы кратко затронем эту проблему.
5.1. Методы порогового разделения
Чтобы получить бинарное изображение из полутонового, необходимо установить пороговое значение (рис. 5.1). Элементы изображения, в которых уровень яркости выше порогового, в соответствующих позициях бинарного изображения дают единицы, а элементы, в которых уровень ниже, — нули (или наоборот). Как выбрать это пороговое значение? По-видимому, нам нужно придумать метод автоматического выбора порога, учитывающий как изменения освещенности, так и особенности изображенной поверхности. Один из путей состоит в анализе распределения полутоновых уровней независимо от их положения на изображении.
В случае непрерывного изображения мы можем определить плотность распределения яркости При малых величина
Рис. 5,1. Бинарное изображение, легко формируемое путем разделения по порогу значений яркости фона и объекта. Приведенный рисунок може! убедить нас в том, что даже простые силуэты способны нести в себе большой объем информации о трехмерных объектах. Удачный выбор художником точки наблюдения и наше знание об изображенном предмете благоприятствуют такому впечатлению. Силуэты незнакомых объектов, представленные со случайно выбранных точек нблгодения, как правило, интерпретировать довольно трудно. (Воспроизведено из работы [44].
— доля той части изображения, в которой яркость больше или равна, но меньше Интегрирование дает интегральную функцию распределения яркости Для заданного значения х величина — доля той части изображения, в которой яркость меньше или равна
В дискретном случае мы можем построить (дифференциальную) гистограмму распределения полутонов, которая дает число элементов изображения, имеющих заданный уровень яркости. Интегральная гистрограмма распределения полутонов получается из нее последовательным суммированием.