15.5. Сегментирование и множественность объектов
До сих пор мы имели дело лишь с одним-единственным многогранником. Линиями изображения являлись проекции ребер, лежащих между гранями объекта. В некоторых случаях были видимыми обе грани, иногда только одна. В последнем случае ребра называются ограничивающими. Таким ребрам простого выпуклого многогранника соответствуют только линии, образующие силуэт линейного рисунка. Ребра, соответствующие всем другим линиям, лежат между видимыми гранями. Таким образом, все внутренние линии порождают ограничение на градиенты соседних граней.
Если имеется несколько объектов, то положение осложняется, так как
некоторые внутренние линии линейного рисунка соответствуют ребрам одного объекта, загораживающего другой. Тогда задача состоит в том, чтобы понять, какие области изображения связаны между собой, в том смысле, что соответствующие грани принадлежат одному и тому же объекту. Как произвести сегментирование изображения на набор областей, соответствующих отдельным объектам?
Эта задача неразрешима, если объекты могут касаться друг друга, так как, глядя на изображение, нельзя сказать, связаны ли объекты жестко, касаются ли они друг друга или они разделены. Предположим, например, что куб приставлен к концу лежащего бруска. По изображению нельзя сказать, является ли это единичным объектом L-образной формы или это — два объекта.
Две грани, соответствующие областям но обе стороны ограничивающей линии, не пересекаются по ребру, соответствующему этой линии. Это ребро возникает при пересечении невидимой грани и одной из двух видимых граней, другая видимая грань не имеет никакого отношения к этому ребру. Отсюда ясно, что ограничение, связанное с градиентным пространством, нельзя наложить на эти две видимые грани.
Можно было бы попытаться определить трехмерную структуру сцены, предполагая, что все линии, соответствующие связанным ребрам, лежат между видимыми гранями. В большинстве случаев мы быстро обнаружим, что результирующие уравнения несовместны.
Тогда можно удалить одно из ограничений и сделать новую попытку. Если уравнения становятся совместными, можно интерпретировать линейный рисунок с использованием классификации многогранников. Это не означает, что никакая другая интерпретация невозможна. Например, можно предположить, что все ребра являются ограничивающими. Тогда грани могут быть частями произвольных плоскостей, расположенных любым образом относительно лучей, проходящих через их вершины.
Линии изображения соответствуют либо закрывающему ребру, либо ребру, разделяющему две связанные грани многогранника. Нетрудно провести исчерпывающее систематическое исследование всех возможных комбинаций интерпретаций всех линий изображения. Как правило, «наиболее связная» интерпретация согласуется с суждением человека о том, что собой представляет линейный рисунок. Естественно, все это можно обсуждать лишь тогда, когда значения яркости областей известны, так как только в этом случае нет неоднозначности.
Очень часто возникает задача сегментирования изображения на области, соответствующие различным сущностям в разных средах. Большинство методов анализа изображений применимы только в том случае, когда они относятся к одной такой области, и терпят неудачу, когда используются без ограничений ко всему изображению. Методы определения по оптическому потоку компонент движения, относящихся к переносу и повороту, не работают, если данные являются смесью
информации о двух объектах, движущихся в различные стороны. Как мы видим, отсутствие этапа сегментирования изображения существенно затрудняет расчет оптического потока.