13. Фотограмметрия и стереовидение
Если спросить, как можно видеть предметы «в глубину», почему возможно трехмерное зрение, самым обычным будет ответ, что для оценки глубины используется смещение изображений, полученных левым и правым глазом. Хотя метод бинокулярного стереовидения далеко не единственно возможный подход к проблеме глубины, он кажется на первый взгляд самым понятным. Точки поверхности предмета дают изображения, относительное положение которых зависит от расстояния до точки наблюдения.
Мы начнем эту главу с изучения фотограмметрии, чтобы понять, как получаются изображения точек окружающей Среды с помощью различным образом расположенных и ориентированных камер. Интерпретацию стереопар мы должны начать с рассмотрения преобразования, связывающего две координатные системы камер. Начнем с простого случая, когда известны как направление смещения, так и его величина. Затем перейдем к более трудной задаче, когда можно узнать только направления. Этот метод будет также применен для приведения во взаимное соответствие систем координат, одна из которых связана со зрительной системой робота, а другая — с механическим манипулятором — так называемое преобразование глаз — рука.
В основе любой автоматической стереосистемы лежит некоторый метод установления соответствия между точками двух изображений. Мы оставим эту наиболее проблематичную часть задачи на конец. Предлагались различные подходы к этой проблеме, включая корреляционные методы, методы установления соответствия по уровню яркости, методы, основанные на выделении краев. В настоящее время методы, основанные на выделении краев, считаются самыми эффективными, однако они дают информацию о глубине лишь для конечного числа точек. Для заполнения промежутков используется интерполяция. В конце этой главы будут обсуждены методы гладкой интерполяции.
13.1. Относительное смещение двух изображений. Диспаратность
Проиллюстрируем основные геометрические соотношения на простом примере. Предположим, что две камеры жестко соединены между
Рис. 13.1. Просты конструкция камеры для стереофотографии. Оптические оси параллельны друт другу и перпендикулярны базовой линии, соединяю-; щей две камеры.
собой так, что их оптические оси параллельны и отстоят друг от друга на расстояние 6 (рис. 13.1). Прямая, соединяющая центры объективов, называется базой. Предположим, что базовая линия перпендикулярна оптическим осям и параллельна оси х. Координаты гочки
— внешней среды определяются относительно системы координат, начало которой расположено посередине между центрами объективов. Обозначим координаты через
для левого и правого изображений соответственно. Тогда
при этом
где
расстояние от центра линзы до плоскости изображения (для обеих камер). Эти три уравнения можно разрешить относительно трех неизвестных х,
Прежде всего заметим, что
Разность
принято называть диспаратностью. Имеем
Расстояние до объекта обратно пропорционально диспаратности, причем расстояние до близких объектов можно измерить точнее, чем до удаленных. Заметим также, что диспаратность пропорциональна расстоянию между центрами линз
. Поэтому при фиксированной погрешности измерения диспаратности точность определения глубины будет возрастать с увеличением базы. К сожалению, чем дальше разнесены камеры, тем меньше похожи изображения. Например, некоторые
объекты, снятые одной камерой, даже могут быть невидимыми другой. Диспаратность пропорциональна также эффективному фокусному расстоянию
поскольку изображение увеличивается с увеличением фокусного расстояния.
Точка внешнего мира, видимая для обеих камер, порождает пару точек на изображениях, называемую сопряженной парой. Заметим, что точка на правом изображении, соответствующая некоторой известной точке на левом, должна лежать на определенной прямой, поскольку обе точки имеют одинаковую
-координату. Эта прямая называется эпиполярой. Характерная точка, наблюдаемая на левом изображении, может иметь или не иметь пару на правом, но если она ее имеет, то искать ее нужно только на эпиполяре, поскольку в другом месте ее быть не может. Заметим, что для данной простой геометрии все эпиполяры параллельны оси х. Как мы увидим ниже, в общем случае это не так.
На рис. 13.2 представлено стереоизображение поверхности Марса, полученное спускаемым аппаратом Viking - I. Расстояние между картинками выбрано так, чтобы их можно было смотреть с помощью карманного стереоскопа. Однако нас здесь в первую очередь интересует величина диспаратности. Изменение этой величины от горизонта до камней на переднем плане очень велико при большой базе
и при том, что ближайшие камни расположены на расстоянии всего нескольких метров. Поучительно измерить расстояние между соответствующими точками переднего плана и сравнить его с расстоянием между соответствующими точками вблизи горизонта.
Рис. 13.2. Рельеф поверхности Марса, полученный двумя камерами, установленными на спускаемом аппарате Viking-I. Диспаратность быстро меняется, когда мы двигаемся от горизонта к камням на переднем плане, (Изображения IPL PIC ID 78/10/19/171012 и 78/10/19/175118 получены с разрешения National Space Science Data Center, Гринбелт, шт, Мериленд.)