13.10. Комментарии к литературе
Бинокулярное стереозрение для биологических систем подробно обсуждалось в книге [63]. Ее автор показал (используя стереограммы из случайных точек), что поиск соответствия на стереопаре предшествует распознаванию. Гримсон рассматривает автоматические стереосистемы, основанные на выделении краев, в книге [48]. Моравек описывает стэнфордскую систему подвижной тележки в книге [80]. Одним из лучших описаний фотограмметрии является книга Вольфа [116]. Метод наименьших квадратов часто приводит к трудностям, которые можно обойти, используя псевдоинверсию. Здесь можно рекомендовать книгу [4].
Фотограмметрические аспекты машинного зрения обычно считались слишком тривиальными для публикаций и остались только во внутренних отчетах (см. работы [209, 246, 433]). И это несмотря на то, что стереозрение составляет важную часть зрительной системы для манипуляторов и подвижных роботов. Лонгет-Хиггинс в статье [317] описал восстановление сцен по одному или нескольким изображениям. Фишлер и Болле [204] показали, что существуют четыре решения задачи определения положения камеры по минимальному числу известных точек поверхности.
В конце 60-х — начале 70-х гг, было потрачено много сил на попытки создания машины для топографической съемки поверхности по парам аэрофотоснимков. Большая часть этих усилий ушла на корреляцию или ее простые модификации, так как главным вопросом была скорость, в то время как нужно было сосредоточить внимание сначала на основной проблеме отождествления. Многие проекты закрылись после того, как столкнулись с трудностями, отмеченными в данной главе. Однако на нескольких машинах разумные результаты для несложных местностей были достигнуты. Для этого потребовалось довольно существенное взаимодействие с оператором. Ранняя версия одного из таких компьютеров UNAMACE описана в работе [142], а в работе [296] описан гештальт-фотокартограф, — по-видимому, на сегодняшний день наиболее удачный серийный прибор. В работе [301] дан хороший обзор различных компьютеров, разработанных к 1981 г. Пять статей, посвященных автоматическому стереоотождествлению,
можно найти в апрельском 1983 г. выпуске «Техника фотограмметрии и дистанционное очувствление».
В работе [311] разработана стереосистема на основе адаптивного окна корреляции, а в работе [349] — итерационный метод, компенсирующий изменение размеров при изменении ракурса. Аналогичные методы были потом введены во многие корреляционные схемы. В работе [222] можно познакомиться с итерационным методом коррекции искажений размера. Авторы работы [234] указали на преимущества использования эпиполярной линии для ограничения перебора при отождествлении.
Сутро и Лерман [443] развили простой метод отождествления по уровню яркости, использующий массив диспаратностей и схему вычеркивания ложных отождествлений. В работе [189] использован массив диспаратностей и предложены внешние и внутренние взаимодействия, найденные затем независимо в первой стереосистеме Марра и Поджио [332]. В работе [331] усилия сосредоточены на обработке точечных стереограмм Юлеша.
Позже Марр и Поджио перешли к другому методу, основанному на отождествлении линий нулевого уровня, многие детали которого были разработаны Гримсоном. Например, Гримсон [218, 220, 221] развил методы интерполяции поверхности на основе неполных данных, полученных отождествлением линий нулевого уровня. Маррокен [335] рассматривал разрывы глубины, недоступные для обработки простыми интерполяционными методами.
Гримсон [219] также показал, что при разумных предположениях об отражательных свойствах поверхности точки изгиба не должны остаться незамеченными при поиске с помощью линий нулевого уровня. Популярное изложение двух упомянутых выше теорий стереозрения было опубликовано в работе [380].
В работе [136] предложен интересный оператор отождествления точек. Авторы работы [339] возражают против исключительного применения линий нулевого уровня и развивают свой собственный метод стереоотождествления. К более современным работам в этой области относятся работы [340, 341]. Еще один метод стереоотождествления был развит в Станфордском университете [129, 130]. Позже в Университете Карнеги — Меллона было предложено использование динамического программирования на этапе отождествления [373].
Насихара [368] развил метод, способный быстро определять величину диспаратности на грубом растре с помощью методов бинарной корреляции, примененных к знаковому разряду фильтра, подчеркивающего края. Сам он ссылается на необходимость быстрых алгоритмов для промышленных применений, и в частности, при разборе навала. Эксперименты в этом направлении были проделаны Икехи и др. [276].
Брэди и Хорн [154] изучали операторы, инвариантные относительно
вращения, так как такие операторы используются при интерполяции поверхности и выделении краев. Схема интерполяции, развитая Гримсоном, включает итерационное решение дискретного варианта эллиптических уравнений в частных производных. Как и в случае вычисления освещенности, проблемой здесь может оказаться медленная сходимость. Были разработаны методы многоуровневого разрешения, которые, по-видимому, сильно облегчают задачу. В работах [448 — 450] описано применение этих методов к нескольким алгоритмам машинного видения, в том числе интерполяционным.
Повороты можно представлять не только в виде ортогональных матриц. Например, в книге Корна и Корна [68] перечислено семь таких методов. В Гл. 18, где мы конструируем систему для разбора навала, мы изучаем кватернионы и находим, что это обеспечивает ряд преимуществ. Некоторые задачи ориентации не имеют явного решения в обозначениях, введенных здесь, но могут быть решены в кватернионах. Примеры этого можно найти в работах [420, 451].
13.11. Упражнения
(см. скан)