1. Введение
В этой главе мы расскажем о том, что представляет собой система машинного зрения и для решения каких задач она предназначена. Мы также рассмотрим связь машинного зрения с другими областями, в которых разрабатываются методы обработки изображений или их символического описания. Наконец, мы введем то конкретное понятие машинного зрения, которое используется в этой книге, и дадим краткий обзор содержания последующих глав.
1.1. Машинное зрение
Зрение является самым мощным из наших органов чувств. Оно снабжает нас поразительно большим объемом информации о том, что нас окружает, и дает возможность свободно взаимодействовать с внешним миром, причем все это без непосредственного физического контакта. Благодаря ему мы узнаем расположение объектов, идентифицируем их, соотносим их друг с другом и потому ощущаем значительное неудобство. если лишены этого чувства. Поэтому неудивительно, что, как только цифровые вычислительные машины оказались достаточно доступными, начали предприниматься попытки наделить их способностью «видеть».
В то же время зрение является самым сложным из органов чувств. Накопленные нами знания о том, как функционируют биологические зрительные системы, до сих пор фрагментарны и ограничены в основном теми этапами переработки информации, которые следуют непосредственно за поступлением сигналов от сенсоров. Что мы действительно знаем, гак это то, что биологические зрительные системы сложны. Поэтому не является неожиданным тот факт, что многие попытки наделить машины способностью «видеть» окончились неудачей. Тем не менее удалось достичь значительного прогресса, и сейчас можно найти зрительные системы, которые включены в состав машинных комплексов и успешно функционируют в условиях изменяющейся окружающей среды.
Значительный прогресс был достигнут в промышленных применениях, где окружающую среду можно контролировать, а задание, стоящее перед системой машинного зрения, четко обозначено. Типичным примером может служить зрительная система, предназначенная для
Рис. 1.1. (см. скан) Наличие системы машинного зрения придает манипулятору существенно больше гибкости и позволяет ему работать в условиях, когда положения и ориентации деталей могут изменяться. В некоторых случаях подходящими для этой цели оказываются простые бинарные системы обработки изображений.
управления рукой робота при захвате деталей с ленты конвейера (рис. 1.1).
Не столь значителен успех в тех областях, где компьютеры использовались для извлечения плохо определенной информации из изображений, которые нелегко интерпретировать даже человеку. Особенно это относится к изображениям, полученным с помощью средств, отличных от обычных оптических приборов, работающих в видимом диапазоне спектра. Типичной задачей подобного рода является интерпретация рентгеновских снимков человеческого легкого.
Как это всегда бывает при изучении какой-либо сложной области, некоторые первоначальные идеи постепенно отмирали, а их место со временем занимали новые. Все это, несмотря на случаюшиеся порой неизбежные разочарования, составляет часть увлекательнейшего процесса поиска решения. Некоторые, например, считают, что понимать подробности процесса формирования изображения необязательно. Другие слишком увлекаются специальными вычислительными методами довольно узкого круга применения. Несомненно, что часть изложенных здесь идей также будет в свое время пересмотрена или
отброшена. Слишком уж быстро развивается область, чтобы такого не произошло.
В настоящий момент мы не можем создать «универсальную» зрительную систему. Вместо этого мы обратим внимание либо на системы, выполняющие какое-либо конкретное задание в контролируемой окружающей среде, либо на отдельные модули, которые со временем могут стать частью системы общего назначения. Естественно, нам нельзя также забывать о практических соображениях, связанных со скоростью обработки и стоимостью системы. Ввиду огромного объема данных и характера требуемых вычислений часто трудно достичь удовлетворительного компромисса между этими факторами.