Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
Глава 1. Цели и средства в анализе образов1.1. Цели анализа образовОсновными понятиями теории образов являются объекты и отношения. Объектами в теории образов служат образующие, конфигурации, идеальные и деформированные изображения, классы образов. Отношения в теории образов задаются в виде преобразований подобия, комбинаторных отношений, правил идентификации и механизмов деформации. Объекты распределены по уровням, причем образующие занимают нижний уровень, конфигурации — ближайший к нему верхний и т. д. В иерархической системе образов может содержаться значительное число уровней. При синтезе образов продвижение происходит от нижнего к верхнему уровню системы. Анализ образов представляет собой обратный процесс: в качестве отправной точки анализа выбирается верхний уровень образа и предпринимается попытка расчленить объект-образ на объекты, принадлежащие низшим уровням., Было бы бессмысленно говорить в такой постановке об анализе прежде, чем определен процесс синтеза. В первом томе мы убедились, что теория обладает высокой степенью гибкости; это было показано на значительном числе частных случаев, количество которых будет существенно увеличено в данном, а также третьем томах. Это означает, естественно, что анализ образов может принимать самые различные формы в зависимости от конкретной природы образующих, типа соединения и тому подобных факторов. На данной стадии достаточно остановиться на наиболее распространенных разновидностях анализа, с другими же мы будем встречаться по мере нашего продвижения вперед. В анализе образов нам придется изучать отображения между различными пространствами, встречающимися в теории образов: пространством конфигураций, алгеброй изображений, алгеброй деформированных изображений, структурой класса образов. Точно такая же ситуация существует в классических алгебраических системах, в которых мы изучаем, например, отображения между группами. Мы изучаем, в частности, отображения, сохраняющие алгебраические свойства, гомоморфизмы, или другие ствойства инвариантности и/или ковариантности. Случай 1.1.1. (восстановление изображений). Данная задача состоит в отыскании отображения из алгебры деформированных изображений В разд. 1.1.3 мы обсудим, что именно понимается под восстановлением идеального изображения Напомним в качестве соответствующего примера задачу отыскания образа-множества, преобразованного в результате воздействия пуассоновского механизма деформации к наблюдаемому точечному образу (см. т. 1, случай 4.5.2). В этом Случае, так же как и в последующих, нет оснований полагать, что ответ будет однозначным. Если это так, то мы сталкиваемся с необычной, вырожденной ситуацией. В противном случае мы попытаемся выбрать отображение, котороэ было бы естественным, обоснованным или даже оптимальным в некотором точном смысле. Иногда требуется, чтобы восстановление изображения сопровождалось определением примененного механизма деформации. Тогда нас интересует отображение Случай 1.1.2 (анализ изображения). Для заданного изображения В случае временных образов типа процессов, например, приходится решать задачу сегментации, а также отыскивать виды сигналов, соответствующие отдельным отрезкам на временной оси (см. т. 1, случай 3.4.3). Случай 1.1.3 (аппроксимация изображения). Располагая обычными исходными данными и алгеброй изображений В этом случае алгебра идеальных изображений расширяется до алгебры Если, например, Случай 1.1.4 (распознавание образов). Для заданного изображения Й требуется найти класс образов Пусть, например, алгебра В случае 1.1.3 мы расширили множество Случай 1.1.5 (описание изображения). При заданных алгебрах Если, например, алгебра Для получения хорошего описания изображения необходимо не только хорошо подобрать элементы разбиения, но и тщательно произвести выбор разбиения Способ осуществления этого выбора зависит от цели описания изображения. Один вариант связан с запоминанием данных, когда целью является сжатие данных. Другой вариант относится к передаче данных, когда при определении существенных с точки зрения задачи кодирования обстоятельств следует учитывать также и канал связи. Случай 1.1.6 (вывод и абдукция образов). При заданных элементах алгебры Когда обрабатываются структуры образов в целом, а не просто отдельные изображения, процессор образов представляет собой иногда сложную систему, которая сама по себе обладает структурами образов, как в гл. 6. Их связь с рассматриваемой теорией структуры имеет в этом случае решающее значение. Существуют и другие виды анализа образов, заслуживающие упоминания и встречающиеся в последующих главах. Может оказаться, что алгебра известна нам, за исключением некоторых деталей; при этом требуется определить структурные параметры алгебры изображений, например найти признаки образующих. Может возникнуть и необходимость определить вероятностные меры на множестве регулярных конфигураций и алгебре идеальных изображений Как бы то ни было, допустим что задана система образов и необходимо провести один из упоминавшихся выше видов анализа образов —как следует его выполнять? В столь общем виде этот вопрос оказывается почти бессмысленным и, лишь обратившись к конкретной и в определенной степени детализированной системе образов, можно приступать к выбору специфических методов решения, как и будет сделано в последующих главах. После того как мы рассмотрим некоторые случаи, станет очевидным, что основным препятствием можно считать наличие деформаций, уничтожающих информацию. Если бы нам приходилось иметь дело только с алгеброй идеальных изображений, некоторые задачи анализа были бы сняты, например восстановление изображения, а остальные оказались бы несложными (по крайней мере, в принципе). Обратимся, скажем, к распознаванию рукописного текста. Этой задаче уделялось много внимания, однако полученные результаты не очень впечатляют. Если бы мы имели дело лишь со стилизованным письмом, скажем с написанными раздельно символами специального алфавита, то процесс распознавания действительно можно было бы организовать алгоритмически. В этой связи следует отметить основополагающую работу Идена (1961). Если же, с другой стороны, текст не расчленен и допускаются индивидуальные вариации почерка, то приемлемое решение задачи распознавания кажется все еще отдаленным, несмотря на все предпринимавшиеся попытки. Можно было бы привести другие примеры. Аналогичное положение наблюдается в области автоматического распознавания речи (см., например, монографию Фланагана (1972)). Многократно было продемонстрировано, что можно синтезировать речь, обеспечивая ее высокое качество. Обратная задача настолько труднее, что специалисты в этой области высказывались пессимистически относительно возможностей получения реальных решений для реальной речевой среды. И снова причина, по-видимому, заключается в чудовищной изменчивости и сложных взаимозависимостях, порожденных соответствующими механизмами деформации. Мы знаем, что в обоих этих случаях распознавания можно добиться, поскольку мы, будучи людьми, постоянно проводим такое распознавание, хотя нам в точности не известно, как мы это делаем. Учитывая возмущающее влияние деформаций, заманчиво организовать анализ образов в два этапа. В первую очередь следует попробовать скомпенсировать влияние деформаций Литература, посвященная распознаванию образов, изобилует описаниями подобных попыток. Часто процедура очищения заимствуется из теории связи или традиционных методов статистического вывода и модифицируется применительно к особенностям решаемой задачи. Иногда при модификации предпринимается попытка учесть наиболее общие и качественные свойства образов. На этом пути были получены полезные результаты, особенно в тех случаях, когда изменчивость деформаций ограничена. Успешность подобного подхода зависит от выбора способа предварительной обработки. Частные методы выбора могут оказаться полезными, однако мы считаем, что в принципе при проведении анализа образов должна использоваться структура образа в целом и этот анализ должен основываться непосредственно на соответствующей цепи синтеза образов, включая деформации С другой строны, необходимо принимать во внимание вычислительные ограничения и стремиться к построению алгоритмов, которые действительно могут быть реализованы при разумных затратах вычислительных ресурсов. В практическом отношении наша ситуация несколько напоминает положение, сложившееся в теории информации. Общие теоремы теории информации не всегда указывают такие оптимальные схемы кодирования, которые можно бы было практически использовать. Они определяют, однако, нижние грани, указывающие теоретически достижимое, и это помогает при оценке качества конкретных кодов. Точно так же в анализе образов результаты, связанные с оптимальностью, могут не иметь непосредственного применения, но они помогают нам при разработке хороших, если не оптимальных, процедур анализа и указывают, сколь далеки мы от теоретически возможного оптимума. Итак, при рассмотрении в последующих главах каждой задачи анализа образов мы будем начинать с определения полной цепи синтеза, основываясь либо на результатах, полученных в первом томе, либо вводя аналогичными способами новые структуры образов. При таком подходе нам не всегда удается определить структуру образов во всех подробностях. Скорее наоборот — часто мы будем вынуждены примириться с тем, что некоторые характеристики образа невозможно полностью определить априори. Подобное отсутствие полной определенности часто возникает на последнем этапе в связи с деформациями где обычно мы сталкиваемся с параметрами, которые априори не известны и должны устанавливаться эмпирически. Не так часто, но и не как исключение при анализе возникает ситуация, когда "неполна информация, характеризующая другие этапы анализа. Упомянем лишь в качестве примера случай, когда мы постулируем только вид, но не параметры функции Резюмируя, мы будем стараться определить синтез изучаемого образа настолько полно, насколько это допускает ситуация, с тем, чтобы обеспечить максимально возможную глубину и эффективность анализа.
|
1 |
Оглавление
|