Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
8.5. Как важно быть умнымВсегда разумно стремиться к тому, чтобы стать умнее, даже если такое пожелание, выраженное в виде совета, и расстраивает собеседника. В наших экспериментах мы оказались в дураках потому, что наша программа была в некотором смысле умнее нас, когда мы определяли признаки. На самом деле для того чтобы решать многие практические задачи устройством распознавания образов, следует стремиться не к универсальным методам, а к методам, локально сильным, но и весьма специализированным, подходящим для решения имеющейся конкретной проблемы. Это утверждение прекрасно иллюстрируется процедурой Ледли (1964), в которой методы грамматической классификации образов применяются для анализа хромосом. Основные признаки были выбраны им на основе способов, которыми хромосомы разделяются; не было и попытки заставить машину породить эти признаки. Человек, решающий реальную задачу, крайне заинтересован в том, чтобы при поиске решения использовать всю информацию, которой он располагает. При обсуждении того, какие признаки должны быть использованы для решения конкретной задачи классификации, естественно считать целесообразными признаки, представляющие собой компоненты описания объекта, например интерпретировать человека как совокупность рук, ног и других частей тела, а буквы как совокупности дуг и отрезков. В ряде случаев, как показал анализ, это не тот способ, который можно рекомендовать. Могут существовать признаки весьма полезные для классификации, но никак не связывающиеся к компонентами описания. Для нахождения таких признаков нельзя дать никаких общих правил. Но так как рассматриваемый метод оказался весьма эффективным, приведем три примера его применения. В первом примере для классификации цифр применяется метод „пробного вектора», который нашел широкое применение при разработке оптических систем распознавания знаков. Задача состоит в распознавании заранее отцентрированной на зрительном поле цифры. Способ, которым она решается, заключается в построении множества “пробных векторов", т. е. отрезков на поле, где находится изображение (рис. 8.9, а). Каждый из векторов можно рассматривать как признак. Когда реальная фигура, например цифра „2“, будет проектироваться на это множество (рис. 8.9, б), она пересечет различные пробные векторы. В наших предыдущих обозначениях пересечение фигурой определенных пробных векторов соответствует наличию определенного признака. Различные цифры приводят к различным картинам пересечений, которые, таким образом, формируют основу для последующего распознавания.
Рис. 8.9. Метод пробных векторов для распознавания знаков: а — пробные векторы; б — цифра 2, наложенная на пробные векторы. Бонгард (1970) предлагает еще более впечатляющий способ выделения признаков в необычной задаче распознавания образов. Рассмотрим две таблицы (рис. 8.10), строки которых получены по двум математическим формулам. Таблица I образована функцией
Рис. 8.10. Таблицы функций, предназначенные для распознаваний: (I): Если заданы несколько таких таблиц, можно ли написать программу, которая, изучив все таблицы, относящиеся к заданной функции, выделила бы характерное описание, с помощью которого можно было бы соотнести новые таблицы с определяющей их функцией? Предполагается, что на всех этапах работы программе не сообщается в явной форме вид соответствующей функции. Бонгард дает описание программы, названной АРИФМЕТИКА, которая обладает требуемыми свойствами. На нас особое впечатление произвела процедура выделения признаков, поэтому обсудим ее подробнее. Выделение признаков в программе АРИФМЕТИКА осуществляется в три этапа. На первом генерируется определенное число арифметических признаков. Каждый арифметический признак связывает два из трех табличных элементов На следующем этапе логические переменные объединяются в пары. Правило объединения выбирается из десяти возможных логических операций, применимых к двум переменным. Иначе говоря, правилом объединения может быть
И снова полученный признак Программе АРИФМЕТИКА задаются таблицы, связанные с различными (но неизвестными) функциями. Соответствующие табличные признаки программа исследует новое множество таблиц, порожденных теми же функциями, и пытается определить, с какой из таблиц, использованных на этапе обучения, должна быть сопоставлена каждая из новых таблиц. Решение осуществляется простым алгоритмом группирования, основанном на близости образов Судя по всему, результаты Бонгарда означают, что тесты на выбор из многих альтернатив не подходят для измерения степени интеллектуальности машины. Безусловно, это лишь применение распознавания образов к необычной ситуации. В качестве последней иллюстрации полезного и неочевидного анализа признаков рассмотрим метод обработки двумерных изображений, при котором изображения трактуются как математические объекты. Черно-белое изображение можно определить „функцией зачерненности" Для начала рассмотрим функцию одного аргумента
Ясно, что этот ряд можно приблизить суммой конечного числа членов. На рис. 8.11 изображена сложная функция, равная сумме взвешенных гармоник. Как можно было бы решить задачу распознавания образов, включающую классификацию таких сложных форм, как кривая А на рис. 8.11? Один из путей — описать каждое такое изображение вектором Рис. 8.11. (см. скан) Пример декомпозиции функции А. Кривая А получена как взвешенная сумма гармоник 1—4. Чтобы применить этот метод в распознавании изображений, рассмотрим сначала простое изображение, состоящее из последовательности одинаково затененных вертикальных полос. Такое изображение можно было бы считать взвешенной суммой решеток с различными частотами смены белых и черных вертикальных полос (рис. 8.12). Аналогично изображение, состоящее из одинаковых (кликните для просмотра скана) горизонтальных затенений, можно было бы считать суммой горизонтальных полос. В таком изображении степень зачерненности была бы функцией только горизонтальной или только вертикальной координаты
Рис. 8.13. Решетка, определяемая вкладом ненулевой компоненты, соответствующей паре Ограничение на степень разрешения вылилось бы в ограничение на частоты решеток, использованных для этого построения. Высокие частоты и, таким образом, частые тонкие линии привели бы к очень мелкой мозаике. Однако для определения большинства изображений одних блоков недостаточно, поскольку край предмета может расположиться по диагонали. Выражаясь весьма приближенно, диагонали соответствуют отношениям между частотами по направлениям х и у. Иными словами, если
Рис. 8.14. Изображения, полученные (а) квантованием изображения, имевшего высокое разрешение, и (б) последующей фильтрацией высоких частот, что приводит к сглаживанию краев. (Взято из статьи Хармона и Юлеша (1973).) анализа состоит в том, что любое изображение (т. е. функцию зачерненности На первый взгляд разбиение изображения на его компоненты Фурье может показаться операцией, которая, будучи математически оправданной, все же не слишком приспособлена для представления информации, содержащейся в изображении. Однако некоторые удивительные результаты, полученные при исследовании сенсорного восприятия, свидетельствуют, что это не так. Оказывается, что зрительная система млекопитающих осуществляет что-то вроде гармонического анализа образа на сетчатке глаза и применяет его для упорядочения воспринимаемого видимого мира. Можно привести несколько доводов в пользу подобного предположения. Хармон и Юлеш (1973) выполнили необычайно интересный эксперимент, посвященный этому вопросу. Они разбили на блоки фотографию с высоким разрешением портрета Авраама Линкольна, приписали всем точкам каждого блока значения средней зачерненности блока. Получилось изображение, показанное на рис. 8.14, а. Следствием такого квантования изображения было введение высокочастотных „шумовых" компонент, связанных с границами между блоками. Хармон и Юлеш затем получили второе изображение, отфильтровывая из блочного изображения почти все частоты, более высокие, чем те, которые могли бы поступить из оригинальной фотографии в блочную. (Размер блоков определяет верхний предел частоты, которая может быть передана из оригинала в блочное изображение.) Результат восстановления показан на рис. 8.14, б; он представляет собой легко узнаваемый портрет Авраама Линкольна. Проведенный экскурс в психологию сенсорного восприятия иллюстрирует важный момент машинного распознавания образов. От системы выделения признаков, используемой в устройстве распознавания образов, не требуется сохранять информацию, содержащуюся в изображении, в том виде, в каком она воспринимается человеком. На самом деле и человеческая зрительная система, очевидно, этого не делает. Хорошая система выделения признаков сохраняет информацию, достаточную для восстановления классифицируемых объектов на уровне деталей, необходимых для классификации. Более того, она предоставляет эту информацию алгоритму распознавания образов в виде, удобном для него.
|
1 |
Оглавление
|