14. Классификация образов
Методы, которые до сих пор обсуждались в этой книге, относятся к области анализа изображений или раннего видения (первичной обработки зрительной информации), т. е. к обработке самих изображений с целью выделения полезных данных. Полученную таким образом информацию можно представить в виде схемы, иными словами, подробного символического описания того, что есть на изображении. В даль-. нейшем мы будем заниматься анализом представленных сцен, т. е. выяснять, как можно работать с такой детальной информацией. В этой главе будет рассматриваться одно из простейших применений анализа сцен, а именно классификация объектов, основанная на количественных характеристиках изображений.
Одной из задач, которую должна выполнять система машинного видения, является распознавание. После оценки различных свойств объекта, например отражательной способности поверхности или цвета, система должна располагать некоторой схемой, на основании которой объект будет отнесен к одному из известных классов. Классификация образов обеспечивает средства для решения этой задачи. Основной идеей является выделение характеристик или признаков, т. е. величин, которые могут оказаться полезными при различении элементов различных классов. Значения отдельных признаков затем объединяются и образуют вектор признаков. Таким образом, информация, полученная на основе изображения объекта, используется для идентификации точки в некотором многомерном пространстве. В этой главе обсуждаются некоторые методы разделения этого пространства на области, соответствующие различным классам. Неизвестный объект относится к классу, метка которого приписана области, в которую попал вектор признаков. Вводится предположение, что векторы признаков элементов различных классов обладают тенденцией образовывать самостоятельные кластеры.
Рассматривается также возможность формирования этих кластеров, основанная на моделях распределения вероятностей. В заключение подчеркнем, что эффективность метода классификации в значительной степени зависит от точности измерения признаков.
14.1. Предварительный пример
Основная концепция классификации образов заключается в измерении значений признаков объектов, которые мы хотим классифицировать, и использовании их для определения принадлежности объекта тому или иному классу. Если, например, все кошки весят меньше 10 кг, а все собаки больше, то можно использовать эту информацию для классификации животных. На этом примере хорошо видны как преимущества, так и недостатки такого подхода к классификации образов. Поскольку некоторые кошки весят больше 10 кг, а многие собаки меньше, наш критерий классификации не является совершенным. Будучи простым, данный метод не является вполне надежным. Различные усовершенствования приводят к лучшим, но более сложным методам.
Рассматривая дальше наш простой пример, мы можем сначала попытаться более точно выбрать весовой порог. Чтобы сделать это хорошо, мы должны получить статистическую информацию о распределении весов кошек и собак. Обращаясь к распределению вероятностей веса, можно надеяться на выделение значения, которое обеспечивает лучшее разделение. Нам могло бы помочь также знание того, как часто в наших опытах мы ждем появления кошек и собак.
Здесь мы можем совершить два рода ошибок: кошка может классифицироваться как собака, и наоборот. Хорошим порогом может считаться порог, минимизирующий число ожидаемых ошибок. Как правило, с каждым решением о классификации связано некоторое действие, и можно воспользоваться этими действиями, чтобы приписать каждой ошибке ее стоимость. Затем можно выбрать порог таким образом, чтобы минимизировать стоимость ошибок, вместо того чтобы просто минизировать общее число ожидаемых ошибок.