Глава 3. КЛАССИФИКАЦИЯ ОБРАЗОВ С ПОМОЩЬЮ ФУНКЦИЙ РАССТОЯНИЯ
3.1. ВВЕДЕНИЕ
В этой главе мы приступаем к изучению систем классификации образов, опираясь на один из простейших и наиболее эвристических подходов — использование для классификации образов функций расстояния. Выбор функций расстояния в качестве инструмента классификации является естественным следствием того обстоятельства, что наиболее очевидный способ введения меры сходства для векторов образов, интерпретируемых нами также как точки в евклидовом пространстве, — определение их близости. В частности, изучая рис. 3.1, можно прийти к интуитивному выводу о принадлежности вектора
классу
исключительно из тех соображений, что этот вектор находится ближе к векторам образов класса
Рис. 3.1. Образы, поддающиеся классификации с помощью понятия близости.
Можно рассчитывать на получение удовлетворительных практических результатов при классификации образов с помощью функций расстояния только в тех случаях, когда классы образов обнаруживают тенденцию к проявлению кластеризационных свойств. Это обстоятельство можно оценить, сопоставив рис. 3.1 и 3.2. Изучение первого рисунка показывает, что отнесение образа
к классу
не вызовет сомнений в связи с его близостью к этому классу, как уже отмечалось выше. Что касается ситуации, представленной на рис. 3.2, то довольно трудно найти основание для зачисления образа
в один из классов, исходя из
оценки его близости образам соответствующего класса, хотя классы и не пересекаются.
Рис. 3.2. Образы, классификация которых с помощью понятия близости вызывает затруднения.
В следующих параграфах этим идеям придается общая форма и они развиваются на уровне соответствующей математической строгости. Поскольку близость классифицируемого образа к образам некоторого класса будет использоваться в качестве критерия для его классификации, назовем такой подход классификацией образов по критерию минимума расстояния. Так как кластеризационные свойства весьма существенно влияют на работу классификаторов, основанных на концепции расстояния, в настоящей главе будет предложено несколько алгоритмов отыскания кластеров.