Главная > Прикладные методы анализа данных и знаний
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

§ 2. Алгоритмы таксономии класса FOREL

Самый известный критерий  состоит в том, что в один таксон должны собираться объекты, похожие, близкие по своим характеристикам. Но термины похожесть, близость можно понимать по-разному, и в зависимости от того, какой их вариант мы выберем, получится тот или иной вариант таксономии. Остановимся вначале на разновидности меры «похожести» в виде «похожести на центр».

Оговоримся, что здесь мы рассматриваем случай таксономии объектов, признаки которых измерены в сильных шкалах, что позволяет оценивать похожесть через евклидово расстояние между точками в многомерном пространстве. Как поступать в случае с разнотипными признаками, мы обсудим позже.

Если координаты центра -го таксона обозначить символом , то сумма расстояний  между центром и всеми  точками  этого таксона , где , а сумма таких внутренних расстояний для всех  таксонов , . Смысл критерия похожести на центр состоит в том, что нужно найти такое разбиение  объектов на  таксонов, чтобы приведенная выше величина  была минимальной. Выполнение этого условия можно достичь с помощью алгоритма FOREL [53,82]. Опишем базовую версию и некоторые модификации этого алгоритма.

 

Categories

1
Оглавление
email@scask.ru