Главная > Факторный анализ (Иберла К.)
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

8.6.2. Другие методы классификации

Из методов классификации многомерных наблюдений уже упоминался кластерный анализ (см. 8.4.1). Недостатком его является отсутствие статистического критерия значимости для проверки гипотезы, действительно ли точка принадлежит данной группе. Трудным и мало формализованным в задаче классификации без обучения является пункт, связанный с определением понятия однородности объектов. Применение коэффициента принадлежности (coefficient of belonging) или других метрик (или мер близости) только при благоприятных условиях приводит к однозначной группировке объектов. Такими же недостатками обладает анализ латентных структур. Возможности этого метода анализа полностью еще не выяснены. Его преимущество заключается в том, что он применим к альтернативным данным. Рао [230; 6] указал метод нахождения иерархии группировок при условии заданности самих группировок. Айм [152; 1, 2] систематизировал методы классификации. Он различал следующие подходы к решению задач классификации: использование модели факторного анализа, задание функции плотности распределения вероятностей генеральной совокупности, к которой принадлежит данная группировка, и приложение метода максимального правдоподобия. Четкие рекомендации, когда, какой подход и при каких данных использовать, пока не разработаны.

Шнелл [258; 1] исходит при решении задач классификации только из модели факторного анализа. Вначале все точки проецируются в -мерное пространство, которое натянуто на собственных векторов. Гипотеза о том, что вся информация при нахождении группировок содержится в пространстве размерностью не всегда подтверждается. Внутри -мерного пространства с помощью определенного алгоритма находят группировки, являющиеся пока еще предварительными оценками классов.

Затем к этим группировкам для решений задачи идентификации и окончательного разбиения объектов на классы применяется дискриминантная функция. Данная процедура повторяется до тех пор, пока группировки точек не будут изменяться по сравнению с предыдущим циклом итерации. Остается только показать, при каких условиях осуществляется быстрая сходимость данной итеративной процедуры. Речь при этом идет об интересной комбинации метода главных факторов, дискриминантного анализа и алгоритма нахождения группировок, который ждет еще своего практического опробования. Фабер [87] сравнительно недавно составил программу вычисления для ЭВМ. Интересный подход к решению задач классификации использовал Наус [211]. Он определял вероятность того, что по меньшей мере точек из имеющихся N попадает в прямоугольник со сторонами и и v. Из такого подхода может быть развита статистическая концепция при решении задачи образования группировок индивидуумов. Мак-Квайти [197; 1, 2, 3, 4, 5] занимался анализом группировок (typal analysis), исходя из коэффициентов корреляции рангов. Ему и принадлежит название метода. Насколько предлагаемый им метод дает однозначное решение, пока остается неизвестным. Не решен также вопрос статистического критерия проверки принадлежности точки к данной группировке. В работе Каттелла и Коултера [38] содержится дальнейшее развитие этого метода.

В области таксономии, например, бактерий имеется целый ряд работ, которые связаны с проблемой классификации. Обширная монография по таксономии с подробной библиографией написана Снитом и Сокалом [270]. Часто в качестве меры близости используется величина которая называется коэффициентом сходства (similarity ratio), где — число признаков, общих для двух бактерий или элементов; — число индивидуальных признаков, присущих только данному элементу. В данной книге приведен обширный список литературы, посвященной таксономии (Бирз и др. [16], Бирз и Локхарт [17], Колвелл и Листон [59], Ян [155], Лизенко и Снит [192], Роджерс и Танимото [239], Снит [268], Снит и Коуэн [269] и т. д.). Интересный пример применения классификации в области документалистики имеется в работе Бор ко [25].

Развитие методов классификации обусловлено развитием и внедрением вычислительной техники, так как реализация этих методов невозможна без быстродействующих ЭВМ. Но применение ЭВМ, в свою очередь, требует специальной разработки соответствующего математического обеспечения. Сегодня еще нельзя указать, какой метод классификации, при каких данных и при каких условиях следует предпочитать.

1
Оглавление
email@scask.ru