Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
ПАКЕТЫ СТАТИСТИЧЕСКИХ ПРОГРАММ, СОДЕРЖАЩИЕ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ МЕТОДОВ КЛАСТЕРИЗАЦИИВозможно, наиболее удобным и общедоступным программным обеспечением кластерного анализа являются подпрограммы, содержащиеся в таких пакетах статистических программ, как: BMDP (Dixon, 1983), SAS (SAS Institute, 1982), SPSS (SPSS, 1984). Концепции, заложенные в основу этих пакетов, хорошо известны. Они открывают непрограммистам сравнительно легкий доступ к сложным статистическим методам решения широкого круга исследовательских задач. Помогает пользователю и то, что в пакетах программ используется язык управления заданиями вычислительной системы, позволяющий с минимальными усилиями передавать вычислительной системе запросы пользователя. Эти пакеты программ содержат также разнообразные методы отбора и обработки данных, позволяющие сделать сложный анализ простым и выполнимым, рели же пакет программ содержит метод, представляющий интерес для пользователя, то преимущества применения уже существующих пакетов статистических программ становятся значительными. За исключением программы BMDP, число различных дополнительных программ кластеризации, содержащихся в большинстве статистических пакетов, очень мало. Например, ранняя версия SAS содержала только один метод кластеризации, a SPSS — ни одного. Однако такое положение существенно изменилось. Для BMDP были разработаны четыре процедуры кластерного анализа: 1) методы одиночной, полной и средней связей для группировки признаков; 2) методы средней связи (центроидная группировка), одиночной связи и к-ближайших соседей для группировки объектов; 3) блочный метод кластеризации (Hartigan, 1975) для одновременной группировки объектов и признаков; 4) итеративный метод -средних, образующий разбиения объектов. (Последняя процедура, BMDPKM, была использована в примере, иллюстрирующем применение методики повторных выборок; см. разд. IV.) Процедуры BMDP снабжены хорошими описаниями, имеют понятные распечатки и ими довольно легко пользоваться. Наиболее серьезными недостатками этого пакета программ являются небольшое число иерархических агломеративных методов кластеризации объектов и возможность выбора лишь четырех мер сходства (евклидово расстояние, метрика Минковского, расстояние хи-квадрат и -коэффициент). Во втором пакете статистических программ, SAS, до недавнего времени был лишь один метод кластерного анализа — метод полной связи. Однако в недавнюю версию этого пакета (SAS, 1982) включены существенные добавления, хотя, как ни странно, в нем уже нет метода полной связи. Пакет программ (в рамках процедуры CLUSTER) сейчас содержит метод центра тяжести, метод Уорда и иерархический агломеративный метод средней связи. Евклидово расстояние — все еще единственная используемая мера сходства. В процедуре FASTCLUS был добавлен метод к-средних (центроидный метод группировки Андерберга). И наконец, в пакет был включен факторный метод кластеризации признаков (процедура VARCLUS) В пакете было увеличено число диагностических программ, аналогичных имеющимся в пакете CLUSTAN. Значительный интерес представляет новая процедура остановки при определении числа кластеров — кубический критерий кластеризации. Эта процедура была добавлена в последнюю версию пакета программ, но авторы SAS не опубликовали никаких работ, которые могли бы продемонстрировать ее обоснованность или практичность в прикладных исследованиях. В программе SPSS в настоящее время нет ни одного метода кластерного анализа. Однако есть новая процедура CLUSTER (Bajaj, 1979), которая, возможно, будет включена в SPSS. Новая процедура содержит 27 мер сходства, большинство из них — коэффициенты ассоциативности. В пакете имеется семь иерархических агломеративных методов (включая методы одиночной, полной и средней связей и метод Уорда), которые может применять пользователь.
|
1 |
Оглавление
|