ПАКЕТЫ ПРОГРАММ КЛАСТЕРНОГО АНАЛИЗА
С точки зрения серьезного исследователя, пакеты программ кластерного анализа обладают максимальной гибкостью и большими удобствами для пользователя. Они сочетают преимущества общих пакетов статистических программ (интегрированный язык управления, процедуры отбора и обработки данных) с чертами, представляющими особый интерес для пользователя кластерного анализа (разнообразие методов кластеризации, специальные диагностические программы и улучшенная графика).
Огромное значение имеет то, что многие из этих пакетов программ содержат малодоступные или даже уникальные методы кластеризации и аналитические процедуры, связанные со специальными задачами и структурами данных.
Наиболее известным из пакетов программ кластерного анализа является программа CLUSTAN. Новейшая редакция CLUSTAN (версия 2.1; Wishart, 1982) включает одиннадцать процедур, которые содержат все семейства методов кластеризации, определенные в разд.
за исключением вариантов факторного анализа. Это следующие процедуры:
HIERARCHY восемь иерархических агломеративных методов;CENTROID центроидный иерархический метод
RELOCATE итеративный метод
-средних
MODE модальный анализ
DENSITY улучшенный метод модального анализа
DIVIDE монотетический дивизимный метод
KDEND метод теории графов Джардайна и Сибсона
DNDRITE метод минимального покрывающего дерева
EUCLID итеративный метод, использующий нелинейное программирование
NORMIX метод разделения многомерных нормальных смесей
INVARIANT итеративный метод оптимизации многомерных индикаторов однородности кластеров Среди других особенностей этой программы — кластерная диагностика и средства проверки обоснованности решений, включающие процедуры RULES и COMPARE, в которых реализованы правила остановки Мойена (1977) и кофенетический коэффициент корреляции Мойена и Уишарта (1980). Процедура CORREL содержит в общей сложности 38 мер сходства, а пакет программ имеет вспомогательную процедуру, позволяющую пользователю определить коэффициент сходства любого вида (DEFINE). С помощью других вспомогательных программ можно управлять кластерной диагностикой или графическим выводом информации.
Есть еще три пакета программ, посвященных кластерному анализу: BCTRY (Tryon and Bailey, 1970), CLUS (Friedman and Rubin, 1967), NTSYS (Rohlf et al., 1974). Из этих трех пакетов NTSYS является наиболее важным, поскольку в него включены методы и идеи, обсуждавшиеся в книге по кластерному анализу и численной таксономии (iSneath and Sokal, 1973). Помимо кластерного анализа, пакет NTSYS содержит несколько многомерных статистических процедур, в том числе многомерное шкалирование и факторный анализ. Пакет программ BCTRY создан на основе книги (Tryon and Bailey, 1970) и включает ряд методов кластеризации, отражающих подход Трайона к факторному анализу.
Последний пакет программ CLUS в настоящее время используется редко, а заинтересованный читатель может найти современную версию этой программы в новейшей редакции CLUSTAN.