10.3.5. Исключение эффекта «цилиндра»
Эффект цилиндра, отмеченный в факторном типологическом анализе (см. гл. 6), может равным образом возникать в типологической регрессии, когда случайный выбор начального разбиения (или начальных разбиений) является «неудачным» (рис. 10.1).
Рис. 10.1
В этом случае
случайный выбор
не позволит распознать структуру в двух однородных классах совокупности. Речь, следовательно, идет о том, чтобы модифицировать алгоритм на уровне его первых итераций с тем, чтобы исключить эффект цилиндра.
Рис. 10.2
10.3.5.1. Эллипсоид случайного вектора
Пусть
— векторы размерности
элементы множества
Класс
представлен
реализациями вектора
размерности
Обозначим через
средний вектор и через
ковариационную матрицу этого класса.
матрица размера
и ранга
Определение 6. Если
то эллипсоидом
-мерного случайного вектора
называют множество
-мерных векторов
таких, что
положительная постоянная.
Если
то получают эллипсоид-индикатор.
Если
то существует ненулевой вектор и, такой, что
откуда
следовательно, по определению матрицы
Таким образом, вектор
принадлежит к векторному подпространству, ортогональному всем векторам и, таким, что
Это подпространство размерности
называют носителем
Пусть
матрица размера
ранга
с нормированными вектор-столбцами, такая, что уравнение
определяет этот носитель. Тогда
Определение 7. Если
то эллипсоидом вектора
называют множество векторов
таких, что
и удовлетворяющих условию
10.3.5.2. Модификации, вносимые в алгоритм
Определение 8. Множество элементов класса
лежащих внутри индикаторного эллипсоида, назовем индикаторной частью этого класса. Оно задается следующим образом:
Заметим, что
не является разбиением множества наблюдений
На первых итерациях алгоритма рекомендуется следующая его модификация:
разбиение индикаторные части
представительства индикаторных частей
разбиение