17.13. АНАЛИЗ АСИММЕТРИИ
Многие из рассмотренных методов могут применяться для анализа прямоугольных матриц. В разделе 17.3 обсуждаются мультипликативные модели, в разделе 17.5 — анализ соответствий, в разделе 17.9 — дистанционные модели многомерной развертки. Теперь мы коснемся проблем квадратных асимметричных таблиц. Здесь применимы методы анализа общих прямоугольных матриц, но для квадратных таблиц специальной структуры, где строки и столбцы классифицируются подобным образом, нужны новые модели. В таком случае строки и столбцы обычно соотносятся по сути с одними и теми же вещами, но отражают разные аспекты. Например, строки могут соответствовать местам иммиграции, а столбцы — тем же местам, но рассматриваемым как центры эмиграции. Мы можем интерпретировать строки как социальные классы отцов, а столбцы — как социальные классы сыновей. Для таких данных часто характерны как симметричные аспекты, так и отклонения от симметрии. Методы, о которых до сих пор шла речь, не позволяют различать эти два аспекта, и поэтому в анализе данных подобного типа они не столь эффективны. В настоящем разделе мы рассмотрим модели, включающие симметричную и асимметричную компоненты. Обозначим через
квадратную матрицу данных размерности
В модели Бекера, Юнга и Тейкена [см. Baker, Young, Takane (1977)] элемент матрицы
записывается в виде
Координаты, записанные в строках матрицы X размерности
порождают обычное евклидово представление. Величины
называемые весами, определяют асимметрию, поскольку веса для расстояний
различаются. На двумерном графике
веса
представляются в
точке направленными линиями соответствующей длины, ориентированными соответственно на восток/запад и север/ юг. Эта модель принадлежит тому же семейству, что и модель шкалирования индивидуальных различий из раздела 17.12.
Рассмотренная модель — модель дистанционного типа. Р. Харшман [см. Harshman (1972)] предложил асимметричную модель, основанную на векторных произведениях
где матрица
размерности
асимметричная, хотя матрица
симметрична. Конечно, ситуация сильно упрощается для малых
но это не является необходимым. Если матрицы X и
дают хорошее приближение, то эквивалентные решения существуют для произвольной ортогональной матрицы Н, при этом X заменяется на
на
Это открывает возможности применения методов факторного вращения для получения более простых и более интерпретируемых решений. Матрица X или результат ее вращения могут быть графически
представлены множеством из
точек. Такое представление передает симметричные аспекты матрицы
Поскольку в качестве данных выступают векторные произведения между элементами, интерпретация производится не в терминах расстояний, а в терминах углов между радиусами-векторами. Вариант модели Харшмана, где в качестве
выступает матрица с очень специальной структурой, изучался Чино. При
заменяется на
, где
кососимметричная матрица размерности
Обозначим два столбца матрицы X через
Тогда очевидно, что
т. е. имеет вид, эквивалентный первому члену в выражении, полученном по методу наименьших квадратов.
— кососимметричная матрица с
для
При
любая кососимметричная матрица третьего порядка имеет ранг 2. В действительности
, где
. Разбиение матрицы X на три столбца
и вычисление
приводят к очень специальной модели
которая анализируется как кососимметричная составляющая. В другой ситуации эти же векторы
анализируются как симметричная компонента. Аналогичные замечания относятся и к моделям более высокого порядка к. Модель такого типа описана в работе [Escoufier and Grorud (1980)].
В большинстве случаев удобнее иметь дело отдельно с симметричной и асимметричной компонентами. Это ведет к разбиению
где М — симметричная, а
кососимметричная. Нетрудно заметить, что
откуда следует, что общая сумма квадратов разбивается на независимые компоненты: симметричную и кососимметричную. Тогда появляется возможность раздельного анализа матриц М и
методом наименьших квадратов. Матрица М поддается анализу любым из методов, рассмотренных в предыдущих разделах, включая неметрические. Обычно нас интересуют аппроксимации матрицы
низкого ранга. Это как раз ситуация, в которой применяется теорема Экарта—Юнга. Здесь необходимо разложение матрицы
по сингулярным значениям. Для кососимметричных матриц оно имеет специальный
где
ортогональна,
откуда видно, что сингулярные значения образуют пары, и
Если
нечетное, то последний элемент Е равен нулю, а последний элемент
— единице.
Разложение по сингулярным значениям может быть записано в виде суммы
где
— наибольшее целое, не превышающее
столбец матрицы
Совпадение пар сингулярных значений означает, что аппроксимация нечетного ранга не единственна, допустимы только решения четного ранга. Сконцентрируем внимание на первом члене разложения
и чтобы освободиться от индексов, через и обозначим
а через
Тогда
что соответствует определенной выше кососимметричной компоненте Чино для
Существует много способов параметризации этого члена путем замены
любые два вектора
(не обязательно ортогональные) в той же плоскости. Все параметризации такого рода эквивалентны в том смысле, что они дают одну и ту же сумму квадратов
Иногда удобна параметризация, для которой
и вектор
ортогонален вектору а.
Значения
могут быть приняты в качестве координат
точек и графически представлены в пространстве двух измерений. Аппроксимация
показывает, что площадь треугольника, содержащего в качестве вершин начало координат,
точки, приблизительно пропорциональна
Кососимметричность получается за счет знака площади, который зависит от того, следуют ли вершины треугольника по часовой стрелке или против нее. Разные параметризации соответствуют разным парам осей, разным поворотам и разным относительным шкалам. Все это отражается на площади, в крайнем случае в виде постоянного множителя.
Представление в терминах площадей существенно отличается от обычной дистанционной интерпретации ординации. Например, две точки, лежащие на одной прямой с началом координат, дают нулевую площадь, даже если они сильно разнесены. В смысле расстояний точки, равноудаленные от заданной точки Р, образуют окружность с центром в Р. В смысле площадей точки, образующие с
треугольники постоянной площади, лежат на линии, параллельной
Площадь треугольника, построенного на векторах
пропорциональна
Эти особенности нужно иметь в виду при интерпретации диаграмм в терминах площадей.
Диаграммы в терминах площадей могут также использоваться как средство диагностики в том же качестве, что и диагностические двойственные графики [см. раздел 17.4]. Рассмотрим наиболее простую модель асимметрии
Можно предположить
поскольку значения
заданы с точностью до аддитивной константы. В матричной форме это записывается как
где
Если одна из координат постоянна, то график линеен. Линейный график соответствует простой кососимметричной форме
Этот простой вид асимметрии является важным, и имеет смысл отобразить значения а, на какой-либо ординации симметричной части М, при этом удобно соединить контуром близкие значения.
Мы обращаем внимание на раздельный анализ симметричной и кососимметричной компонент матрицы
Мы вовсе не отрицаем целесообразность попыток воссоединения этих двух частей и установления соотношений между параметрами в обеих частях. Это серьезная проблема, и она требует больших усилий. В настоящее время наблюдаются успехи в изучении эксплицитных моделей для матрицы
Аналитическими средствами получены некоторые соотношения и их геометрическая интерпретация. Для более детального ознакомления следует обратиться к работам [Gower (1977b)] и [Constantine and Gower (1981)].
17.14. ЛИТЕРАТУРА ДЛЯ ДАЛЬНЕЙШЕГО ЧТЕНИЯ
(см. скан)