Главная > Справочник по прикладной статистике. Том 2
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

17.10. ОРТОГОНАЛЬНЫЙ ПРОКРУСТОВ АНАЛИЗ

В предыдущих разделах рассматривалась проблема поиска расстояний аппроксимирующих наблюдения путем оптимизации критерия качества отображения, подобного используемому при шкалировании по методу наименьших квадратов. При таком критерии предполагается сравнение аппроксимирующего множества координат X и множества координат (если таковое существует), порождающих наблюдаемые расстояния. Проблема сравнения двух матриц X и где строки соответствуют одним и тем же выборкам или совокупностям, достаточно общая. Например, X и могут быть результатами двух разных ординаций для одних и тех же данных или же результатами применения одного метода ординации к двум множествам данных, относящимся к одним и тем же объектам. Как произвести такое сравнение? Обозначим через расстояния, порожденные координатами X и Ясно, что — подходящие критерии для сравнения двух множеств. Они инвариантны относительно переносов и ортогональных преобразований конфигураций X и что, очевидно, является необходимым условием для любого разумного критерия. Почти отсутствуют данные о том, какие значения означают хорошее и какие плохое приближение, хотя могут представлять интерес относительные величины Имеет смысл нарисовать график, отложив по одной оси а по другой — Линейное соотношение означает хорошую согласованность двух конфигураций. По криволинейному соотношению можно выделить участки, где расстояния в одной из конфигураций увеличены или, наоборот, уменьшены по сравнению с другой.

Другой вариант — соотнести координаты, задаваемые матрицами X и с их главными осями. Такая возможность должна быть предусмотрена во всех вычислительных программах, реализующих ординации, поскольку это облегчает сравнение -мерной и -мерной ординаций. Без поворота к главным осям ось -мерного представления не может быть соотнесена с осью -мерного представления, и тогда трудно оценить эффект добавления или исключения одной оси. Например, если исключенная ось вносила существенный вклад в качество отображения, то этот эффект мог быть за счет одной или двух точек, что легко обнаружить на главных компонентах.

В крайнем случае X и могут быть двумя представлениями одной и той же конфигурации и может казаться, что они никак не соотносятся друг с другом. Тогда естествен вопрос: можно ли подобрать такие оси и такое начало координат для конфигурации X, чтобы она совпадала или была похожа на Для этого необходимы ортогональная матрица Н (соответствующая поворотам осей и отражению) и вектор-строка (соответствующая переносу начала координат), такие, что аппроксимирует Критерий для измерения степени соответствия должен быть инвариантен относительно совместных поворотов и переносов двух конфигураций. В этом смысле удобно использовать комбинацию расстояний из конфигураций и Критерий в виде суммы квадратов соответствует нашим целям и приводит к алгебраическим вычислениям. Итак, мы хотим отыскать Н и минимизирующие

Без потери общности можно предположить, что центры тяжести конфигураций X и совпадают с началом координат. Тогда

и возможно разделение эффектов переноса и вращения. При переносе минимизируется при условии для всех осей, т. е. перенос осуществляется таким образом, чтобы обеспечить совпадение центров тяжести для конфигураций X и в данном случае в начале координат. Минимизация по Н эквивалентна максимизации Записав разложение по сингулярным значениям получим

— ортогональная матрица. Следовательно,

где ненулевые сингулярные значения положительны .

Верхняя граница достигается при для всех когда — ортогональная матрица, соответствующая которая задает необходимое преобразование. Остаточная сумма квадратов

Ранее ничего не говорилось о размерности (количестве столбцов) матриц X и но неявно предполагалось, что и V ортогональны и коммутативны. Это соответствует предположению, что квадратная, а следовательно, X и содержат одинаковое количество столбцов. Если в действительности это не так, то к меньшей матрице можно добавить нулевые столбцы, чтобы вращение Н производилось в пространстве более высокой размерности. В этом случае некоторые сингулярные значения у обратятся в нуль, и соответствующие значения потеряют смысл. Найденное решение оптимально, но не единственно. Другие оптимальные решения соответствуют произвольным поворотам в пространстве, ортогональном меньшему пространству. В разделе 17.11 обсуждается проблема подгонки X и для случая, когда меньшей размерности, чем X.

Задачу минимизации называют ортогональной прокрустовой задачей. Герой греческой мифологии Прокруст, владелец гостиницы, подгонял рост постояльцев под свою постель, вытягивая или обрубая им конечности. Здесь мы подгоняем X к Преимущество подхода в том, что полученная после поворота и переноса конфигурации может быть изображена вместе с Если конфигурации совпадают, то два множества точек должны совпадать, и обратно: позиции пар похожих точек относительно друг друга указывают на согласованность или на расхождения между двумя ординациями или двумя решениями многомерного шкалирования.

Следует иметь в виду, что одна из двух конфигураций X или может быть по размеру больше, чем другая. Наиболее простой способ для преодоления этого затруднения — нормализовать X и так, чтобы Или можно подобрать масштабный множитель, минимизируя

Н оценивается так же, как и в предыдущем случае, и простое дифференцирование приводит к оценке для величины

Суммы квадратов связаны соотношением

откуда видно, что скорректированная сумма квадратов для координат равна скорректированной сумме квадратов для аппроксимирующих значений плюс остаточная сумма квадратов. Это может быть положено в основу ортогонального разложения в дисперсионном анализе.

Поскольку инвариантна относительно совместных вращений X и то повернув X с использованием матрицы Н так, чтобы она аппроксимировала можно применить обратное преобразование к обеим конфигурациям. Тогда X восстанавливается в первоначальное состояние, преобразуется в Если Н приводит матрицу X в оптимальное соответствие с матрицей то приводит матрицу в оптимальное соответствие с матрицей X, и в обоих случаях принимает одно и то же значение, скажем, Тогда симметричны:

Очевидно, что (идеальное приближение) и, легко показать, что удовлетворяет метрическому неравенству, т. е. для любых трех конфигураций и Хотя удовлетворяет метрической аксиоматике, можно показать, что в общем случае эта метрика не является евклидовой, за исключением специальных наборов данных.

Если введен параметр то перестает быть справедливым равенство и тогда не удовлетворяет метрической аксиоматике. Такая асимметрия очень неудобна, и один из путей ее преодоления рассматривается в разделе 17.12 как специальный случай общего прокрустова анализа.

Обычная цель прокрустова анализа — изучить соотношения между двумя конфигурациями. Иногда большее внимание уделяется значению критерия Один из таких случаев описан в разделе 17.12. Э. Дейвис [см. Davies (1978)] предложил асимптотическое среднее и дисперсию этого критерия для случая, когда — множества расстояний Махаланобиса, основанных на порождающих мультинормальных распределениях. Р. Сибсон [см. Sibson (1979)] исследовал робастность классических методов шкалирования; он налагал возмущения на квадраты расстояний вычисленных между точками в -мерной конфигурации , используя классические методы шкалирования для обработки новых значений получал конфигурацию X в -мерном пространстве. Эти две конфигурации можно сравнивать с помощью прокрустова анализа, который дает:

где собственный вектор, собственное значение матрицы введенной в разделе 17.6. Суммирование производится по всем различающимся парам . Если отсутствует член, линейный по , то это означает, что классическое шкалирование — достаточно робастный метод.

1
Оглавление
email@scask.ru