Главная > Справочник по прикладной статистике. Том 2
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

Глава 17. МНОГОМЕРНЫЙ АНАЛИЗ: ОРДИНАЦИЯ, МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ И СМЕЖНЫЕ ВОПРОСЫ

17.1. ВВЕДЕНИЕ

В многомерном анализе под ординацией понимают метод, представляющий элементы многомерных выборок точками в геометрическом пространстве, обычно евклидовом. При этом исследователь надеется, что беспорядочный массив чисел будет заменен на некоторый (менее беспорядочный) разброс точек, выявляющий интересующую его структуру в виде кластеров, коллинеарностей, трендов или обнаруживающий другие характерные свойства выборки. Поскольку визуально трудно распознать структуру в многомерном пространстве, основное внимание уделяется методам, предназначенным для получения интерпретируемого отображения рассеяния данных в пространстве двух или трех измерений. На диаграмме такого рода близкие точки обычно соответствуют похожим отображаемым ими объектам, а далекие — очень непохожим. Таким образом, расстояние — основное понятие, подлежащее интерпретации в большинстве ординаций, но существуют другие виды представлений, и они будут рассмотрены в разделе 17.13.

Термин «ординация» пришел из экологии, где различные экологические сообщества растений пытались представить точками на прямой. Это — одномерная ординация, или упорядочение. Вскоре обнаружилось, что одномерного представления часто недостаточно для адекватного отображения, поэтому сочли допустимым использование двух или большего количества измерений. При этом термин «ординация» (т. е. упорядочение), конечно, потерял свой истинный смысл. Подобная же ситуация связана с термином «многомерное шкалирование».

Долгое время усилия психологов были сосредоточены на представлении интенсивности косвенно наблюдаемых стимулов точками на шкале, аналогичной шкале обычных физических измерений. Это снова привело к одномерной конфигурации, а для адекватного представления оказалось необходимым использовать дополнительные измерения, что привело к понятию многомерное шкалирование, которое в настоящее время широко применяется статистиками и специалистами по анализу данных. Таким образом, «ординация» и «многомерное шкалирование» — синонимы, заимствованные из разных научных областей, и для них нет нейтрального статистического термина.

Простейший вид ординации — двумерная диаграмма рассеяния, на которой сопоставляются две переменные (например, высота и вес), каждая точка представляет одно наблюдение из выборки. Цель построения таких диаграмм, как и более сложных ординаций, — обнаружить определенные свойства данных. Они также могут быть использованы для обнаружения выделяющихся точек, что может рассматриваться как отклонения от закономерности. Диаграммам рассеяния присущ, в определенной мере, основной недостаток многих методов ординации — зависимость от масштаба. Измерение высоты в дюймах и веса в фунтах приведет к одной диаграмме, а измерение высоты в сантиметрах и веса в килограммах — к другой. Этот дефект становится более серьезным для обобщенных ординаций, опирающихся на линейные комбинации значений переменных.

В случае, когда наблюдения выборки объема измерены в неспецифических единицах, наиболее общими формами стандартизации являются следующие:

где — стандартное отклонение. Заметим, что расстояние между наблюдениями инвариантно при мультипликативном преобразовании шкалы (например, дюймы в сантиметры), но не инвариантно при аддитивном преобразовании (например, фарингейты в градусы) или относительно комбинации аддитивного и мультипликативного преобразований. Расстояние инвариантно относительно обоих типов преобразований шкалы — аддитивной и мультипликативной. Эти соображения облегчают выбор типа стандартизации, но большая степень произвольности все же остается. Если все переменные многомерной выборки измерены на одной и той шкале, необходимость стандартизации менее очевидна, но вполне вероятно, что дисперсия для одних переменных значительно больше, чем для других, и целесообразно сгладить такое различие с помощью б).

Идея введения стандартной ошибки для нормировки возникает обычно у каждого, кто вынужден интерпретировать результаты ординации. Все оценивающие дисперсию совокупности, обычно легко интерпретируемы, но использование оценки по гетерогенной выборке, извлеченной из некоторой неизвестной смеси генеральных совокупностей, уже менее оправдано. Во многих ординациях значения х, переменной не могут рассматриваться как элемент случайной выборки или даже как реализация случайной переменной. Реалистичнее рассматривать их как полный перечень всех значений переменной в конечной совокупности, не связанный с какими-либо вероятностными соображениями. Например, в таксономии обычно интересуются ординацией конечного числа биологических видов, описанных набором характеристик. Отдельные представители видов могут также подлежать рассмотрению, по крайней мере по некоторым характеристикам. Это будет давать внутривидовой разброс. Могут представлять интерес ординации выборочных представителей отдельно для каждой из групп. Однако чаще сосредоточивают внимание на межвидовых различиях, для чего вычисляют средние или другие типичные показатели для переменных каждой группы. Иногда могут быть обнаружены качественные характеристики, не меняющиеся внутри группы, что идеально соответствует описанию различий между группами в терминах ординации.

Все изложенное выше привлекает внимание читателя к проблемам, связанным с ординацией групп. И внутригрупповая, и межгрупповая ординация являются важными, и определенный интерес представляет их комбинация [см. Gower and Digby (1980)]. Межгрупповую ординацию часто маскируют под внутригрупповую, возможно, потому, что внутригрупповой разброс либо неизвестен, либо не принимается во внимание как малозначащий.

1
Оглавление
email@scask.ru