Главная > Многомерный дисперсионный анализ
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

10.5. ШКАЛИРОВАНИЕ ОРДИНАЛЬНЫХ ДИСКРЕТНЫХ И НЕПРЕРЫВНЫХ ПРИЗНАКОВ

Весьма часто на практике встречаются непрерывные признаки, их шкалы измерения не соответствуют методике многомерного линейного анализа. В некоторых задачах существенны уже очень малые различия между значениями признака (результатами измерения), в других же и большая разница не важна. С помощью обсуждаемого здесь метода шкалирования подобные расхождения устраняются. Благодаря шкалированию уменьшается и роль отдельных ошибок (промахов) при измерении, поскольку они немногочисленны.

Основная проблема данного раздела — приближенное определение кривой распределения, соответствующей отдельной группе. Предположим, что из каждой группы взята случайная выборка; для каждого ее индивида указано действительное значение признака Шкалирование строится таким образом, чтобы расстояния на шкале х не оказывали влияния «а результат, равно как и различия, устранимые с помощью монотонного преобразования этой шкалы.

Результат шкалирования зависит исключительно от отношения порядка между значениями х, соответствующих отдельным классам.

Для простоты предположим вначале, что все заданные значения х отличны одно от другого. Пусть расположенные в порядке возрастания результаты измерений. Для каждого определим коэффициент принадлежности к отдельным группам

Поскольку здесь речь идет о непрерывных признаках, коэффициент принадлежности значения может зависеть не только от этого значения, но и от всех значений из его окрестности, так сказать, «окно», через которое мы видим часть шкалы х (рис. 13). «Окно» точки должно наряду с содержать также подходящее выбранное натуральное число) ближайших меньших и ближайших больших чисел. Теперь можно определить коэффициент принадлежности по фюрмуле

Определенные трудности возникают, правда, на нижней и верхней границах х последовательности, так как там не существует окна в обычном понимании.

В конце концов мы определяем коэффициент принадлежности для всех так, чтобы выполнялись условия:

и

где объем выборки из группы После этого в разделах 10.1-10.4 матрицу можно использовать вместо матрицы в качестве исходного пункта процедуры шкалирования.

После этих вводных замечаний рассмотрим задачу шкалирования в полном объеме, допуская также повторения в совокупности чений. Пусть последовательность измеренных значений расположенных в порядке возрастания, т. е. при

Рис. 13. «Окно» для определения коэффициентов принадлежности точки к отдельным группам

Коэффициент принадлежности получается поэтапно. Пусть -матрица с элементами

матрица той же размерности. Элемент матрицы определяется как арифметическое среднее всех значений для которых значения признака х равны Если все измеренные -значения различны, то Далее определяем усредненные коэффициенты принадлежности нижнего и верхнего края -последовательности. Если ширина окна снова устанавливается с помощью то для нижнего края полагаем

а для верхнего соответственно

Пусть с элементами

при при -матрица коэффициентов принадлежности получается теперь из так же, как из это значит, что арифметическое среднее всех значений если им соответствуют как значение измерения. Матрица удовлетворяет условиям (10.32) и (10.33). Она лежит в основе шкалирования, подобно тому как в предыдущих разделах матрица Если хотят исключить влияние различия в объемах выборок то при шкалировании вместо матрицы используют матрицу с элементами

Число определяющее ширину окна, при проведении дискриминантного анализа мы большей частью определяем по формуле

Этим выбором мы добиваемся того, что истинные плотности распределений отдельных групп с ростом объема выборки восстанавливаются все более точно.

Пример. Проведем шкалирование ординальных дискретных, соответственно непрерывных, признаков по данным примера из раздела 6.2.1 (желтуха у новорожденных). Для признака «показания интерометра» имеем следующие значения:

(см. скан)

При вычислении мы исключили влияние различных объемов выборок и используя вместо матрицы матрицы Для мы выбрали значение 15 согласно (10.35).

1
Оглавление
email@scask.ru