Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
10.5. ШКАЛИРОВАНИЕ ОРДИНАЛЬНЫХ ДИСКРЕТНЫХ И НЕПРЕРЫВНЫХ ПРИЗНАКОВВесьма часто на практике встречаются непрерывные признаки, их шкалы измерения не соответствуют методике многомерного линейного анализа. В некоторых задачах существенны уже очень малые различия между значениями признака (результатами измерения), в других же и большая разница не важна. С помощью обсуждаемого здесь метода шкалирования подобные расхождения устраняются. Благодаря шкалированию уменьшается и роль отдельных ошибок (промахов) при измерении, поскольку они немногочисленны. Основная проблема данного раздела — приближенное определение кривой распределения, соответствующей отдельной группе. Предположим, что из каждой группы взята случайная выборка; для каждого ее индивида указано действительное значение признака Шкалирование строится таким образом, чтобы расстояния на шкале х не оказывали влияния «а результат, равно как и различия, устранимые с помощью монотонного преобразования этой шкалы. Результат шкалирования зависит исключительно от отношения порядка между значениями х, соответствующих отдельным классам. Для простоты предположим вначале, что все заданные значения х отличны одно от другого. Пусть расположенные в порядке возрастания результаты измерений. Для каждого определим коэффициент принадлежности к отдельным группам Поскольку здесь речь идет о непрерывных признаках, коэффициент принадлежности значения может зависеть не только от этого значения, но и от всех значений из его окрестности, так сказать, «окно», через которое мы видим часть шкалы х (рис. 13). «Окно» точки должно наряду с содержать также подходящее выбранное натуральное число) ближайших меньших и ближайших больших чисел. Теперь можно определить коэффициент принадлежности по фюрмуле
Определенные трудности возникают, правда, на нижней и верхней границах х последовательности, так как там не существует окна в обычном понимании. В конце концов мы определяем коэффициент принадлежности для всех так, чтобы выполнялись условия:
и
где объем выборки из группы После этого в разделах 10.1-10.4 матрицу можно использовать вместо матрицы в качестве исходного пункта процедуры шкалирования. После этих вводных замечаний рассмотрим задачу шкалирования в полном объеме, допуская также повторения в совокупности чений. Пусть последовательность измеренных значений расположенных в порядке возрастания, т. е. при
Рис. 13. «Окно» для определения коэффициентов принадлежности точки к отдельным группам Коэффициент принадлежности получается поэтапно. Пусть -матрица с элементами
матрица той же размерности. Элемент матрицы определяется как арифметическое среднее всех значений для которых значения признака х равны Если все измеренные -значения различны, то Далее определяем усредненные коэффициенты принадлежности нижнего и верхнего края -последовательности. Если ширина окна снова устанавливается с помощью то для нижнего края полагаем
а для верхнего соответственно
Пусть с элементами
при при -матрица коэффициентов принадлежности получается теперь из так же, как из это значит, что арифметическое среднее всех значений если им соответствуют как значение измерения. Матрица удовлетворяет условиям (10.32) и (10.33). Она лежит в основе шкалирования, подобно тому как в предыдущих разделах матрица Если хотят исключить влияние различия в объемах выборок то при шкалировании вместо матрицы используют матрицу с элементами Число определяющее ширину окна, при проведении дискриминантного анализа мы большей частью определяем по формуле
Этим выбором мы добиваемся того, что истинные плотности распределений отдельных групп с ростом объема выборки восстанавливаются все более точно. Пример. Проведем шкалирование ординальных дискретных, соответственно непрерывных, признаков по данным примера из раздела 6.2.1 (желтуха у новорожденных). Для признака «показания интерометра» имеем следующие значения: (см. скан) При вычислении мы исключили влияние различных объемов выборок и используя вместо матрицы матрицы Для мы выбрали значение 15 согласно (10.35).
|
1 |
Оглавление
|