Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
10. ШКАЛИРОВАНИЕ ПРИЗНАКОВ КАК ПОДГОТОВИТЕЛЬНЫЙ ЭТАП МНОГОМЕРНОГО АНАЛИЗА (однофакторная классификация)Для многих признаков, которые должны быть исследованы с помощью дискриминантного или дисперсионного анализов, важное значение имеет выбор адекватной шкалы измерений, или шкалирования. Особенно важен и затруднителен этот выбор для качественных признаков (порядковых или номинальных). В этой главе излагается метод количественного выражения, или оцифровки, качественных признаков и шкалирования заново уже имеющихся количественных признаков. Он соответствует задаче многомерного исследования. Этот метод обладает следующими основными свойствами: а) Признак оцифруют так, что одномерный дистант б) Для двух любых распределений признака линейный дискриминантный анализ, проведенный после предварительного шкалирования, — наилучший среди всех способов разделения. в) Шкалирование можно реализовать с помощью простого вычислительного алгоритма. г) При шкалировании не возникает нормально распределенных переменных. Представленную здесь процедуру можно найти также в [47], [43], [42], а также в [33, гл. 33]. 10.1. СВЕДЕНИЕ ЗАДАЧИ ШКАЛИРОВАНИЯ К ПРОБЛЕМЕ СОБСТВЕННЫХ ЗНАЧЕНИЙРассмотрим номинальный признак который может принимать К различных значений (категории, состояния, уровни) и используется в многомерном анализе при разделении индивидов на Предположим, что ни одна из строчных или столбцовых сумм не равна нулю. При оцифровке категориям Взяв за основу матрицу частот
Здесь
Матрица А представляется в виде
причем
Квадратичные формы в числителе и знаменателе
где Другая предпосылка заключается в том, что не все строки матрицы Из этих предпосылок следует, что
Применяя теорему (2.66а), находим вектор у, или соответственно у, максимизирующий
удовлетворяет требованиям, сформулированным в теореме, а именно
Таким образом, приходим к проблеме собственных значений
С помощью простого преобразования из (10.9) получим
где
Используя (10.4) и теорему (2.64), получаем две эквивалентные задачи о собственных значениях
Порядок первой задачи совпадает с числом категорий К, второй — с числом групп
По формуле
Если желать, чтобы при последующем статистическом анализе оценки признака дали внутригрупповую дисперсию, равную 1, можно использовать соотношение
Поскольку согласно (10.10)
дисперсия этой оценки
Во многих практических случаях нормирование оценок играет второстепенную роль. При этом можно вместо матрицы частот Пример. (Профессор С. Ничков, Центральный институт сердечнососудистых заболеваний и регулирования кровообращения Академии наук ГДР.) Для диагностики артериальной гипертонии наряду со многими другими показателями используется рентгенограмма аорты. В табл. 9 представлено распределение 400 пациентов по степени тяжести заболевания от I до IV. Наилучшую оцифровку трех категорий: «норма», «расширение сосудов» и «склероз сосудов» (с дисперсией 1) — получаем при числовых значениях (2.41; —1,57; —2,46). Известно, что два патологических состояния: «расширение сосудов» и «склероз сосудов» — мало отличаются одно от другого по сравнению с нормальным состоянием. Соответствующее собственное значение Таблица 9. (см. скан) Частотное распределение пациентов по степени тяжести заболевания гипертонией I—IV в зависимости от вида рентгенограммы аорты (таблица частот)
|
1 |
Оглавление
|