Главная > Методы корреляционного и регрессионного анализа
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

7. ЧАСТНЫЕ ВОПРОСЫ КОРРЕЛЯЦИОННОГО И РЕГРЕССИОННОГО АНАЛИЗА

7.1. КОЭФФИЦИЕНТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЭНА

Наряду с рассмотренными линейными и нелинейными коэффициентами корреляции существует еще ряд показателей тесноты связи, широко применяемых в экономике в тех случаях, когда признакам наблюдаемого явления не удается однозначно приписать те или иные абсолютные значения. К ним относится коэффициент ранговой корреляции Спирмэна. Его применение, в отличие от приведенных выше коэффициентов корреляции, не связано с предпосылкой нормальности распределения исходных данных.

При применении методов ранговой корреляции исходят не из точных количественных оценок значений признаков-переменных, а из рангов. Для этого элементы совокупности располагаются в определенном порядке в соответствии с некоторым признаком, присущим им в неодинаковой мере. Полученный ряд элементов называют упорядоченным. Сам процесс упорядочения называется ранжированием, а каждому члену ряда присваивается ранг, или ранговое число (порядковый номер). Например, элементу с наименьшим значением признака присваивается ранг 1, следующему за ним элементу— ранг 2 и т. д. Элементы можно располагать также в порядке убывания значений их признака. Таким образом, происходит сравнение каждого элемента со всеми остальными элементами совокупности. Если элемент обладает не одним, а двумя признаками и у, то для исследования их влияния друг на друга каждому элементу приписывается два порядковых номерав соответствии с установленным правилом ранжирования. Далее переходим от корреляции признаков-переменных к изучению связи между ранговыми числами путем определения соответствия между двумяпоследовательностями порядковых оценок. Другими словами, измеряется теснота ранговой корреляции, Поскольку изучается

связь между двумя переменными, используемый при этом коэффициент ранговой корреляции Спирмэна является парным.

Обозначим ранги, соответствующие значениям переменной у, через а ранги, соответствующие значениям переменной х, — через (см. табл. 12). Коэффициент ранговой корреляции Спирмэна вычисляется по формуле

где — объем выборки. Из (7.1) видно, что для вычисления коэффициента необходимо определить только квадраты отклонений рангов. На практике приходится сталкиваться со случаями, когда два или более элемента совокупности имеют одинаковые значения одного и того же признака и исследователь не способен найти существенные различия между ними. Элементы, обладающие этим свойством — отсутствием предпочтений, — называются связанными, а образованная из них группа — связкой. Метод, который применяется для приписывания порядкового номера связанным элементам, называется методом средних рангов. Он заключается в усреднении рангов, которые имели бы элементы, если бы они были различимы. Сумма рангов при этом остается точно такой, как и при ранжировании без связей. Так, например, если у переменной у четвертое, пятое и шестое значения одинаковы по величине, то каждому приписывается ранг Следующему по величине значению приписывается ранг 7. При наличии связанных рангов в коэффициент ранговой корреляции Спирмэна вводится поправка:

Здесь А и В — поправочные коэффициенты для связок соответственно в последовательностях рангов и

— порядковые номера связок среди рангов если имеется одна связка, то если две, то — число одинаковых значений ряда принадлежащих одной связке; если второй связке принадлежат пять одинаковых значений, то это обозначают так: Аналогично можно дать определения для и

Коэффициент ранговой корреляции может принимать значения внутри интервала Если то В этом случае имеется полная согласованность между элементами двух последовательностей. Каждый элемент занимает одно и то же место в обоих рядах, что означает полную положительную корреляцию рангов. Если то элементы двух последовательностей расположены в обратном порядке и между ними полная рассогласованность. Это означает полную отрицательную корреляцию рангов. И наконец, если то это свидетельствует отсутствии корреляции между рангами.

Пример

Определим тесноту связи между производительностью труда и уровнем механизации работ на 10 промышленных предприятиях. Данные приведены в табл. 12.

Таблица 12. Производительность труда и уровень механизации работ на 10 предприятиях (см. скан)

Например, ранг означает, что предприятие 5 по уровню механизации работ стоит на седьмом месте при расположении предприятий в порядке возрастания соответствующего показателя. По данным табл. 12 вычисляем коэффициент ранговой корреляции:

В последовательности рангов имеется одна связанная пара. Вычислим поправочный коэффициент по (7.2). В нашем случае введение поправки не приведет к существенному изменению величины коэффициента

циента ранговой корреляции, так как число связок и количество рангов в связке невелико. Итак, имеем

Величина свидетельствует о тесной положительной связи между производительностью труда и уровнем механизации работ. Коэффициент парной корреляции, вычисленный непосредственно по исходным данным, равен: Сравнивая убеждаемся, что они мало отличаются друг от друга. Коэффициент ранговой корреляции в общем служит довольно хорошей характеристикой степени связи исследуемых переменных. Его достоинство заключается в том, что он не связан с предпосылкой нормальности распределения исходных данных. Но не следует упускать из вида, что при переходе от первоначальных значений к рангам происходит определенная потеря информации. Коэффициент ранговой корреляции тем больше приближается к коэффициенту парной корреляции, чем меньше корреляционная связь между изучаемыми переменными отлична от линейной и чем сильнее эта связь. Для нормально распределенной генеральной совокупности и при достаточно большом объеме выборки между обоими коэффициентами существует следующее асимптотическое соотношение:

Метод ранговой корреляции не требует линейной корреляции между переменными. Но, однако, необходимо, чтобы функция регрессии, отражающая эту связь, была монотонной.

Особенно полезной оказывается ранговая корреляция при исследовании связей между явлениями, неподдающимися количественной оценке. В таких случаях исследователь на основе своего опыта, или производя сравнение с каким-либо эталоном, приписывает элементам выборки ранги по каждому из изучаемых качественных признаков. Например, ранговую корреляцию можно использовать при исследовании зависимости между сортностью продукции, ее сроком службы и производственными затратами. При изучении качества изделий их часто классифицируют по следующим уровням: «отличное, очень хорошее, хорошее, среднее, плохое». Аналогично можно прошкалировать и другие признаки.

Ранговую корреляцию широко используют также в социологических исследованиях. Например, при анкетировании и опросах населения, при обработке результатов психологических и педагогических тестов. Словом, ранговая корреляция оказывается полезной всегда

для изучения связей там, где свойства явлений не поддаются точному количественному измерению, но позволяют производить сравнительную оценку, благодаря которой устанавливаются последовательности рангов.

Categories

1
Оглавление
email@scask.ru