Главная > Прикладная статистика: Исследование зависимостей
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

1.2.3. Статистические свойства выборочных частных коэффициентов корреляции (проверка на статистическую значимость их отличия от нуля, доверительные интервалы).

При исследовании статистических свойств выборочного частного коэффициента корреляции порядка к (т. е. при исключении опосредованного влияния k мешающих переменных) следует воспользоваться тем (см., например, [20, теорема 4.3.4]), что он распределен точно так же, как и обычный (парный) выборочный коэффициент корреляции между теми же переменными с единственной поправкой: объем выборки надо уменьшить на к единиц, т. е. полагать его равным , а не .

Поэтому при проверке статистически значимого отличия от нуля выборочного частного коэффициента корреляции и при построении для него доверительных интервалов следует пользоваться рекомендациями п. 1.1.3 для парного коэффициента корреляции с заменой на .

1.2.4. Примеры. Рассмотрим некоторые конкретные числовые примеры, демонстрирующие возможный характер искажающего опосредованного влияния «третьих факторов» на корреляцию между двумя анализируемыми переменными.

Пример 1.1. По итогам года 37 однородных предприятий легкой промышленности были зарегистрированы следующие показатели их работы: — среднемесячная характеристика качества ткани (в баллах); — среднемесячное количество профилактических наладок автоматической линии; — среднемесячное число обрывов нити.

По матрице исходных данных были подсчитаны (с помощью ) выборочные парные коэффициенты корреляции .

Проверка «на статистическую значимость», проведенная в соответствии с рекомендациями п. 1.1.3, свидетельствует об отсутствии статистически значимой парной корреляционной связи между качеством ткани, с одной стороны, и числом профилактических наладок и обрывов нити — с другой, что не согласуется с профессиональными представлениями технолога.

Однако расчет частных коэффициентов корреляции по формуле (1.23) дает значения которые вполне соответствуют нашим представлениям о естественном характере связей между изучаемыми показателями.

Построение доверительных интервалов для истинных значений в соответствии с рекомендациями п. 1.1.3 (в частности, с использованием -преобразования Фишера, поскольку наш случай характеризуется значениями коэффициентов корреляции, близкими по абсолютной величине к единице) дает: с доверительной вероятностью , где — тангенс гиперболический угла

— это -квантиль стандартного нормального распределения (см. табл. П.3).

В нашем примере . Подставляя поочередно в эту формулу значения и пользуясь табл. П.7 значений получаем:

Пример 1.2. С целью исследования влияния погодных условий на урожайность кормовых трав Хукер (Journ. Roy. Stat. Soc., 1907, v. 65, p. 1) рассмотрел данные Министерства земледелия Англии за 20 лет, характеризующие урожайность весеннее количество осадков (в дюймах) и накопленную за весну сумму «активных» (т. е. выше +5,5° С) температур (в градусах по Фаренгейту) однородной в метеорологическом отношении области Англии, включающей в себя группу восточных графств. По выборке были подсчитаны основные статистические характеристики изучаемой трехмерной случайной величины:

Действительно ли высокая температура в период созревания трав отрицательно влияет на их урожайность (ведь ) или здесь сказывается опосредованное влияние «мешающего» фактора — количества осадков ?

Вычисление частных коэффициентов корреляции по рекуррентной формуле (1.23) дает:

Как видим, если исключить одновременное влияние количества осадков на урожайность (с ростом она повышается) и на сумму активных температур (с ростом (1) она понижается), то мы уже не обнаружим отрицательной корреляции между температурой и урожайностью , в то время как .

Построение доверительных интервалов для (с уровнем доверия Р = 0,95) с использованием -преобразования Фишера дает в данном случае:

Последнее неравенство свидетельствует о том, что у нас нет оснований считать положительную очищенную корреляционную связь между урожайностью и температурой статистически значимой.

1
Оглавление
email@scask.ru