Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
1.1.2. Коэффициент корреляции как измеритель степени тесноты связи в двумерных нормальных схемах.Пусть исследуется парная зависимость между случайными переменными Воспользовавшись соотношением (1.6) с учетом (1.4), получаем
С помощью непосредственных вычислений, опирающихся на формулу для плотности двумерного нормального закона, можно показать, что
где ковариация Выборочное значение
Определенные соотношениями (1.8) и (1.8) соответственно теоретический и выборочный коэффициенты корреляции могут быть формально вычислены для любой двумерной системы наблюдений; они являются измерителями степени тесное ты линейной статистической связи между анализируемыми признаками. Однако только в случае совместной нормальной распределенности исследуемых случайных величин Во всех же остальных случаях (распределения Приведем пример. На рис. 1.1, а представлены данные, характеризующие численность населения По формуле (1.8) получаем, что коэффициент корреляции
Рис. 1.1. Корреляционное поле, характеризующее связь между численностью населения Дело здесь в том, что последнее (десятое) наблюдение является «аномальным», резко выделяющимся, так что всю совокупность наблюдений мы уже не можем считать выборкой из одной и той же нормальной генеральной совокупности (в чем читатель сможет без труда убедиться, воспользовавшись одним из приемов, описанных в [14, § 11.5]). И наконец, даже если удалось установить тесную зависимость между двумя исследуемыми величинами, отсюда еще непосредственно не следует их причинная взаимообусловленность. Например, при анализе большого числа наблюдений, относящихся к отливке труб на сталелитейных заводах, была установлена положительная корреляционная связь между временем плавки и процентом забракованных труб [10]. Дать какое-либо причинное истолкование этой стохастической связи было невозможно, а поэтому рекомендации ограничить продолжительность плавки для снижения процента забракованных труб выглядели малосостоятельными. Действительно, спустя несколько лет обнаружили, что большая продолжительность плавки всегда была связана с использованием сырья специального состава. Этот вид сырья приводил одновременно к длительному времени плавки и большому проценту брака, хотя оба эти фактора взаимно независимы. Таким образом, высокий коэффициент корреляции между продолжительностью плавки и процентом забракованных труб полностью обусловливался влиянием третьего, не учтенного при исследовании фактора — характеристики качества сырья. Если же этот фактор был бы с самого начала учтен, то никакой значимой корреляционной связи между временем плавки и процентом забракованных труб мы бы не обнаружили. За счет подобных эффектов (одновременного влияния неучтенных факторов на исследуемые переменные) может искажаться и смысл истинной связи между переменными, т. е., например, подсчеты приводят к положительному значению парного коэффициента корреляции, в то время как истинная связь между ними имеет отрицательный смысл. Такую корреляцию между двумя переменными часто называют «ложной». Более детально подобные ситуации — обнаружение и исключение «общих причинных факторов», расчет «очищенных», или частных, коэффициентов корреляции и т. п. — исследуют методами многомерного корреляционного анализа (см. § 1.2). Такого рода недоразумения с причинным толкованием статистических связей наиболее вероятны в ситуациях, когда исходными статистическими данными являются показатели работы действующего предприятия. Их обычно удается свести к минимуму при получении данных из искусственно поставленного эксперимента. Выборочное значение коэффициента корреляции в примере В.3 между процентом забракованного стекла и соответствующей величиной вакуума в печи для его отжига Замечания о необходимости известной осторожности при толковании корреляционной связи никоим образом не обесценивают желательность проверки значимости любого кажущегося соотношения. При этом следует использовать характеристики степени тесноты связи: коэффициента корреляции
|
1 |
Оглавление
|