Главная > Методы корреляционного и регрессионного анализа
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

13.1. КОЭФФИЦИЕНТ АССОЦИАЦИИ

Если признак обладает альтернативной вариацией, то результаты наблюдений можно представить в виде таблицы ассоциации, называемой также -таблицей, или четырехклеточной таблицей. В качестве примера исследуем, существует ли связь между заболеваемостью профессиональной болезнью и способом разработки подземным или открытым на одном из предприятий горнодобывающей промышленности. Числовые данные содержатся в табл. 21.

Таблица 21

Число заболеваний при подземном и открытом способах разработки

Для измерения связи можно воспользоваться коэффициентом ассоциации Ф (произносится: предложенным К. Пирсоном:

По своей конструкции коэффициент Ф соответствует коэффициенту корреляции, примененному к частотам появления отдельных значений признака. Коэффициент Ф принимает значения в интервале Если то При коэффициент Случай или не представляет интереса, так как при таких значениях нельзя построить четырехклеточную таблицу.

Для нашего примера

По величине Ф можно предположить, что, вероятно, между числом заболеваний и числом работников, занятых на подземных и открытых разработках, существует лишь очень слабая связь. Для проверки этого вывода применим критерий В специальной литературе показано, что

Отсюда следует, что

где сумма всех частот. Величина для четырехклеточной таблицы имеет одну степень свободы. С помощью критерия можно непосредственно оценить, существует ли вообще связь между изучаемыми явлениями. Но критерий не позволяет сделать вывод о силе связи. Для нашего примера Если мы выберем уровень значимости то по табл. 5 приложения найдем для числа степеней свободы равного 1, критическое значение Так как то делаем общий вывод, что между данными явлениями имеется статистически значимая связь, но коэффициент показывает, что связь очень слабая.

Формулу (13.1) можно вывести, используя ход рассуждений, который будет приведен в разделе 13.2.

Мы представили меру связи дихотомических признаков. Коэффициент ассоциации может быть вычислен только при альтернативной группировке числового материала («да», «нет»; «хорошо», «плохо» и т. д.). При этом ожидаемая частота признака должна быть больше 5, а объем выборки — не меньше 40. Вполне возможно, что эти предпосылки могут не соблюдаться в силу того, что частоты определяются эмпирическим путем. В этом случае для большего соответствия -рас-пределению вводят так называемую поправку на непрерывность, или коэффициент Йейтса. Смысл поправки заключается в том, что наблюдаемые частоты, которые больше ожидаемых, увеличивают на 0,5, а наблюдаемые частоты, которые меньше ожидаемых, уменьшают на эту же величину. В результате получаем формулу:

Другим показателем ассоциации является тетрахорический коэф фициент гтет. Он также вычисляется при альтернативной (дихотомической) группировке числового материала. Предпосылкой его применения является нормальное распределение генеральной совокупности. Тетрахорический коэффициент вычисляется по формуле

Коэффициент может принимать значения в границах — Если распределение частот по границам четырехклеточной таблицы сильнонеравномерно, то гтет становится ненадежным показателем связи.

Известны также другие показатели связи, вычисляемые по четырехклеточной таблице. Из них прежде всего следует упомянуть коэффициент

ассоциации предложенный Г. У. Юлом в 1900 г.:

Коэффициент принимает значения в интервале

Categories

1
Оглавление
email@scask.ru