Главная > Методы корреляционного и регрессионного анализа
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

13.2. КОЭФФИЦИЕНТ КОНТИНГЕНЦИИ (СОПРЯЖЕННОСТИ)

Если вариацию качественного признака изучаемого явления можно разбить не на две группы (как в случае дихотомического признака), а на несколько групп, то соответствующий числовой материал располагают в виде таблицы с несколькими строками и столбцами. Такая таблица называется таблицей контингенции, или -таблицей.

Связь между признаками по такой таблице исследуется с помощью критерия Покажем применение критерия на примере. Пусть требуется исследовать, оказывает ли влияние консервирующее средство на сохраняемость продуктов питания. Было заготовлено 1000 упаковок данного вида продуктов питания, из которых 300 упаковок были без добавки, 500 упаковок — с незначительной добавкой, а 200— с большой добавкой консерванта. Продукты питания затем, по степени их сохраняемость, были разбиты на группы: плохая, средняя, хорошая и очень хорошая сохраняемость Результаты исследования приведены в табл. 22.

Таблица 22. Связь между консервирующим средством и сохраняемостью продуктов питания (см. скан)

Если бы существовала однозначная связь между добавкой консервирующего средства и сохраняемостью продуктов питания, то были бы заполнены клетки только по диагонали таблицы контингенции. Но наш пример не может служить иллюстрацией этого случая. Простое сравнение чисел в заполненных клетках таблицы не даст нам ответа на вопрос, существует ли связь между изучаемыми признаками. Но критерий позволит сделать статистически обоснованный вывод о связи. Для этой цели по имеющимся данным построим таблицу с таким распределением статистической совокупности по ее клеткам, которое соответствовало бы отсутствию связи между обоими признаками. Путем сравнения фактических и теоретически ожидаемых значений можно установить, существует связь или нет. В первом случае наблюдаются значительные отклонения между эмпирическими и теоретическими значениями, а во втором случае эмпирические и теоретические значения почти совпадают.

Итак,

— относительная частота (вероятность) появления значения в строке. Далее,

— относительная частота (вероятность) появления значения в столбце. Через обозначено общее число единиц данной статистической совокупности. В нашем примере

Относительная частота (вероятность) появления значения в строке и столбце (в клетке таблицы) выразится следующим образом:

Учитывая распределение сумм частот по строкам и столбцам получим теоретически ожидаемое значение

Так как при вычислении относительных частот предполагалась независимость признаков, то являются теоретически ожидаемыми значениями в отдельных клетках таблицы. Эти значения имели бы место при отсутствии связи между признаками. Они указаны в каждой клетке табл. 22 под эмпирическими частотами.

Для проверки гипотезы о связи между признаками применяется критерий Величина

имеет -распределение с степенями свободы. Расчетное значение (13.12) сравниваем с теоретическим значением найденным по табл. 5 приложения при заданном уровне значимости а и соответствующем числе степеней свободы. Если то с вероятностью можно принять гипотезу о наличии связи между рассматриваемыми признаками.

Вид и силу связи изучают затем с помощью дополнительных исследований, привлекая к этому, например, коэффициент контингенции, который можно вычислить по формуле:

или

Здесь — наименьшее из двух чисел т. е. либо число строк, либо число столбцов. Значения С и К лежат в границах между 0 и 1. Если мы применим формулы (13.8) — (13.12) к таблице ассоциации из раздела 13.1, то выведем приведенные там соотношения.

Обратимся к нашему примеру. По (13.11) получим

По (13.12) имеем

Если бы связь между добавкой консервирующего средства и сохраняемостью продуктов отсутствовала, то несущественно бы отличалось от 0. Для нашего примера число степеней свободы При уровне значимости или 5%, находим по табл. 5 приложения критическое значение Так как то делаем вывод — консервирующее средство оказывает влияние на сохраняемость продуктов питания. Этот вывод подтверждается также при выборе уровня значимости или . В этом случае критическое значение

Для определения силы связи вычислим коэффициенты контингенции:

Оба коэффициента указывают на существование связи средней силы между добавкой консервирующего средства и сохраняемостью продуктов.

В связи с тем что величина С зависит от числа столбцов и строй таблицы, обычно вычисляют исправленный коэффициент контингенции с поправкой Стах. Значение Стах с увеличением числа строк и столбцов таблицы приближается к Для квадратной таблицы контингенции

где через обозначено число столбцов или строк. Для -таблицы приблизительное значение Стах вычисляется как среднее из максимальных значений С соответствующих квадратных таблиц контингенции. Так, для -таблицы имеем из чего следует, что

Исправленное значение коэффициента находим по формуле

Для нашего примера получаем следующий результат:

Особенно важно вводить поправку в коэффициент контингенции при малом числе строк и столбцов таблицы.

Categories

1
Оглавление
email@scask.ru