7.5.2. ТАБЛИЦЫ k x m
В разделе 7.4.1 мы обсуждали таблицы сопряженности, основанные на двойной дихотомии; каждый индивидуум в выборке классифицировался как: а) принадлежащий категории А или нет, а также как б) принадлежащий категории В или нет. Если первую дихотомию заменить разделением на к категорий, а вторую — на
то мы получим так называемую таблицу сопряженности
:
(см. скан)
В этом случае данные могут быть, например, выборкой из детей школьного возраста, классифицированных по цвету волос (категории
и качеству зубов (категории
тогда
— число школьников с волосами категории
и зубами категории
. В предположении справедливости нулевой гипотезы независимости (т. е. что цвет волос не влияет на качество зубов, и наоборот) ожидаемая частота, соответствующая наблюденной частоте
, равна:
а статистика Пирсона имеет вид
Выборочное распределение этой статистики в предположении справедливости нулевой гипотезы представляет собой приблизительно распределение
с
степенями свободы, где
а уровень значимости
равен
Таблица
. В случае таблиц сопряженности
или
независимость эквивалентна однородности, как в случае таблицы
обсуждавшемся в разделе 7.4.1.
(см. скан)
Таким образом, для данных вида независимость качества зубов и цвета волос эквивалентна однородности ожидаемых долей, как показано в следующей таблице: где
(см. скан)
Соответствующие ожидаемые частоты будут равны:
(см. скан)
Итак, чтобы проверить гипотезу, что доля успехов одна и та же в каждой из к совокупностей, можно применить критерий
основанный на статистике
считая это число реализацией случайной величины
степенями свободы.