Главная > Справочник по прикладной статистике. Том 1
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

5.6. АППРОКСИМАЦИЯ УРОВНЯ ЗНАЧИМОСТИ КРИТЕРИЯ ОТНОШЕНИЯ ПРАВДОПОДОБИЯ ДЛЯ БОЛЬШИХ ВЫБОРОК

Для описанной в разделе 5.5 процедуры проверки гипотезы выборочное распределение при Н статистики критерия

вида (5.5.6) аппроксимируется распределением хи-квадрат с к степенями свободы, где к — число точно определяемых при нулевой гипотезе параметров. (Предполагается, что вероятностная модель удовлетворяет некоторым условиям регулярности.) На практике приближение может оказаться удивительно хорошим, как показывает следующий пример.

Пример 5.6.1. Таблица сопряженности Рассмотрим таблицу сопряженности для классификации по двум признакам [ср. с разделом 5.4.2] с частотами в клетках, суммами по строкам, по столбцам и объемом выборки т. е.

Соответствующие вероятности обозначим так:

где Эти вероятности с помощью трех параметров представимы так:

Функция правдоподобия [см. раздел 4.13] пропорциональна

Предположим, мы хотим проверить гипотезу Н относительно взаимной независимости признаков, т. е. что вероятность получить наблюдение в клетке равна произведению где — сумма двух вероятностей в клетках строки, — аналогичная сумма для столбца. Эквивалентно можно записать гипотезу как

Наибольшее значение , когда изменяются в соответствии с Н, равно

так что

В то же время при отсутствии ограничений наибольшее значение равно

где

так что

Тогда статистика отношения правдоподобия (5.5.5) принимает значение

Для упомянутых в примере 5.4.4 данных о преступности среди близнецов таблица была такой:

откуда

и

Поскольку нулевая гипотеза определяет значение только одного параметра, асимптотическая теорема (если бы ее можно было применять к столь малой выборке) утверждала бы, что при Н это значение 14 нужно считать реализацией распределения хи-квадрат с одной степенью свободы. При такой интерпретации, следовательно, уровень значимости будет равен

где — стандартная нормальная случайная величина (так как подчиняется распределению ). Поэтому уровень значимости

Полученный в примере 5.4.4 для условного критерия уровень значимости составил 0,0004. Таким образом, ошибка при приближении отношения правдоподобия с помощью асимптотики для больших выборок составляет всего 0,0002.

1
Оглавление
email@scask.ru