Главная > Прикладной анализ случайных данных
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

4.6. Критерий согласия хи-квадрат

Для проверки эквивалентности плотности вероятности выборочных данных некоторой гипотетической плотности часто используется особый критерий, называемый критерием согласия хи-квадрат. Общая идея критерия заключается в использовании в качестве меры расхождения наблюдаемой плотности вероятности и гипотетической плотности некоторой статистики, приближенно подчиняющейся распределению хи-квадрат -распределению). Затем гипотеза относительно их эквивалентности проверяется путем изучения выборочного распределения этой статистики.

Пусть, например, дана выборка из независимых наблюдений случайной величины х с плотностью Сгруппируем наблюдений по К интервалам, называемым интервалами группировки, которые в совокупности образуют гистограмму частот. Число наблюдений, попавших интервал, называется наблюденной частотой интервала; обозначим ее Число наблюдений, которые могли бы попасть интервал, если бы истинной плотностью х была называется ожидаемой частотой интервала; обозначим Далее, расхождение между наблюденной и ожидаемой частотами в каждом интервале равно Для того чтобы измерить общее расхождение по всем интервалам, нормируем квадраты расхождений соответствующими ожидаемыми частотами и просуммируем их: получим выборочную статистику

В работе [4.1] показано, что распределение величины из формулы (4.49) приближенно совпадает с -распределением, изученным в разд. 4.2.2. Число степеней свободы в этом случае равно К минус число различных независимых линейных ограничений, наложенных на наблюдения. Существует одно такое ограничение, связанное с тем, что частота в последнем интервале группировки полностью определяется частотами всех остальных интервалов. Если при сравнении плотностей одновременно подбираются параметры гипотетического распределения с целью достижения наилучшего согласия с гистограммой частот, построенной по выборочным данным, то добавляется по одному ограничению на каждый независимый параметр гипотетической плотности, который будет определяться для достижения этого согласия. Например, если гипотетическая плотность — нормальная, с неизвестными средним значением и дисперсией, то появятся два дополнительных ограничения, поскольку для подбора нормальной плотности придется оценить два параметра (среднее значение и дисперсию). Следовательно, в том обычном случае, когда критерий согласия хи-квадрат применяется для проверки нормальности, число степеней свободы из формулы (4.49) равной

После выбора числа степеней свободы величины проверка гипотезы проводится следующим образом. Предположим, что случайная величина х имеет плотность Сгруппировав выборочные значения по К интервалам и вычислив ожидаемую частоту для каждого интервала группировки в предположениир найдем по формуле (4.49). Поскольку любое отклонение от вызовет увеличение то используем односторонний критерий (по верхней границе). Область принятия гипотезы имеет вид

где значение берется из табл. А.3. Если выборочное значение превышает гипотеза о том, что отвергается с уровнем

значимости а. Если меньше то гипотеза принимается с тем же уровнем значимости а.

Известны два основных способа применения критерия согласия хи-квадрат. Первый заключается в выборе таких интервалов группировки, которые обеспечивают равенство ожидаемых частот для всех интервалов. За исключением гипотезы о равномерности распределения, такой способ приводит к интервалам группировки различной длины. Второй способ состоит в выборе интервалов одинаковой длины. Опять-таки за исключением гипотезы о равномерности распределения, в этом случае разными окажутся частоты попадания в тот или иной интервал. Для проверки нормальности с помощью критерия согласия хи-квадрат обычно используются интервалы равной длины. Если стандартное отклонение выборочных данных равное, то часто берут интервалы группировки длиной Более существенное требование заключается в том, что ожидаемые частоты для каждого интервала группировки должны быть достаточно большими, с тем чтобы с приемлемой точностью приближала величину из формулы (4.49). Обычно рекомендуется добиваться выполнения условия для всех интервалов. При проверке нормальности, когда частоты, соответствующие хвостам распределения, быстро убывают, обычно в качестве первого и последнего интервалов выбирают интервалы, простирающиеся соответственно до причем должно выполняться указанное выше требование

Таблица 4.1. (см. скан) Выборочные значения, упорядоченные по возрастанию

Таблица 4.2. (см. скан) Вычисления, выполняемые при построении критерия согласия

ПРИМЕР 4.3. ПРОВЕРКА НОРМАЛЬНОСТИ В табл. 4.1 представлена выборка из независимых наблюдений преобразованного к числовому виду выхода генератора теплового шума. Для удобства выборочные значения упорядочены по возрастанию. Проверим выход генератора шума на нормальность с помощью критерия хи-квадрат с уровнем значимости

Все вычисления, необходимые для построения критерия, сведены в табл. 4.2. При длине интервалов границы интервалов группировки, определенные по стандартному нормальному распределению, приведены в столбце, отмеченном символом Следующий столбец содержит те же величины после преобразования в вольты. По табл. определим, используя значения вероятность попадания выборочных значений в каждый из интервалов группировки. Произведение на размер выборки даст ожидаемые частоты для каждого интервала; эти частоты представлены в столбце, отмеченном символом Заметим, что первый и последний интервалы выбраны так, что . В результате получилось 12 интервалов. Подсчитаем затем наблюденные частоты, используя границы интервалов (табл. 4.1). После этого вычислим и просуммируем нормированные квадраты расхождений ожидаемых и наблюденных частот; получим Отметим, что в данном случае число степеней свободы равно Область принятия гипотезы находим из табл. А.3;

получаем Следовательно, гипотеза о нормальности принимается с уровнем значимости

Categories

1
Оглавление
email@scask.ru