5.9. ПРОВЕРКА НОРМАЛЬНОСТИ
Поскольку понятие нормальности играет важную роль для многих статистических процедур, довольно важно иметь возможность проверить. что выборка значимо не отличается от нормальной, а используемые статистики имеют выборочные нормальные распределения.
Обоснованием перспективности этой проблемы может служить следующий принцип Фишера: «Отклонения от нормального вида, если только они не слишком заметны, можно обнаружить лишь для больших выборок; сами по себе они вносят малое отличие в с мистические критерии и другие вопросы». Конечно, при изучении выборочных распределений статистик можно убедиться в том, что одни из них более чувствительны, чем другие, к нарушениям предположений о нормальности. Именно таким оказывается рассмотренный разделе 5.10 критерий Бартлетта для проверки равенства дисперсий.
Применение вероятностной бумаги Хотя исследование вопросов, связанных с чувствительностью, может оказаться сложным, довольно легко проверить, разумно ли считать, что данная выборка извлечена из нормального распределения. Первичную проверку можно быстро провести, нанося график выборочной функции распределения на
вероятностную бумагу [см. раздел 3.2.2, г)]. Точки графика выборочной ф. р. из нормальной выборки будут лежать на прямой линии или лизко к ней, тогда как для заметно не нормальной совокупности они будут приближаться к некоторой кривой. Пример 3.5.1 иллюстрирует вычисление выборочной ф. р., а на рис. 3.5.1 показан ее график на вероятностной бумаге.
Ниже описана более объективная процедура.
Проверка нормальности с помощью асимметрии и эксцесса. Коэффициент асимметрии (скажем, 7,) случайной величины X равен
[см. II, раздел 9.10], где
В обозначениях раздела 2.1 его можно выразить как
[см. (2.1.5), (2.1.6)]. Для таких симметричных распределений, как нормальное, величина равна нулю. Соответствующий выборочный коэффициент асимметрии равен
где для выборки объема
[см. (2.1.8)]. Фишер рекомендует некоторую модификацию такой оценки , а именно
где
а
Здесь можно найти, зная нецентральные моменты если воспользоваться (2.1.9).
Аналогично эксцесс (или стандартизованный четвертый момент) случайной величины X равен
соответствующим выборочным аналогом служит , а рекомендуемая оценка есть
где
Для нормального распределения можно считать, что и имеют нормальные выборочные распределения, причем математическое ожидание каждого из них равно нулю, а дисперсии определяются выражениями
соответственно. Основанный на этих допущениях критерий нормальности представлен в примере 5.9.1.
Пример 5.9.1. (см. скан) Выборочные асимметрия и эксцесс. Имеются следующие данные о количестве осадков [см. Fisher (1970), раздел 14, табл. 3 — С]:
Данные привели к таким значениям выборочных моментов:
откуда
Поскольку и по абсолютной величине оказались меньше соответствующих стандартных отклонений, ни одна из этих величин не значима. Следует считать, что данные согласованы с гипотезой о нормальности.
Проверка нормальности с применением Критерий описан в гл. 7, а применение процедуры к данным из примера 5.9.1 изложено в примере 7.4.1.