Рис. 5.2.3. Хвостовые площади, относящиеся к примеру 5.2.1
но относительно точки О [см. раздел 2.5.5], то приведенные в разделе
соображения применительно к непрерывному распределению позволяют определить уровень значимости следующим образом:
где Т подчиняется распределению Стьюдента с
степенями свободы,
вычисляется в соответствии с (5.2.11) по выборочному коэффициенту корреляции
Например, Фишер отмечает, что выборочный коэффициент корреляции между годовым урожаем пшеницы и осенним уровнем дождей за 20 лет составил в Восточной Англии
Соответствующее значение
(вычисленное по формуле (5.2.11) при
оказалось равным —3,433. Уровень значимости составляет
где индекс 18 указывает число степеней свободы [см. рис. 5.2.3]. К сожалению, доступные таблицы значений функции распределения Стьюдента представляют собой разновидность обратных таблиц [см. раздел 5.2.2], что не позволяет легко вычислить нужную вероятность. Вместо вероятностей в таблицах приведены значения
которые должны соответствовать наперед заданным уровням значимости. Например, таблица Фишера в книге «Statistical Methods for Research Workers» содержит значения
отвечающие величинам
Для 18 степеней свободы ближайшее табулированное значение — отвечающее
и составляющее 2,878. Отсюда следует, что
отвечает значение
которое меньше 0,01. Конечно, это значимо [см. табл. 5.2.1]: доверие к нулевой гипотезе заметно подорвано, а существование корреляции можно считать установленным. В этом примере то, что мы не смогли точно определить уровень значимости (а ограничились неравенством
не привело к большим неприятностям. Однако если бы выборочный коэффициент корреляции
оказался равным 0,468, чему соответствует
то таблица показала бы только, что
лежит между 0,05 (значение, соответствующее
и 0,02 (значение, соответствующее
Такой результат можно было бы сформулировать так: «значимость на уровне 5%, но не на уровне
Следует всегда иметь в виду, что подобное многословие обусловлено исключительно структурой публикуемых таблиц и, грубо говоря, эквивалентно высказыванию, что
равен 0,03 или 0,04 (если провести допускаемые таблицами интерполяции).
Еще один момент, на который необходимо обратить внимание пользователям таблиц: в некоторых их вариантах (как, например, упомянутая выше таблица Фишера) предполагается, что проверяется двухсторонняя гипотеза, и дается соответствующее значение
тогда как в других таблицах приводится односторонняя вероятность
Пользователь должен быть уверен, что он правильно понимает, о какой таблице идет речь.
Критерии для нормальных выборок обсуждаются в разделе 5.8. Однако следующий пример достоин особого внимания.
Пример 5.2.2. Значимость различия между выборочными коэффициентами корреляции. Предположим, что по двум выборкам объемом и
, извлеченным из двумерных нормальных совокупностей [см. II, раздел 13.4.6], получены выборочные коэффициенты корреляции Г] и
причем
Указывает ли это на то, что коэффициенты корреляции
обеих совокупностей различны? Соответствующая нулевая гипотеза
и вопрос сводится к тому, достаточно ли велико значение
чтобы отклонить ее. Мы снова обратимся к преобразованию: известно, что
и
с высокой степенью точности можно считать реализациями нормально распределенных случайных величин с математическими ожиданиями
и дисперсиями
соответственно [см. раздел 2.7.3, б)]. Следовательно, при Н, т. е. при
оказывается, что
будет реализацией нормально распределенной случайной величины с нулевым математическим ожиданием и дисперсией, равной примерно
[см. II, раздел 9.2]. Поэтому статистику
можно считать наблюдением стандартной нормальной величины
[см. II, раздел 11.4.1]. Большие значения
будут соответствовать неправдоподобным «хвостовым» значениям этого распределения, которые опровергают
При заданных
уровень значимости равен: