СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ
— проверка предположений о законе распределения генеральной совокупности по конечной выборке из этой совокупности. Простейшая ситуация, требующая использования С. П; г., состоит, напр., в следующем. Часто можно считать, что время исправной работы изделия (прибора, устройства) является случайным. Пусть - ср. время исправной работы, определенное по опытным данным. После изменения технологии изготовления изделия (или замены материала и т. п.) - данные опытов приводят к ср. значению

Возникает вопрос: является ли различие зйачений Т и

следствием случайных отклонений времени исправной работы или следствием влияния замены технологии на время исправной работы. Такие и подобные им вопросы постоянно возникают в технике, с.

биологии, при анализе эконом, данных и т. д.
Пусть
выборка объема
из генеральной совокупности с неизвестной ф-цией распределения. Статистической гипотезой (или гипотезой) наз. всякое предположение о ф-ции распределения. Напр., гипотезой является предположение, что неизвестная ф-ция распределения есть конкретная данная ф-ция, что неизвестная ф-ция распределения принадлежит некоторому семейству ф-ций, что
значение равно 0 и т. п. Правило или процедура, с помощью которых на основании выборки
делают заключение, что гипотеза или согласуется с опытными данными (т. е. принимают гипотезу) или не согласуется с ними (т. е. отвергают гипотезу), наз. критерием (тестом) гипотезы. Во многих случаях критерий проверки данной гипотезы Н можно описать следующим образом: мн-во всех возможных выборок
разбивается на два взаимно дополняющих мн-ва
если выборка
попадает во мн-во
то гипотеза
принимается, если в
то гипотеза
отвергается. Мн-во
областью принятия гипотезы
областью отклонения, или критической областью гипотезы
. При такой процедуре проверки гипотезы возможны ошибки двух родов: ошибка 1-го рода — отвергнуть гипотезу
, когда она верна, и ошибка 2-го рода — принять гипотезу
, когда она не верна. При проверке гипотез желательно иметь дело с критериями, имеющими малые вероятности ошибок
рода. Однако, при заданном объеме выборки вероятности ошибок
рода связаны, поэтому обычно задают границу (уровень значимости) для вероятности ошибки 1-го рода и рассматривают критерии с вероятностью ошибки 1-го рода, не большей уровня значимости, минимизирующие вероятность ошибки 2-го рода. Построение подобных критериев есть важная задача математической статистики, решенная в практически удобной форме только при определенных ограничениях.
Во многих случаях можно предполагать, что распределение генеральной совокупности, из которой извлечена выборка, принадлежит семейству ф-ций распределения
зависящему от параметра
(параметр может быть одномерным или многомерным), а гипотеза
верна,
принадлежит определенному мн-ву
и не верна, если 0 принадлежит дополнительному к
мн-ву
Вероятность ошибки 1-го рода для критерия с критической областью
при условии, что выборка извлечена из генеральной совокупности с распределением
есть ф-ция
на мн-ве 0. Эта ф-ция наз. функцией мощности критерия, а ее значение при 0 из
мощностью критери япри значении 0. Если мн-во
содержит одну точку
, то гипотеза
наз. простой, в противном случае гипотеза
наз. сложной. Полное решение задачи о построении наилучшего критерия для гипотезы
получено в случае, когда мн-ва
содержат по одной точке
Это решение содержится в следующей лемме Неймана — Пирсона, справедливой при определенных достаточно общих предположениях. Пусть
плотность вероятности выборки
при
плотность вероятности выборки при
уровень значимости. Среди критериев с вероятностью ошибки 1-го рода, не большей
, критерий с критическим мн-вом
и ошибкой 1-го родае (этим определяется число
) имеет наибольшую мощность (или, что то же, наименьшую ошибку 2-го рода). Этот критерий наз. наиболее мощным критерием уровня
для проверки гипотезы
.
В общем случае простой гипотезы критерии с ошибкой 1-го рода
максимизирующие мощность при различных значениях 0 из
оказываются различными. Если критерий имеет ошибку 1-го рода
и максимизирует мощность
при каждом
из мн-ва
в классе всех критериев с ошибкой 1-го рода
, то этот критерий наз. равномерно наиболее мощным критерием уровня
для гипотезы Н. Равномерно наиболее мощные критерии существуют редко.
Для проверки сложных гипотез используется обычно критерий отношения правдоподобия, состоящий в следующем. Пусть
плотность вероятности выборки
при условии, что
— значение неизвестного параметра. Критическое мн-во
критерия отношения правдоподобия задают так:
выбирают так, чтобы критерий
имел ошибку 1-го рода, не большую
. Хотя при конечном
получить детальную информацию об этом критерии можно очень редко, при больших
свойства этого критерия описаны подробно. Теорию проверки параметрических статистических гипотез построили амер. ученый Ю. Нейман и англ. учёный Е. Пирсон.
Если гипотеза
состоит в том, что распределение генеральной совокупности принадлежит некоторому подмножеству всех ф-ций распределения вероятностей (ф. р. в.) или классу всех непрерывных ф-ций распределения, то гипотеза Н наз. непараметрической, а критерий гипотезы Н — непараметрическим. Напр., если
выборка совокупности с некоторой ф. р. в., то гипотеза о том, что эта выборка извлечена из совокупности с данной ф. р. в. F, есть простая непараметрическая гипотеза, а гипотеза о том, что эта выборка — из совокупности с ф. р. в. из некоторого подмножества непрерывных ф. р. в., есть непараметрическая сложная гипотеза. Общая теория проверки непараметрических гипотез развита недостаточно, однако построено много важных для приложений спец. непараметрических критериев. Практически важным классом задач непараметрической статистики являются задачи следующего типа. Предположим, что
независимые выборки из Совокупностей с
соответственно. Необходимо построить критерий для проверки гипотезы о том, что
Имеется целый ряд спец. критериев для проверки гипотез такого рода. Новый подход к проверке статистических гипотез связан с теорией последовательного анализа.
Приведем некоторые критерии, часто используемые в приложениях (наблюдения предполагаются независимыми).
1. Критерий Стьюдента для проверки гипотезы о
значении нормального распределения. Пусть
выборка из нормальной совокупности с неизвестными математическим ожиданием
и дисперсией
Гипотеза
состоит в том, что
значение равно некоторому данному числу то. Критерий основан на том, что статистика — стьюдентово отношение
где
в случае справедливости гипотезы
имеет распределение, полностью определяемое числом
распределение Стьюдента с
степенями свободы. Критерий Стьюдента отклоняет гипотезу Н при данном уровне значимости
, если величина
, вычисленная по выборке, такова,
Если же
то гипотеза принимается. Величина
есть значение и, для и которого
плотность распределения Стьюдента с
степенями свободы. Значение
определяется по
с помощью таблиц.
2. Критерий
Для проверки гипотезы о распределении совокупности. Предположим, что по выборке
требуется проверить гипотезу
, состоящую в том, что распределение выборки задается полностью определенной
Пусть пространство значений рассматриваемой случайной величины разбито на
частей
вероятности этих
вычисленные согласно гипотетической
числа выборочных значений, попавших в мн-ва
соответственно;
Критерий
основан на том, что величина
при гипотезе
имеет при больших
распределение, близкое к распределению
с
степенями свободы, с плотностью вероятности
полностью определяемой числом
(теорема К. Пирсона). Критерий
для гипотезы
с уровнем значимости
отвергает Н, если вычисленное по выборке значение
и принимает
в противном случае. Величина
есть значение и, для которого
Для определения по 8 имеются таблицы.
Критерий
используется также при проверке гипотезы
о том, что распределение выборки принадлежит некоторому семейству ф-ций распределения вероятностей, зависящих от конечного числа параметров
. В этом случае значения
являются ф-циями неизвестных параметров. Ю. Нейман и Е. Пирсон предложили использовать в качестве оценок параметров
значения
минимизирующие величину
для данной выборки. Этот метод получения оценок неизвестных параметров наз. методом оценки по минимуму
. Если вместо неизвестных значений
в
поставить их оценки
полученные по методу минимума
или с помощью некоторых др. методов, то при больших
распределение
при гипотезе Я близко к распределению
с
степенями свободы. Критерий
для гипотезы Н с уровнем значимости
отвергает Н, если величина
с оценками
вместо
такова, что
Величина
есть значение и, для которого
Критерий для проверки гипотезы о равенстве средних значений двух нормальных совокупностей, дисперсии которых равны друг другу. Пусть
Две независимые выборки из нормальных совокупностей с неизвестными средними
и с одной и той же неизвестной дисперсией. Гипотеза Н состоит в предположении, что
значения равны друг другу, т. е. что
Критерий проверки гипотезы Н использует статистику
где
Статистика
имеет распределение Стьюдента с
степенями свободы. Критерий отвергает Я при уровне значимости
, если для вычисленного по выборкам значения
и принимает Н, если
Величина
определяется как значение и, для которого
4. Критерий для проверки равенства дисперсий двух нормальных совокупностей. Пусть
две независимые выборки из нормальных совокупностей с неизвестными средними и с неизвестными дисперсиями
Гипотеза Я есть предположение о равенстве дисперсий, т. е. предположение, что
Статистика
где
имеет распределение (
-распределение), полностью определяемое числами и
п. в.
-распределения. Критерий гипотезы Н с уровнем значимости
отвергает Н, если вычисленное по выборке значение F таково, что
Значение
есть величина и, для которой
Критерий проверки гипотезы о равенстве нулю коэфф. корреляции двумерной нормальной совокупности. Пусть
выборка из двумерного нормального распределения с неизвестными характеристиками. Рассмотрим гипотезу Я, состоящую в том, что коэфф. корреляции равен 0. Статистика
где
— выборочный коэфф. корреляции
при гипотезе Н имеет распределение Стьюдента с
степенями свободы. Критерий, основанный на этом, отвергает гипотезу Н с уровнем значимости е. если вычисленное по выборке значение
таково, что
Значение
есть то значение
для которого
Критерий Колмогорова — Смирнова гипотезы о совпадении ф-ций распределения вероятностей двух выборок. Пусть
и
независимые выборки из двух совокупностей с неизвестными непрерывными ф-циями распределения вероятностей
Гипотеза Н состоит в том, что
Статистика
где
эмпирические функции распределения выборок, при больших
имеет распределение, близкое к распределению Колмогорова с п. в.
Использование последнего утверждения дает следующий критерий гипотезы Н при уровне значимости
: гипотеза Н отвергается, если вычисленное по опытным данным значение
, где
таково, что
Для определения по
имеются таблицы.
Лит.: Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. М., 1968 [библиогр. с. 165—172]; Крамер Г. Математические методы статистики. Пер. с англ. М., 1948 [библиогр. с. 612—620]; Леман Э. Проверка статистических гипотез. Пер. с англ. М., 1964; Оуэн Д. Б. Сборник статистических таблиц. Пер. с англ. М., 1966 [библиогр. с. 541—554]. А. Я. Дороговцев.