5.5. КРИТЕРИИ, СОДЕРЖАЩИЕ БОЛЕЕ ОДНОГО ПАРАМЕТРА. ОБОБЩЕННЫЕ КРИТЕРИИ ОТНОШЕНИЯ ПРАВДОПОДОБИЯ
Критерий отношения правдоподобия для проверки простой гипотезы был описан в разделе 5.2.1, е). Особенно полезно обобщение этой процедуры, когда имеется несколько параметров, а нулевая гипотеза уточняет значение или значения только части из них. Сначала проведем формальное описание процедуры, а затем проиллюстрируем ее примерами.
Предположим, что вероятностная модель данных содержит параметров, обозначаемых Пусть — «параметрическое пространство», т. е. множество всех допустимых значений в. Предположим, что нулевая гипотеза уточняет значения к параметров но ничего не говорит об остальных. Мы обозначим ее так:
Удобно назвать суженным параметрическим пространством. (В частном случае может быть, что в — скалярный, или одномерный, параметр, а содержит одну—единственную точку). Обозначим
функцию правдоподобия в точке в [см. раздел 4.3.1] для вектора данных х. Ее наибольшее при изменении значение (когда вектор х остается неизменным) —
а наибольшее значение, когда в пробегает все несуженное пространство — это
Определим обобщенное отношение правдоподобия формулой
а область значимости для проверки когда вектор данных равен где
где
поскольку с последней величиной часто работать удобнее, и ее легче вычислять, чем Уровень значимости равен
Проиллюстрируем это примером.
Пример 5.5.1. t-критерий Стьюдента. В этом примере нужно проверить гипотезу о математическом ожидании нормального распределения, когда стандартное отклонение неизвестно. Вектор данных — это
где — реализации нормальной случайной величины с параметрами , так что функция правдоподобия (5.5.2) пропорциональна
Несуженное параметрическое пространство — это
Предположим, при нулевой гипотезе определяется значение параметра но ничего не говорится о параметре так что (5.5.1) принимает вид
а суженное параметрическое пространство будет таким:
Максимум функции правдоподобия по суженному параметрическому пространству достигается при значении а параметра определяемом формулой
откуда
Максимум функции правдоподобия по несуженному параметрическому пространству достигается при значениях параметров соответственно, выражаемых формулами
а
отсюда
Таким образом,
Теперь имеем
С помощью статистики
предыдущее выражение можно преобразовать к виду
где
статистика Стьюдента. (Отметим, что в этой ситуации служит обычной оценкой параметра
Область значимости состоит из всех возможных векторов размерности для которых величина оказывается меньше вычисленной по настоящим наблюдениям, т. е. для которых величина больше, чем значение Таким образом, уровень значимости равен
где — значение статистики Стьюдента (5.5.8), а Т - соответствующая случайная величина. Распределение Т имеет стандартный вид и детально представлено в таблицах [см. приложение 5], имеющих название «Распределение Стьюдента с степенями свободы» [см. раздел 2.5.5]. На интуитивном уровне критерий выглядит привлекательно. Он отличается от критерия, применяемого в ситуации, когда величина а известна [см. раздел 5.8.1], только заменой неизвестного значения параметра а оценкой а и применением порождаемого такой заменой выборочного распределения [см. раздел 5.8.2]. Численная иллюстрация -критерия (односторонняя версия) приведена в примерах 5.8.1 и 5.8.2.
Пример 5.5.2. Критерии отношения правдоподобия для параметров регрессии. Весьма важное для статистической теории обобщение примера 5.5.1 — в задачах линейной регрессии. Снова обозначим вектор данных но на этот раз предположим, что наблюдение извлечено из нормального распределения с математическим ожиданием
где — заданные константы, — неизвестные параметры (называемые коэффициентами регрессии), и с дисперсией (также неизвестной, но общей для всех наблюдений). Нужно проверить гипотезу, которая уточняет значение какого-то набора коэффициентов регрессии.
Например, данные могли бы представлять измерения растяжения при различных температурах, а вероятностная модель задавала бы ожидаемое растяжение при температуре (в шкале Цельсия) в виде где — ожидаемое при нулевой температуре растяжение, а ожидаемое увеличение растяжения при нагревании на 1 градус; в этом случае (5.5.9) принимает более простой вид:
где указывает, при какой температуре проводится наблюдение величины принявшей значение Например, можно было бы проверить гипотезу вида
[ср. с (5.5.1)]. Для представленной в (5.5.9) ситуации выберем параметрическое пространство
и предположим, что нулевая гипотеза (5.5.1) состоит в том, что
так что суженное параметрическое пространство таково:
Статистика отношения правдоподобия вычисляется приблизительно так же, как в примере 5.5.1. Вместо -отношения Стьюдента в качестве статистики критерия появляется -отношение Фишера, т. е.
где — минимум суммы квадратов по суженному параметрическому пространству, т. е. минимум выражения
— минимум такой же суммы, но по полному параметрическому пространству, т. е. минимальное значение величины
Оказывается, что при Н выборочное распределение статистики — это стандартное -распределение с степенями свободы, которое в таблицах обычно обозначается как а уровень значимости представляет собой вероятность того, что соответствующая случайная величина (при Н) превосходит наблюденное значение [см. раздел 2.5.6].
(Статистика (5.5.11) всегда обозначается и такое обозначение заставляет нас нарушать обычное соглашение, в силу которого прописная буква указывает на случайную величину, а соответствующая строчная — на ее реализацию.)
Некоторые иллюстрации приведены в гл. 8.