4.5.2. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ДЛЯ ФУНКЦИЙ ДВУХ ПАРАМЕТРОВ, ВКЛЮЧАЮЩИХ ОТНОШЕНИЕ ПАРАМЕТРОВ И ИХ РАЗНОСТЬ (ТЕОРЕМА ФЕЛЛЕРА)
В этом разделе будут рассмотрены наиболее извесшые и часто встречающиеся на практике доверительные интервалы для функций двух параметров. Такими примерами (для нормальных моделей) будут следующие:
1) разность двух математических ожиданий [пример 4.5.4];
2) ордината линейной регрессии при фиксированном значении независимой переменной х [пример 4.5.5];
3) разность наклонов двух регрессионных прямых [пример 4.5.61;
4) отношение двух параметров, оцениваемых линейными функциями наблюдений (теорема Феллера) [пример 4.5.8].
Пример 4.5.4. Доверительные пределы для разности математических ожиданий двух нормальных величин с общей дисперсией.
Пусть — выборка из распределения и — выборка из распределения. Удобные оценки для и — средние выборки и у соответственно. Определяя и по обычным формулам
мы получим объединенную оценку общего значения дисперсии в виде
Подходящей оценкой для выборочной дисперсии х будет — для у, так что оценка дисперсии х — у будет Таким образом,
есть реализация случайной величины, распределенной по закону Стьюдента с степенями свободы [см. пример 2.5.3]. Следовательно, как и в примере 4.5.2, интервал есть центральный 95%-ный доверительный интервал для — при
где — квантиль распределения Стьюдента с степенями свободы уровня с примером 5.8.4]. С помощью данных, приведенных в табл. 4.5.1, мы покажем эту процедуру, рассматривая с иллюстративными целями столбцы, соответствующие препарату А и препарату В так, как будто они получены в эксперименте с разными и независимыми группами пациентов. Будем считать числа, соответствующие препарату А, значениями , а соответствующие препарату В — значениями Применяя предыдущие формулы, получаем
где и находим из соотношений
так что
Тогда
Значения, соответствующие квантилям уровня 2,5% и 97,5% величины Стьюдента с 18 степенями свободы есть —2,101 и [см. приложение 5], откуда 95%-ный доверительный интервал для будет следующим:
Заметим, что 0 покрывается этим интервалом. Это значит, что данные не противоречат гипотезе, что (Этот пример рассмотрен исключительно в иллюстративных целях. Предполагается, что — наблюдаемые значения независимых случайных величин X и Y, в то время как в действительности данные, показывающие эффективность различных препаратов, не могут считаться независимыми. Напротив, следует ожидать, что эти величины будут иметь положительную корреляцию и значение дисперсии будет в действительности меньше оценки, полученной в предположении независимости величин . Поэтому понятно, что истинный доверительный интервал (4.5.3), а именно короче, чем полученный в предположении независимости интервал )
Пример 4.5.5. Доверительные пределы для регрессии при данном значении х. В примере 4.5.3 регрессия
оценена в точке как
Это — реализация нормально распределенной случайной величины с математическим ожиданием
и дисперсией
4.5.1 были получены доверительные пределы для дисперсии нормального распределения, допускает обобщение на отношение дисперсий двух нормальных случайных величин. Используя обозначения из примера 4.5.3, заметим, что
независимые реализации степенями свободы. Отсюда видно, что отношение
есть реализация -распределения [см. раздел 2.5.6] с степенями свободы, т. е. . Обозначим через и -квантили (т. е. -ная точка, -ная точка) [см. II, раздел 10.3.3] этого распределения. (Их можно найти, используя стандартные таблицы [см. пример, приведенный ниже]. Такая таблица представлена в приложении 7.) Теперь мы получим 95%-ный доверительный интервал для из неравенств
откуда
Таким образом, доверительный интервал для есть
или же доверительный интервал для есть
а для
Если нужный уровень доверия был бы равен, скажем, 0,99, то нужно было бы искать как 0,005- и 0,995-квантили -распределения.
Чтобы проиллюстрировать сказанное, возьмем и пусть -ный доверительный интервал для получим, взяв как квантили уровней 0,025 и 0,975 распределения опубликованных таблицах называется верхней -ной точкой. В нашем случае ее значение Нижняя -ная точка а в таблицах явно не содержится, так как ее значение совпадает с величиной, обратной к верхней -ной точке распределения
(обратите внимание на то, что числа степеней свободы здесь мы поменяли местами; то же самое будет иметь место и для -ных точек [см. раздел 2.5.6]). В нашем случае Таким образом, искомым доверительным интервалом для будет (0,448, 2,40).
То же можно проделать и для примера 4.5.4. Здесь откуда 95%-ный доверительный интервал для есть (0,311, 5,04), а для Отметим, что этот интервал содержит единицу, и, следовательно, данные согласуются с гипотезой равных дисперсий.
Пример 4.5.8. Доверительные интервалы для отношений параметров, оцениваемых через линейные функции данных (теорема Феллера). В этой задаче мы имеем дело с отношением где — параметры, относящиеся к двум нормальным распределениям с одинаковой дисперсией, из которых имеются выборки. Например, могут быть математическими ожиданиями этих распределений, или коэффициентами наклона регрессионных прямых; или же, для регрессии может быть значением х, при котором регрессия принимает значение тогда — отношение рассматриваемого здесь вида и т. д. Мы предполагаем, что — несмещенные оценки , являющиеся линейными функциями наблюдений; выборочные оценки их дисперсий и ковариаций пусть степенями свободы.
Рассмотрим величину . Она распределена нормально с нулевым математическим ожиданием и дисперсией, имеющей оценку
с степенями свободы. Величина
имеет распределение Стьюдента с степенями свободы, откуда с вероятностью 0,95
где -ная точка распределения Стьюдента с степенями свободы.
Корни уравнения
являются границами доверительного интервала с коэффициентом доверия 95% для . Квадратное уравнение относительно X можно переписать в виде
где Это и есть результат Феллера.
Если, как это часто бывает в приложениях, корни полученного уравнения могут быть выписаны в следующем виде, показывающем отклонение от «естественной» оценки для
В последующем численном примере мы также приведем приблизительные доверительные пределы, полученные из приближенных формул примера 2.7.7, а именно для выборочной дисперсии
так что
Если, как, например, в разделе 6.6.6, рассматриваемое отношение есть где оцениваются через соответственно, то нужно исследовать величину , а не Математическое ожидание а равно нулю, как и требуется. Величина из (4.5.12) должна быть заменена на
и квадратное уравнение (4.5.15) — на уравнение
В качестве численного примера мы используем данные из примера 4.5.4. Для разности средней эффективности двух параметров доверительные примеры уже найдены. За нее было принято добавочное время сна. Теперь же вместо разности рассмотрим отношение Используя (4.5.15), получим
и
Тогда
Значение равно 2,101. Квадратное уравнение (4.5.4) принимает вид
Его корни
Для сравнения по приближенной формуле (4.5.16) получаем
(еще один численный пример приведен в разделе 6.6.6).