4.5. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ПРИ НЕСКОЛЬКИХ ПАРАМЕТРАХ
Из числа вопросов, возникающих при переходе к доверительным интервалам для нескольких параметров, выделим следующие:
1) можно ли получить индивидуальные (отдельные) доверительные интервалы для каждого из параметров?
можно ли получить доверительные интервалы для различных комбинаций параметров, таких, как их сумма, разность, отношение и т. д.?
3) можно ли получить (многомерные) доверительные области для нескольких параметров сразу?
Эти и близкие им проблемы излагаются в гл. 8 в аспекте дисперсионного анализа. Вопросы 1) и 2) мы коротко обсудим в этом разделе. Более глубокое рассмотрение, затрагивающее также вопрос 3), содержится в разделе 4.9.
4.5.1. ИНДИВИДУАЛЬНЫЕ ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ
Прежде всего мы приведем примеры индивидуальных доверительных интервалов для каждого из одномерных параметров, взяв дисперсию
и математическое ожидание семейства
[см. пример 4.5.1], а также каждый из трех параметров, рассматриваемых в теории линейной регрессии [см. пример 4.5.3].
Пример 4.5.1. Доверительные интервалы для дисперсии (или для стандартного отклонения)
распределения. Пусть
— выборка из нормального
распределения. Тогда при
статистика
несмещенная оценка
есть реализация случайной величины
, где
— независимые
случайные величины,
. Тогда величина
распределена по закону
, т. е. по закону
степенями свободы [см. раздел 2.5.4, II, раздел 11.4.11].
Для нее мы можем построить симметричный
-ный вероятностный интервал
, где
определяются так, чтобы
Значения
могут быть найдены по таблицам распределения
[см. приложение 6]. Тогда с вероятностью
или, что равносильно,
Это в свою очередь равносильно
Таким образом,
-ные доверительные интервалы для
следующие:
а для
В этом примере наличие второго неизвестного параметра
ничуть не изменило нашего вывода [ср. с примером 5.8.6]. Данные, представленные в табл. 4.5.1, связаны с эффективностью двух разных видов снотворного [см. Fisher (1970)-С]. Пациенты принимали каждый из этих препаратов через промежутки времени достаточно большие, чтобы можно было считать его действие независимым.
Таблица 4.5.1. (см. скан) Перепечатано с разрешения Macmillan Publishing Company из книги Statistical Methods foi Research Vorkers, 14th edition, by Sir Ronald A. Fischer, copyright 1970 University of Adelaide
Числа в последнем столбце могут рассматриваться как независимые наблюдения
над мерой сравнительной эффективности препаратов, за которую здесь взята разность их действия. Мы предполагаем, что
— распределены нормально с параметрами
, и берем
качестве оценки для
статистику
с
Итак, оценки для
есть
соответственно. Симметричный 95%-ный вероятностный интервал для
с 9 степенями свободы
следовательно, 95%-ный доверительный интервал для
т. е. (0,716, 5,044). Соответствующий интервал для
Пример 4.5.2. Доверительный интервал для математического ожидания нормального распределения.
а) Значение дисперсии известно. Этот случай рассмотрен в примере 4.2.1 для выборки
-ный доверительный интервал для
есть
, где х — среднее выборки.
б) Значение дисперсии неизвестно. Вот метод оценки «на скорую руку» с использованием стандартной ошибки: заменяем неизвестное значение а в
его оценкой
. В более общем случае предположим, что
— несмещенная оценка параметра в и выборочное распределение
приближенно нормальное; тогда, грубо говоря, 95%-ный доверительный интервал для
есть
где
означает стандартную ошибку в (т. е. подходящую оценку выборочного стандартного отклонения
. Это имеет некоторое отношение к методу наибольшего правдоподобия.
в) Значение дисперсии неизвестно. Вычисление точных доверительных интервалов с помощью распределения Стьюдента. Здесь возникает новое осложнение: мы ищем доверительный интервал для одного параметра
когда значение другого неизвестно. Эта задача была блестяще решена на основе идеи Стьюдента, которая состоит в исключении
с помощью процесса, известного теперь как «стьюдентизация». Если
выборка из
и
то величина
инвариантна относительно изменения значений
если о заменить на
то тем не менее
Удобнее использовать величину
которую называют величиной Стьюдента с
степенями свободы. Она имеет не зависящее от параметра
выборочное распределение [см. раздел 2.5.5] и, следовательно, является опорной для
.
Это распределение симметрично, и если а — значение, которое
не превосходит с вероятностью
то
-ный доверительный интервал для
есть
Значения а, соответствующие рассматриваемым
могут быть найдены из таблиц [см. приложение 5, ср. с примером 5.8.2]. Если, например,
, то число степеней свободы 9, и, взяв
мы получим для а значение 2,262. Если взять те же исходные данные, что в примере 4.5.1, то мы будем иметь
. Таким образом, 95%-ный доверительный интервал для
будет
или
Это показывает, что разница в действии лекарств существует: добавочное время сна после приема препарата В превышает время после приема препарата А в среднем на
(или, более точно, на
(с 95%-ной точностью)). Численные значения, использованные здесь, показаны на графике распределения Стьюдента на рис. 4.5.1.
Интуитивный подход, продемонстрированный в примере 4.1.1, находит применение и здесь: нужно только заменить плотность
Рис. 4.5.1. Плотность распределения Стьюдента с 9 степенями свободы
Рис. 4.5.2.
— неправдоподобно большое отрицательное значение величины
— слишком сильно превосходит
Аналогично
соответствует слишком малому значению
соответствует правдоподобному значению
нормального распределения из примера 4.1.1 на плотность распределения Стьюдента.
На рисунке 4.5.2 изображен график плотности распределения Стьюдента с 9 степенями свободы, при разных значениях,
Значение
для
и, следовательно, соответствующее значение
а именно
слишком маловероятно, чтобы можно было его принять. То же относится и к
. Значение
лежит в зоне больших значений плотности, так что
совместимо с исходными данными. Условная граница между «приемлемыми» и «неприемлемыми» значениями
-ной точностью) определяется точками
и
на рис. 4.5.1, где — квантиль уровня 0,025 и
— квантиль уровня 0,975 распределения Стьюдента с 9 степенями свободы. Эти значения следующие:
а доверительный интервал —
где
Пример 4.5.3. Простая линейная регрессия. Если пара случайных величин
имеет совместное распределение [см. II, раздел 13.1.1], то условное математическое ожидание
[см. II, раздел 8.9] называется регрессией
на X. Если
линейна по х, скажем,
, то мы имеем простую линейную регрессию. Если наблюдаемое значение У соответствующее заранее заданному значению
есть
, то удобно переписать формулу для
в виде