Глава 4. ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕ
4.1. ВВЕДЕНИЕ: ПРОБЛЕМА
4.1.1. СООБРАЖЕНИЯ, ОСНОВАННЫЕ НА ИНТУИЦИИ
В предыдущих разделах мы видели, что статистика
которая имеет допустимое выборочное распределение [см. раздел 2.2], может рассматриваться как оценка [см. раздел 3.1] параметра
плотности распределения случайной величины X [см. раздел 3.1].
Можно сказать, что доступная информация о значении параметра
содержится в выборочном распределении оценки, но ее трудно извлечь из-за того, что это распределение само зависит от неизвестного значения
(иная ситуация в случае байесовского подхода [см. раздел 15.4.2]).
Необходимо разработать метод, который позволил бы выразить вероятностную точность оценки с использованием лишь рассматриваемой статистики и без привлечения другой информации относительно истинного значения параметра. Естественным представляется следующий подход (в предположении, что такой метод существует).
Пример 4.1.1. Среднее выборки как оценка истинного значения. Предположим, что X — случайная величина, распределение которой
Среднее выборки х, определенное из выборки объема
является реализацией случайной величины X [см. определение 2.1,1], которая распределена по закону
. Изменения значения
сдвигают плотность распределения X, не меняя ее формы. Из возможных значений 6 (соответствующих функций плотности) рассмотрим три с наблюдаемым значением х. Это показано на рис 4.1.1.
В случае 1) наблюдаемое значение х лежит в зоне весьма малых значений плотности и с большой вероятностью значение
для величины
должно быть отвергнуто. То же относится и к
в случае 3). Напротив, в случае 2) наблюдаемое значение х лежит в зоне большой плотности вероятности, и гипотеза о значении
параметра
вполне совместима с наблюдениями. Очевидно, должны существовать значение
между
, и
а также значение
между
такие, что значения
между
представляются правдоподобными, а значения
вне этого отрезка — неправдоподобными. Однако насколько правдоподобными? И в каком смысле правдоподобными?
Рис. 4.1.1. Наблюдаемые значения среднего выборки и функции распределения для трех возможных значений
математического ожидания
Рис. 4.1.2. Нижняя
и верхняя
границы оснасти правдоподобных значений в при фиксированном значении среднего выборки
При байесовском подходе мы имеем вероятностное распределение величины
и можно принять за меру правдоподобия интервала
апостериорную вероятность того, что значение случайной величины
попадает в этот интервал. Этот подход развивается в гл. 15.
Р. Фишер предложил проводить оценивание в терминах «фи-дуциальной вероятности». Однако такой подход осложняется из-за отсу тствия единой точки зрения на само понятие фидуциальной вероятности [см., например, Kendall and Stuart (1973), т. 2, гл. 21-С].
Общепринятое небайесовское решение задачи - формализация следующей идеи: если значение
есть
— реализация нормальной случайной величины X с параметрами
то за наибольшее положительное отклонение, которое еще считается правдоподобным, от величины
принимается величина
такая, что
имеет малое фиксированное значение, определяемое по соглашению. Возьмем его, например, равным
;
тогда получим [см. приложение 4]
. Отсюда
Аналогично
Эти рассуждения приводят в конце концов к понятию доверительного интервала, которое рассматривается в разделе 4.2.