3.3.3. Выборочное распределение среднего в случае, когда дисперсия неизвестна
Для того чтобы определить вероятностные границы для среднего нормальных случайных величин, нужно знать а — стандартное отклонение популяции. Если о неизвестно, то невозможно сделать точные вероятностные утверждения, используя выборочное распределение X, так как вероятностные границы будут зависеть
от неизвестного значения
. В таком случае говорят, что а является мешающим параметром.
Чтобы построить вероятностные интервалы для среднего, когда а известно, естественно рассмотреть случайную величину
Эта случайная величина распределена как
и поэтому вероятностные интервалы можно получить из табл. 3.2.
Важный шаг вперед в теории выборочных распределений был сделан в 1908 г. Госсетом, писавшим под псевдонимом Стьюдент. Он показал, что если а заменить в (3.3.11) на случайную величину
где
определяется выражением (3.3.7), то распределение случайной величины
не будет зависеть от мешающего параметра
. Следовательно, вероятностные утверждения относительно среднего нормальных наблюдений можно сделать независимо от того, каково значение а. Этот результат интуитивно очевиден, так как если бы наблюдения были умножены на некоторую константу (например, если бы наблюдения производились в сантиметрах вместо метров), то и числитель и знаменатель в (3.3.12) умножились бы на эту же константу, так что
осталось бы тем же самым.
Плотность вероятности случайной величины
называется t-распределением Стьюдента с
степенями свободы и, подобно нормальной плотности, она симметрична относительно начала координат. Влияние замены о в (3.3.11) на
как это сделано в (3.3.12), выражается в том, что изменчивость случайной величины
возрастает, и, следовательно,
-распределение Стьюдента более размыто, чем нормальное распределение. Однако, по мере того как
увеличивается, распределение
все более и более концентрируется около а, и поэтому
-распределение стремится к стандартному нормальному распределению (3.2.8), как это вновь следует из центральной предельной теоремы.
-распределение Стьюдента можно использовать для построения интервалов
в которые можно ожидать попадания случайной величины
части всех случаев. Так как плотность вероятности симметрична, то
и поэтому
Рис. 3.11 показывает кривые
в зависимости от
для
Заметим, что для больших
кривые стремятся
к значениям 1,96 и 2,58, являющимся
-ной и
-ной границами для нормированной нормальной плотности вероятности.
Чтобы проиллюстрировать использование кривых на рис. 3.14, предположим, что нужно произвести, как и в примере разд. 3.3.1, 9 измерений из
-популяции.
Рис. 3.11. Графики зависимости
от
для (1—а)
Тогда, согласно рис. 3.11, следует ожидать, что случайная величина
будет лежать в интервале
в 95% случаев. Заметим, что соответствующий интервал в случае известного а, найденный из табл. 3.4, есть
Этот интервал примерно на 15% уже.