Рис. 5.1. Выборочное распределение выборочных средних х для выборок объема
взятых из нормальной генеральной совокупности со средней величиной
и дисперсной
На рис. 5.1 показано выборочное распределение выборочных средних. Величины
расположены симметрично относительно генеральной средний величины. Площадь под кривой, ограниченная этими пределами, включает 95% выборочного распределения. Область ниже изгиба кривой до величины
включает 2,5% и область ниже изгиба кривой после величины
распределения. Следовательно, мы можем сказать, что выборочная совокупность
единиц, взятая из нашей исходной генеральной совокупности, с вероятностью 95% будет иметь среднюю величину, лежащую между
Средняя величина
со стандарной ошибкой
находится на расстоянии ниже генеральной средней
а средняя величина
находится на таком же расстоянии выше
Поскольку интервал между
включает 95% распределения, мы можем определить из таблицы нормального распределения, что
соответствует 1,96 стандартных ошибок выше средней
соответствует 1,96 стандартных ошибок ниже средней
Поэтому расстояние от
до
может быть записано как:
Обычно мы проводим всего одну выборку из генеральной совокупности; рассчитываем среднее значение выборки х и используем его для вывода о среднем
значении генеральной совокупности
из которой была взята выборка. На 95% мы уверены, что наше единственное значение х лежит между
Если х действительно попадает в интервал между и
то тогда
должно находиться где-нибудь в пределе:
Мы можем сказать, что уверены в этом на 95%. Следовательно,
является доверительным интервалом для среднего значения генеральной совокупности с вероятностью 95%. Если, например, х точно равно
то
находится правее точки
Если х меньше
то
не лежит в доверительном интервале. В этом случае мы выбрали одну из 5% выборочных совокупностей, для которой вывод, сделанный выше, неверен. Мы ограничились 95% выборочного распределения. Это был совершенно субъективный выбор. Может быть использован любой размер интервала и любая степень уверенности, что мы в нее попадем в зависимости от того, насколько мы хотим быть уверены, что среднее значение генеральной совокупности лежит внутри указанного интервала. Типичными являются 90%, 95% или 99%-ный доверительные интервалы. Какую бы величину мы не выбрали, построение доверительного интервала остается тем же. Единственная разница возникает в значении стандартизованной нормальной переменной
Следовательно, общая формула доверительного интервала для генеральной средней имеет вид:
где
— величина стандартизованной нормальной переменной, выше которой лежит
значений. Это дает
доверительный интервал.
Например, если нам требуется найти доверительный интервал с вероятностью 95%, то тогда
и доверительный интервал может быть записан как:
Если известно стандартное отклонение генеральной совокупности то, тогда стандартная ошибка распределения выборочных средних находится по формуле:
доверительный интервал для генеральной средней может быть записан как:
Пример 5.1. Импортер упаковывает чай в пакеты по
Известно, что наполняющая машина работает со стандартным отклонением
, равным
Выборка 50 пакетов
показала средний вес
Найти доверительный интервал для среднего веса а в генеральной совокупности с вероятностью 95%. Предположим, что пакеты чая распределены по весу.
Решение.
Доверительный интервал с вероятностью 95% для среднего значения генеральной совокупности находится по формуле:
где 1,96 является числом стандартных ошибок выше и ниже среднего значения для интервала, включающего 95% нормального распределения. Следовательно, доверительный интервал для генеральной средней находится как:
Мы на 95% уверены, что средний вес пачки чая в генеральной совокупности
находится между двумя значениями: 125,73 г. и 131,27 г. Интервал
составляет примерно
среднего веса пачки чая в выборке, который равен
Это не очень большое отклонение для данного примера. Следовательно, среднее значение выборки может считаться надежной оценкой среднего значения генеральной совокупности. Однако необходимо помнить, что в 5% случаев мы можем ошибиться и получить значение вне доверительного интервала.
Пример 5.2. Машина, которая упаковывает сахар, долгое время обеспечивала нормальное распределение веса в наполняемых пакетах. Стандартное отклонение веса а равнялось
Был установлен новый размер упаковок. Для контроля была проведена случайная выборка 20 новых пакетов. Средний вес пакетов в выборке
Предполагая, что переход на новую упаковку не повлиял на колебаемость наполняемости пакетов, найдем доверительный интервал для среднего веса упаковки в генеральной совокупности с вероятностью 99%.
Решение
Доверительный интервал для генеральной средней с вероятностью 99% находится следующим образом:
где
число стандартных ошибок выше и ниже среднего значения соответствует интервалу, который включает 99% нормального распределения. Тогда доверительный интервал с вероятностью 99% составит:
Мы на 99% уверены, что средний вес упаковки сахара
генеральной совокупности находится в пределах от
до
Размах в
составляет примерно ±0,1% среднего значения наполняемости в выборке (1002). 0,1% колеблемости в весе упаковки невелико, следовательно, среднее значение выборки
может считаться точной оценкой среднего значения генеральной совокупности. Следовательно, мы можем ошибиться в одном из 100 случаев и
может оказаться вне доверительного интервала.