4.4.1. Выборочное распределение выборочных средних
Предположим, что мы хотим узнать среднее значение некоторой характеристики генеральной совокупности, например, средний рост десятилетних детей, среднюю заработную плату конторских работников в текстильной промышленности или средний диаметр производимых стальных шайб. Эти генеральные средние могут быть оценены по выборке. Если исходная, или генеральная совокупность нормально распределена, то выборочное распределение выборочных средних также будет иметь нормальное распределение. Даже для ненормального распределения генеральной совокупности, если выборка большая по размеру
, выборочное распределение выборочных средних будет иметь приблизительно нормальное распределение. Этот очень важный вывод основан на центральной предельной теореме.
Это позволяет нам использовать здесь все идеи о нормальном распределении, стандартизованных таблицах и
величинах, сформулированных в 2.7.
По выборочному распределению мы можем вычислить среднее значение всех выборочных средних. Оно представляет собой математическое ожидание выборочной средней:
Если генеральная совокупность является нормальной, то математическое ожидание выборочной средней есть ни что иное как генеральная средняя
т.е.
Это равенство справедливо только в том случае, если формирование выборки производилось случайно. В этом случае средняя, полученная по выборочному распределению, называется несмещенной оценкой генеральной средней (средней по совокупности). Пример 4.2 показывает, что это может быть верно и для ненормальной совокупности.
О Пример 4.2. Обратимся к примеру 4.1. Выборочное распределение выборочных средних при
следующее:
Таблица 4.3. Вычисление
Математическое ожидание, полученное по выборочному распределению, составляет:
Данные совокупности: 4, 8, 12, 16, 20 и средняя по совокупности равна:
Следовательно, в нашем примере
Однако, как уже упоминалось, на практике мы бы не стали действительно строить выборочное распределение на основе многократного проведения выборок из одной и той же совокупности. Следовательно,
не может быть вычислено таким образом. Обычно мы располагаем данными только по одной единственной выборке. Но ввиду того, что нам известно, что
мы можем использовать единственную выборочную среднюю как несмещенную оценку генеральной средней:
где знак обозначает оцениваемую величину.
Надежность оценки будет детально обсуждаться ниже, но она может быть выражена через дисперсию выборочного распределения. Стандартное отклонение выборочного распределения представляет собой стандартную ошибку выборочного распределения, которое обозначается SE (Standard error). Стандартная ошибка выборочных средних обозначается как
Рис. 4.1. Нормальная генеральная совокупность
Для нормально распределенной генеральной совокупности стандартная ошибка выборочного распределения выборочных средних определяется по формуле:
где а — генеральная дисперсия.
Если генеральная совокупность велика по сравнению с размером выборки (обычно, если это соотношение
, то:
и стандартная ошибка становится равной:
Рис. 4.2. Выборочное распределение средних х при размере выборок
Если мы будем изменять размер выборки, то увидим, что средняя выборочного распределения не изменяется, так что
т.е. несмещенная оценка не зависит от размера выборки, тогда как
уменьшается при возрастании объема выборки (рис. 4.4).
Рис. 4.3. Нормальная генеральная совокупность индивидуальных значений
При вычислении стандартной ошибки выборочных средних мы предполагаем, что нам известна
(т.е. что известна генеральная дисперсия). Фактически же ее величина неизвестна, и нам необходимо как-то получить оценку генеральной дисперсии по выборке.
Рис. 4.4. Выборочные распределения средних х для выборок объема