6.7. СРАВНЕНИЕ СРЕДНИХ ВЕЛИЧИН ДВУХ ВЫБОРОК ПРИ ИЗВЕСТНЫХ ГЕНЕРАЛЬНЫХ ДИСПЕРСИЯХ
В разделах 6.3-6.5 мы имели дело с одной выборкой и оценивали, взята ли она из нормальной генеральной совокупности. Теперь мы будем рассматривать ситуации, в которых имеются две выборочные совокупности. Нужно определить, взяты ли они из нормальных генеральных совокупностей с равными средними. Например, если аудитора удовлетворяет качество бухгалтерского учета в компании, он может взять выборку счетов для оценки величины ошибки в генеральной совокупности. Если система учета продолжает действовать исправно, то вторая выборка должна дать оценку величины ошибки генеральной совокупности, которая незначительно отличается от первой.
Подобным образом случайная выборка даст возможность оценить среднюю наполняемость соусом бутылок в генеральной совокупности. Если процесс разлива и дальше функционирует исправно, то последующие выборки не должны дать
оценки средней наполняемости, которые бы значительно отличались от предыдущих. Это очень важный аспект для контроля качества.
В обоих примерах, резонно заключить, что дисперсия генеральной совокупности остается той же. Однако, если мы рассматриваем две различные производственные линии наполнения соусом бутылок, то можем взять выборку из каждой линии для того, чтобы увидеть имеется ли значительная разница между средней наполняемостью генеральных совокупностей одной и другой линий. В этом случае нет основания предполагать, что две генеральных дисперсии равны между собой.
При неизвестных дисперсиях генеральных совокупностей процедура испытания гипотез зависит от того, предполагается ли равенство дисперсий или нет. Однако форма нулевой гипотезы остается той же во всех случаях. Для испытания гипотезы по двум выборочным средним нулевая гипотеза предполагает, что две выборочные совокупности взяты из генеральных совокупностей с равными средними.
т.е. генеральные средние равны между собой.
Создается новая переменная, которая является разницей между выборочными средними
и сравнивается с предполагаемой разницей между генеральными средними, то есть
. Если разница между выборочными средними незначительно отличается от нуля, то мы можем предположить, что нулевая гипотеза приемлема. Если разница значительно отличается от нуля, то можем предположить, что нулевая гипотеза не приемлема.
Если
и известны, то проверочная статистика следует нормальному распределению и находится следующим образом:
где:
Пример 6.10. Компания по производству сахарного песка имеет две производственные линии для наполнения мешочков сахарным песком по 1 кг
Используя данные, собранные в течение долгого периода времени, управляющий оценивает генеральное стандартное отклонение веса мешочков, поставляемых с линии 1 в 0,02 кг
и с линии 2 в 0,04 кг
Из линии 1 была взята случайная выборка объемом
мешочков и найден средний вес содержимого в мешочках
кг. Подобная выборка объемом
мешочков была взята из линии 2 и найден средний вес
к 0,989 кг. Имеется ли какое-нибудь основание предположить, что две производственные линии развешивают сахарный песок по мешочкам, средний вес которых отличается?
Решение
Нулевая гипотеза предполагает, что две выборочные средние согласуются с выборочными совокупностями, взятыми из нормальных генеральных совокупностей с одинаковой генеральной средней.
Из
следует выбор испытания с двумя границами.
Поскольку генеральные дисперсии
известны, мы испытываем разницу между выборочными средними, используя нормальное распределение. Проведем испытание на
-ном уровне значимости. Из таблиц стандартного нормального распределения в Приложении 2 находим граничную величину для
Рис. 6.11. Критические значения
для 1%-ного уровня аначимости
Проверочная статистика равна:
где
Отсюда
Поскольку
результат не существенен на 1%-ном уровне, т.е. нет основания отклонять
Мы предполагаем, что две производственные линии наполняют мешочки сахаром с одинаковым средним весом.
Пример 6.11. Несколько сезонов садовник выращивал два сходных сорта крыжовника. Сбор урожая фактически был одинаков для обоих сортов с дисперсией
для сорта А и дисперсией
для разновидности В. Затем он решил использовать новый участок для выращивания крыжовника, но он не знает, будут ли почвенные условия воздействовать одинаково на оба сорта. Для эксперимента садовник посадил 30 кустов
каждого сорта на новом участке. Сорт А дал урожай в среднем 3,0 кг
с куста, в то время, как урожай сорта В составил в среднем 3,5 кг
с куста. Есть ли какое-нибудь основание предполагать, что на новом участке сорт В имеет больший, в среднем, урожай, чем сорт А?
Решение.
Нулевая гипотеза предполагает, что две выборочные совокупности взяты из нормальных распределений с одинаковой генеральной средней:
Это означает, что мы должны провести испытание с одной границей.
Поскольку генеральные отклонения известны, мы испытываем разницу между выборочными средними, используя нормальное испытание. Будем испытывать на 5%-ном уровне значимости. Из таблицы нормального распределения в Приложении 2 находим граничную величину для
равную 1,645. Проверочная статистика находится по формуле:
где
Отсюда
Рис. 6.12. Критическое ашпеше величины
на 5%-ном уровне значимости
Поскольку:
результат существенен на 5%-ном уровне. Имеется достаточно сильное основание для утверждения, что выборочные характеристики не согласуются с
. Мы отклоняем
и принимаем
Вероятность получения разницы в значениях выборочных средних в 0,05 кг или более из-за случайностей выборки, меньше, чем 5%. Мы делаем вывод, что сорт В дает на новом участке больший урожай, чем сорт А.