2.8. ИСПОЛЬЗОВАНИЕ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ В КАЧЕСТВЕ АППРОКСИМАЦИИ БИНОМИАЛЬНОГО РАСПРЕДЕЛЕНИЯ
Возникает небольшая проблема в связи с тем, что нормальное распределение оперирует с непрерывными случайными величинами, в то время как биномиальное и пуассоновское — с дискретными. Но ее можно легко решить при помощи поправочного коэффициента, называемого "поправка на непрерывность".
Например, при помощи биномиального распределения можно вычислить вероятность существования двух бракованных образцов в выборке, состоящей из
штук. Используя нормальное распределение как замену биномиального, мы делаем допущение, что значение дискретной случайной величины 2 является значением непрерывной случайной величины на промежутке от 1,5 до 2,5. Это и называется поправкой на непрерывность. Нормальное распределение, которое мы использовали, имеет ту же среднюю, и стандартное отклонение, что и обычное биномиальное распределение. Площадь, покрываемая кривой нормального распределения на промежутке от 1,5 до 2,5, представляет собой приблизительное значение дискретной вероятности появления двух бракованных образцов.
Замена распределений производится только, если обычное биномиальное распределение очень трудоемко и к тому же сеществуют определенные предпосылки. В 2.5 мы использовали распределение Пуассона как замену биномиального. Это было возможно, если
— велико,
— мало и
. Биномиальное распределение можно заменить нормальным, если пр, как и
больше 5, т.е.
должно быть большим,
больше 0,1, лучше всего около 0,5. Безусловно, указанные значения носят приблизительный характер. Тем не менее, чем больше
пр и
тем точнее замена.
Среднее и стандартное отклонение биномиального распределения имеют вид:
Эти величины используются для вычисления
при применении нормального распределения (как показано в 2.7).
Пример 2.14. Каждый день завод производит огромное количество чипсов, 40% из которых бракованные. Для проверки качества отбираются 20 образцов из. произведенных за день чипсов. Какова вероятность, что 14 или больше из 20 бракованные? Решение.
Произведем расчеты, используя обычное нормальное распределение:
Расчеты с заменой биномиального распределения нормальным чрезвычайно просты. Сначала проверим, можно ли произвести замену:
Полученные результаты показывают, что применение нормального распределения в качестве приближения биномиального распределения возможно.
Теперь произведем проверку на непрерывность. Дискретное значение, равное 14, заменяем непрерывной случайной величиной на промежутке от 13,5 до 14,5. Вместо того, чтобы находить вероятность дискретной величины 14 и более дефектов, мы найдем вероятность значения непрерывной случайной величины более чем 13,5 дефектов. Среднее нормального распределения:
, отсюда стандартное отклонение равно:
Рассчитаем значение z для 13,5:
(значение случайной величины на 2,51 стандартных отклонения больше среднего).
По таблице стандартного нормального распределения находим:
Следовательно,
Очевидно, что полученный с малыми затратами труда результат
дефектов
почти кичем не отличается от результата расчетов с биномиальным распределением
и более дефектов в выборке из 20 образцов)
Рис. 2.18. Вероятность того, что бракованных чипсов более чем 13,5
Пример 2.15. Рассмотрим пример замены биномиального распределения нормальным для определения вероятности пропорции (доли). Из прошлого опыта аудиторы
и Со
знают, что в среднем из 1000 бухгалтерских проводок 35 бывают с ошибками. Какова вероятность, что при ближайшей проверке ошибок будет больше
Решение.
В качестве иллюстрации результата см. рис. 2.19.
В данном случае доля ошибок в общем числе проводок является непрерывной случайной величиной и поэтому можно использовать нормальное распределение без поправки на непрерывность. Последствия применения поправки на непрерывность в такого рода задаче мы рассмотрим в примере 6.13 гл. 6.
Рис. 2.19. Вероятность доли ошибок
Вычислим значение z для р = 0,05:
(на 2,586 стандартных отклонения выше средней доли).
По таблицам стандартного нормального распределения вероятность равна:
Следовательно,