Глава 7. ОСНОВНЫЕ РЕЗУЛЬТАТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ
Выше изложены основные понятия теории вероятностей, включая набор моделей законов распределения, наиболее распространенных в теории и практике статистической обработки данных. Настоящая глава посвящена описанию некоторых связей, существующих между этими понятиями и моделями, а также отдельных их свойств, полезных для понимания сущности излагаемых далее методов вероятностно-статистического моделирования и первичной обработки данных.
7.1. Неравенство Чебышева
В п. 5.6.3 мы познакомились с основной характеристикой степени случайного разброса значений случайной величины — с ее дисперсией
. Из смысла этой характеристики следует, что вероятность зафиксировать при наблюдении случайной величины
значение, отклоняющееся от ее среднего
не менее чем на заданную величину
, должна расти с ростом
. Чем больше величина дисперсии
тем более вероятны значительные отклонения значений исследуемой случайной величины от своего центра группирования
. Конечно, зная плотность (или полигон) распределения вероятностей
можно точно вычислить вероятность событий вида
, а именно
Так, например, если
подчиняется
-нормальному закону распределения, то вероятность событий вида
зависит только от того, сколько раз в заданной величине отклонения А «уложится» среднеквадратическое отклонение
Однако хотелось бы уметь оценивать вероятности таких событий, опираясь только на знание величины дисперсии не обращаясь к точному знанию закона распределения анализируемого признака Именно эта задача и решается с помощью неравенства, выведенного русским математиком П. Л. Чебышевым:
где
Доказательство этого неравенства несложно:
случае дискретного признака доказательство проводится аналогично с заменой «элементов вероятностей»
вероятностями
, а интегралов — соответствующими суммами).
Из хода доказательствавидно, что если распределение исследуемого признака
симметрично (относительно
), то имеют место и односторонние аналоги неравенства:
Как и всякий общий результат, не использующий сведения о конкретном виде распределения случайной величины
, неравенство Чебышева дает лишь грубые оценки сверху для вероятностей событий вида
.
Так, например, если оценивать вероятность события
для нормального признака
не зная, что он подчиняется гауссовскому закону (т. е. используя неравенство Чебышева), то получим
Интересно сравнить эту величину с точным значением этой же вероятности, которое получается с помощью таблиц нормального распределения и равно 0,0027: мы видим, что точное значение вероятности в 40 (!) раз меньше ее грубой оценки, полученной на основании неравенства Чебышева.