приближенно равную в соответствии со свойством б) величине
. Таким образом, по своему смыслу значения функции
пропорциональны вероятности того, что исследуемая случайная величина примет значение где-то в непосредственной близости от точки
Рис. 5.5. Функции (а) распределения
и (б) плотности
; нормального закона
Этот факт, в частности, может служить основанием к тому, что дискретным аналогом функции плотности в случае дискретной случайной величины является полигон частот, т. е. последовательность точек с координатами
. Отсюда же следует, что наиболее вероятным (модальным) значением исследуемой непрерывной случайной величины является такое ее возможное значение
, в котором функция плотности достигает своего максимума, т. е.
Геометрическая интерпретация свойства г) состоит в том, что вероятность события
оказывается (при любых заданных
) равной площади «столбика» под кривой плотности
с основанием
На рис. 5.5 показаны функции распределения
и плотности
одного из распространенных законов распределения — нормального (подробнее см. § 6.1 и 7.3). Заштрихованная площадь на рис. 5.5, б дает геометрически наглядное представление о величине вероятности
Располагая лишь выборочными данными (выборкой)
мы должны суметь составить по ним приближенное представление о неизвестной теоретической функции плотности Если нас интересует малый отрезок
и мы подсчитали, что в этот отрезок попало
наблюдений нашей выборки, то, очевидно, выборочным аналогом величины
будет величина
Очевидно, значение
характеризует плотность наблюдений исследуемой случайной величины в окрестности точки
т. е. относительную частоту этих наблюдений, приходящуюся на единицу длины интервала ее возможных значений. Поэтому функцию
определенную соотношением (5.8), называют эмпирической (или выборочной) функцией плотности. Это же обстоятельство может служить основанием выбора такой терминологии и применительно к теоретической плотности
так как в соответствии со свойством статистической устойчивости частот (см. § 7.2) эти две характеристики неограниченно сближаются в процессе увеличения объема выборки
и сужения длины интервала
Для построения эмпирической функции плотности
на всей области ее определения (т. е. для всех возможных значений исследуемой величины) используют предварительно сгруппированные данные (см. п. 5.4.2) и полагают
где
— порядковый номер того интервала группирования, который накрывает точку
как и прежде, число наблюдений, попавших в этот интервал, и его длина соответственно. Геометрическое изображение таким образом определенной эмпирической функции плотности носит название гистограммы.
Пример 5.2. Объект (совокупность единиц) обследования — 995 телефонных абонентов города Буффало, штат Нью-Йорк.