где
— минимально возможное значение исследуемой случайной величины
(оно может быть равно и
),
— любое «текущее» (т. е. задаваемое нами) возможное значение
. Вероятность же
однозначно определяется заданием правого конца интервала, т. е. числа
а потому может интерпретироваться как обычная функция от одного числового аргумента
Функцией распределения вероятностей (накопленной частотой)
случайной величины
называют функцию, ставящую в соответствие любому заданному значению
величину вероятности события
т. е.
В дальнейшем, если это не будет вызывать недоразумении, будем опускать нижний индекс
у функции F и называть ее просто «функцией распределения».
Рассмотрим поведение функции распределения. Во-первых, отметим, что в дискретном случае событие
состоит из всех элементарных событий
таких, что
Поэтому в соответствии с определением вероятности составного события (см. п. 4.1.3) имеем
(суммирование в правых частях (5.5) проводится по всем тем i, для которых
Из (5.5) видно, что значения функции
изменяются при увеличении аргумента
скачками, а именно при «переползании» величины
через очередное возможное значение
функция
скачком увеличивает свое значение на величину
Несколько иную картину мы будем наблюдать, анализируя поведение функции распределения
в случае непрерывного исследуемого признака
. Подавляющее большинство представляющих практический интерес непрерывных случайных величин обладают тем свойством, что для любого отрезка
вероятности
стремятся к нулю по мере стремления к нулю длины этого отрезка, и, следовательно, вероятности принятия отдельных возможных значений
равны нулю (конкретный пример такого рода приведен в п. 4.2.2 в задаче с экспертным оцениванием вероятности интересующего нас события). Нетрудно понять, что для таких случайных величин их функции распределения оказываются непрерывными.
На рис. 5.4, а-г представлены графики функций распределения случайных величин, рассмотренных соответственно в примерах 4.1, 4.2, 4.5 (с учетом табл. 5.2) и в примере с экспертным оцениванием вероятности интересующего нас события (п. 4.2.2).
Рис. 5.4. Графики функций распределения для: а — оцифрованного результата подбрасывания монеты (нуль соответствует аверсу, единица — реверсу); б — числа очков, выпадающих при бросании правильной игральной кости; в — числа дефектных изделий, обнаруженных в наугад выбранной партии, состоящей из 30 изделий (см. табл. 5.2); г — экспертной оценки вероятности интересующего нас события (при полной некомпетентности экспертов), см. примеры п. 2.1.3 и 4.2.2
Из определения функции распределения непосредственно вытекают следующие ее основные свойства:
а)
— неубывающая функция аргумента х;
б)
для всех
в)
для всех
— соответственно минимальное и максимальное возможные значения исследуемой случайной величщсы
);
г)
для любых заданных значений а и b (для доказательства последнего свойства следует воспользоваться теоремой сложения вероятностей (см. п. 4.1.3), а также тем обстоятельством, что события
связаны между собой соотношением
.
В практике статистической обработки данных точный вид функции распределения, как правило, бывает неизвестен. Эмпирическим (или выборочным, т. е. построенным по выборке объема
) аналогом теоретической функции распределения
является функция
определяемая соотношениями:
или, в случае группированных данных (см. п. 5.4.2),
где
— число наблюденных значений исследуемой случайной величины в выборке
меньших
— число наблюденных значений в выборке, попавших в
интервал группирования,
— номер самого правого из интервалов группирования, правый конец которых не превосходит
. Из определения эмпирической функции распределения непосредственно следует объяснение часто используемого ее другого названия — «накопленная частота». Свойство статистической устойчивости относительных частот (см. § 7.2) является основанием использования
в качестве приближенного значения неизвестной теоретической функции распределения
и того факта, что по мере роста объема выборки (т. е. при
) ошибка этой аппроксимации неограниченно убывает. Такая оценка
значений
, т. е. оценка, не связанная с предварительным выбором общего модельного вида этой функции, называется непараметрической. Более подробные сведения, относящиеся к статистическому изучению эмпирических функций распределения, даны в § 10.3 и 11.1.