4.1.3. ИНТЕРВАЛЫ ВЕРОЯТНОСТИ
а) Интервалы вероятности для непрерывных случайных величин. Полная информация о проведении случайной величины X может быть получена только при известном законе ее распределения [см. II, разделы 4.3, 10.1]. Часто необходим более простой способ выражения изменчивости. Удобным обобщающим понятием является интервал вероятности, определенный следующим образом.
Определение 4.1.1. Пусть X имеет нейрерывное распределение, зависящее от известного параметра
(или нескольких таких параметров), и пусть
— такие числа, что для заданного
или, иначе говоря,
где
— плотность и функция распределения величины X соответственно. Тогда интервал
(который зависит от
Рис. 4.1.3. Интервал
вероятностный интервал распределения, плотность которого задана графиком. Он является центральным
-ным интервалом, если площади под графиком левее а и правее
равны между собой (и равны
)
называется интервалом вероятности уровня
или иначе
-ным интервалом вероятности для X. (Отметим, что так как X — непрерывная случайная величина, определение не изменится, если выражение
будет заменено на любое из
Об интервале
можно сказать, что он содержит
часть всего распределения в том смысле, что при большом числе испытаний
часть чисел выборки будет попадать в него. Это утверждение иллюстрирует рис. 4.1.3 для унимодального распределения.
Смысл утверждения, подсказанный интуицией, заключается в том, что если
велико (скажем, 0,95 или 0,99), то можно быть «почти уверенным», что любая реализация X попадет в интервал
Здесь
— любые числа, такие, что
— функция распределения X).
Если X — дискретная случайная величина, то такие
вообще говоря, не могут быть определены точно, поэтому необходима соответствующая модификация определения (см. пример 4.1.3].
Пример 4.1.2. Интервалы вероятности для стандартного нормального распределения. Если
(т.е.
), то вероятностный интервал для
уровня 0,95 — это любой интервал
такой, что
где
— функция стандартного нормального распределения. Примеры таких интервалов, полученных из таблиц
[см. приложение 3, 4], следующие:
Соответствующие интервалы для
Как видно из этих примеров, уровень интервалов вероятности однозначно не определяет их границ. Чтобы достигнуть однозначности, необходимо ввести дополнительные ограничения, а именно: 1) либо
интервал должен иметь минимальную длину, 2) либо он должен быть центральным или симметричным в том смысле, что
Для симметричного унимодального распределения [см. II, раздел 10.1.13] эти условия эквивалентны. В случае унимодального несимметричного распределения можно определить наименьший вероятностный интервал с помощью условия равных ординат, т. е. для данного Р вероятностный интервал
будет кратчайшим, когда
, где
— плотность распределения X. Таблицы плотностей распределения часто недоступны (в отличие от таблиц функций распределения), и поэтому приходится работать непосредственно с условием симметричности. В этом случае для вероятностного интервала уровня
значения
для примера 4.1.1 можно найти как нижнюю и верхнюю
точки распределения X.
Пример 4.1.3. Вероятностные интервалы для Т-образного распределения. Экспоненциальное (показательное) распределение с плотностью
при
[см. II, раздел 10.2.3] имеет монотонно убывающую плотность, и следовательно, условие равных ординат здесь не применим о. Ясно, впрочем, что в этом случае для любого
кратчайшим вероятностным интервалом уровня
будет интервал
где
выбирается из условия
что с учетом равенства
дает
. Таким образом, кратчайшим 95%-ным вероятностным интервалом будет
. Симметричным вероятностным интервалом уровня 0,95 будет интервал
где для
выполняются соотношения
откуда
б) Вероятностные интервалы для дискретных случайных величин. Для непрерывной случайной величины X интервал
будет интервалом вероятности уровня
если
или, что равносильно,
Это действительно одно и то же, так как в непрерывном случае
Однако это, вообще говоря, перестает быть верным при дискретном X. Возьмем, к примеру, в качестве X величину, распределенную по пуассоновскому закону. Пусть
— положительные целые числа. Тогда
, что очевидно,
Чтобы избежать неопределенности, в дискретном случае мы будем называть
замкнутым интервалом вероятности и уровня
для X, если
интервала этого вида с
мы находим из таблиц распределения значение
такое, что
при
а значение
такое, что
при
Тогда
Необходимо иметь в виду, что иногда таблицы дают значения вероятностей вида
(так построены, например, таблицы биномиального распределения в приложении 1). Диаграмма типа изображенной на рис. 4.1.4 поможет разобраться в ситуации. Для иллюстрируемого случая (биномиальное распределение с
квазисимметричный интервал уровня не менее 95% на самом деле является интервалом уровня 96,2%.