1.4. СОГЛАШЕНИЯ И ОБОЗНАЧЕНИЯ
Мы завершаем эту главу замечаниями, касающимися обозначений и других соглашений, которые используются в Справочнике. Некоторые из них стандартны, другие же требуют пояснения.
1.4.1. МАТЕМАТИЧЕСКИЕ СОГЛАШЕНИЯ
Логарифм: если не оговорено другое,
всегда означает
натуральный логарифм, логарифм по основанию е.
Символ принадлежности к множеству:
означает, что х — элемент множества (набора класса) [см. I, раздел 1.1].
Символ О: мы часто имеем дело со статистиками [см. определение
2.1.1], скажем
определенными по выборке объема
некоторые свойства которой могут быть выражены в виде
где
— некоторая функция, а
— ошибка, которая изчезает с ростом
Выражение
например, означает, что
имеет тот же порядок, что и
для больших значений
ведет себя, приблизительно как
для некоторой константы а. Аналогичный смысл имеет выражение
[см. IV, определение 2.3.3].
1.4.2. СТАТИСТИЧЕСКИЕ И ВЕРОЯТНОСТНЫЕ ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ
1. Сокращения
ф. р. — (кумулятивная) функция распределения [см. И, разделы 4.3.2, 10.3].
— распределение
как в
означает, что X и
имеют общее распределение.
с. с. — степени свободы [см. раздел 2.5.4].
н. о. р. — независимые и одинаково распределенные, как в н. о. р. величины
.
п. р. в. — функция плотности распределения вероятности, называемая также функцией частот. В этой книге мы используем выражение п. р. в. как для дискретных, так и для непрерывных распределений. Те, кто возражает против термина «плотность» для дискретного распределения, может интерпретировать п. р. в. как точечную
функцию распределения [см. II, разделы 4.3.1, 10.1].
с. в. — случайная величина, с. п. — случайная переменная [см. II, гл. 4].
~ (тильда) — распределено как. Итак,
означает, что распределение X есть нормальное с параметрами и ст. Некоторые читатели могут быть настроены против этого обозначения, потому что тильда используется в других разделах математики, например, для обозначения отношения эквивалентности [см. I, раздел 1.3.3], а также асимптотической эквивалентности [см. IV, определение 2.3.2]. Для других же удобство такого обозначения перевешивает возражения.
2. Обозначения стандартных распределений
Bernoulli
— распределение Бернулли с параметром (вероятностью) успеха
, т. е. распределение с.в. R с п.р.в.
[см. II, раздел 5.2.1].
— распределение
для которой
[см. II, раздел 5.2.2].
— распределение
Здесь а называют параметром масштаба, а
— параметром формы [см. II, раздел 11.3.1].
MVN — многомерное нормальное распределение [см. II, раздел 13.4].
— нормальное распределение с ожидаемым значением
и стандартным отклонением а. (Дисперсия есть
). Некоторые авторы используют поэтому обозначения
или
[См. II, 11.4.]
— распределение
для которой
[см. II, раздел 5.4].
— распределение
задаваемой для каждого х как
[см. II, раздел 10.7.1].
3. Соглашение об использовании прописных букв для обозначения случайных величин
Мы будем придерживаться следующей системы обозначений: прописные латинские буквы обозначают случайные переменные, а соответствующие строчные латинские буквы — их реализации (наблюденные значения). Итак, мы говорим о совокупности
наблюдений над с.в. X. В то же время иногда допустимы отклонения от этого правила, например использование
как имени соответствующего распределения.
Строгая приверженность к соглашениям — признак педантичности, и профессиональные статистики не всегда беспокоятся по этому поводу. Однако учащимся и тем, кто еще не стал специалистом, мы рекомендуем их придерживаться.
4. Обозначения для моментов и связанных с ними величин
Мы используем символ
для обозначения математического ожидания (ожидаемого значения) или
[см. II, гл. 8]. Применяются также варианты
. Наше сокращение для дисперсии X есть
; широко используются также символы
Для стандартного отклонения X мы используем
, для ковариации X и
, для коэффициента корреляции между X и
а для асимметрии
[см. II., гл. 9].
5. Нестандартные обозначения: индуцированные случайные величины, статистические копии
Совокупность взаимно независимых наблюдений
случайной величины X (т.е. выборку) можно рассматривать и как совокупность, составленную из наблюдения х, над некоторой случайной величиной
наблюдения
над некоторой случайной величиной
и т.д., где
считаются статистическими копиями X. Это значит, что они независимы и распределены одинаково, так же как распределена случайная величина X:
Утверждение
есть реализация
наблюденное значение)
может быть обращено. Итак, «X есть случайная величина, индуцированная
означает, что выборочное распределение [см. гл. 2] х есть distr. Так, статистика
(среднее значение выборки), которая принимает некоторое определенное численное значение для данной выборки, имеет выборочное распределение, которое может быть получено с помощью стандартных процедур из общего распределения
, а случайная величина, вероятностное распределение которой совпадает с этим выборочным распределением, является случайной величиной, индуцированной
Естественно обозначить ее символом
, где
— статистические копии X.
Говорить о выборочном распределении некоторой статистики, имея в виду вероятностное распределение соответствующей индуцированной случайной величины, столь же педантично по отношению к сказанному выше, сколь и использование различий в обозначениях между случайной величиной X и ее реализацией
в обоих случаях целью является ясность изложения.
6. Два смысла обозначения
вероятность А при условии К
Один смысл
есть «условная вероятность предложения (события) А при условии, что предложение В истинно» [см. II, раздел 6.5]. Тогда
обе вероятности
имеют смысл.
Однако мы часто используем
в смысле «вероятность предложения А, вычисленная в предположениях Н», обычно сокращая это до «вероятность А при Н», где Н является гипотезой. Например, пусть А — предложение
нормально распределенная случайная величина
где значение
неизвестно и Н есть гипотеза, что
Еще одна неоднозначность возникает при использовании выражений
или
где
случайная величина, распределение которой зависит от неизвестного параметра
означает вероятность получить значение
в качестве наблюдения. Эта выроятность зависит от параметра в. То же относится и к выражениям
и т.д. На практике обычно ясно из контекста, какой смысл подразумевается.
7. Номенклатура для табличных значений: процентные точки
В статистической практике часто необходимы таблицы функций различных вероятностных распределений. Для некоторых наиболее употребительных распределений доступны таблицы, которые можно назвать прямыми. Например, в приложении 3 приведена обычная таблица функции
стандартного нормального интеграла (стандартной функции нормального распределения), а в приложении 5 — аналогичная таблица для функции распределения Стьюдента. Однако с целью экономии места таблицы даны в обратной форме. Так, для стандартного нормального распределения таблицы обратной формы содержат значения и в зависимости от Ф (вместо
в зависимости от
), т.е. дается значение
такое, что
как, например, в приложении 4.
Для случайной величины
значение такое, что
называют верхней
-процентной точкой распределения
величину
такую что
называют нижней процентной точкой; при этом
Выражение «процентные точки» без уточнения «верхние» или «нижние» обычно означает «верхние процентные точки».
Процентные точки используются, например, в наиболее доступных таблицах распределения Стьюдента (но не в приведенных в Справочнике), а также в таблицах
и
-распределений [см. приложения 6,7].
Нижние процентные точки иногда называют квантилями (фрактилями). Специальный случай — нижний и верхний квартили, которые являются соответственно 25%-ным и 75%-ным квантилями; медиана же есть 50%-ная точка.
1.5. ЛИТЕРАТУРА ДЛЯ ДАЛЬНЕЙШЕГО ЧТЕНИЯ
(см. скан)