2.1.2. МОМЕНТЫ
а) Моменты генеральной совокупности. Важным множеством постоянных величин, связанных со случайной переменной и ее распределением вероятностей, оказывается множество моментов генеральной совокупности [см. II, раздел 9.11]. Моментом порядка случайной переменной X называют величину
Моментом первого порядка будет просто математическое ожидание X, часто обозначаемое символом
К моментам относят также и центральные моменты
Центральный момент первого порядка тождественно равен нулю. Центральным моментом второго порядка является дисперсия (мера изменчивости). Момент третьего порядка связан с асимметрией (мерой асимметрии). Коэффициент асимметрии X определен как
Центральный момент четвертого порядка связан с кривизной п.р.в. вблизи ее максимума. Для центральных моментов более высокого порядка нет непосредственной интерпретации.
Возможны очевидные обобщения на случай многомерных распределений. Например, для генеральной совокупности, каждый из членов которой обладает двумя интересующими нас признаками, такими, как рост и вес, обратимся к паре случайных переменных, например реализации которых представляют пары (рост, вес) членов совокупности. Вероятностное поведение X и описывается их совместным распределением вероятностей.
Двумерные моменты (или моменты произведений) этого распределения задаются величинами
а центральные моменты определяются как
Наиболее важным среди этих смешанных моментов является ковариация, определяемая как
Ее нормированная версия
называется коэффициентом корреляции величина которого при подходящих обстоятельствах будет мерой связи между X и Y. Здесь .
б) Моменты выборки. Выборочными аналогами теоретических моментов (моментов генеральной совокупности) являются моменты выборки. Для выборки момент порядка определяется как
Если выборка задается в виде таблицы частот, а именно, если — список возможных различных наблюдаемых значений — частоты, с которыми они появляются в выборке, то
где
есть объем выборки.
Аналогично получаем центральные моменты выборки, известные также как моменты выборки относительно среднего, задаваемые в виде
где
есть среднее по выборке. Соответствующее выражение для таблицы частот имеет вид
Соотношение между моментами выборки относительно среднего и относительно начала отсчета. Моменты выборки относительно среднего связаны с соответствующими моментами относительно начальной точки следующими соотношениями:
Моменты выборки порядка являются оценками соответствующих моментов генеральной совокупности хотя и не обязательно наилучшими.
В пункте в) обсуждается второй момент выборки.
в) Дисперсия выборки и стандартное отклонение выборки. Момент второго порядка выборки относительно среднего представляет собой один из вариантов дисперсии выборки. Однако более часто последняя определяется как
или, эквивалентно, в случае таблицы частот
Положительное значение квадратного корня из этого выражения называют стандартным отклонением выборки из наблюдаемой переменной.
Идея взять делитель в виде вместо подкрепляется одним или несколькими из следующих аргументов:
1) смещение: — несмещенная оценка дисперсии генеральной совокупности; это означает, что среднее большого числа выборочных значений приближается к когда становится сколь угодно большим [см. раздел 3.3.2]. В противоположность этому следует сказать, что не является несмещенной оценкой а [см. раздел 2.3.5];
2) имеет смысл при когда равно единице, не определено. Именно это требуется от выборочной оценки так как при объеме выборки, равном единице, нет информации относительно изменчивости (разброса). Однако значение обращается в нуль. Это не слишком хорошая оценка для
3) «не раскачивайте лодку»: в стандартных процедурах оценивания и проверки гипотез и в соответствующих таблицах применяется делитель [см., например, раздел 2.5.5];
4) степени свободы: сумму квадратов можно выразить в виде суммы квадратов алгебраически независимых переменных: другими словами, квадратическая форма имеет степеней свободы (или ранг порядка ). В результате становится и логически привлекательно, и удобно по алгебраическим мотивам делить на
г) Двумерные выборки. В выборке из двумерной генеральной совокупности, где обозначает, например, рост, а — вес индивида в выборке, выборочная ковариация определяется как
где . В случае таблицы частот это выражение заменяется на
По причинам, аналогичным тем, которые перечислены применительно к выборочной дисперсии в пункте 1), более принята оценка ковариации генеральной совокупности не в виде а в виде
В общем случае смешанный момент порядка для двумерной выборки записывается в виде
а соответствующие центральные моменты в виде
В особом случае, когда оказывается, что
Эти величины являются маргинальными центральными моментами порядка для значений х и маргинальными центральными моментами порядка 5 для значений у. Для таблицы частот необходимо изменить эти формулы очевидным образом (2.1.11)]. Коэффициент корреляции. Нормированная версия
выборочной ковариации называется выборочным коэффициентом корреляции (моментным), или (иногда) коэффициентом корреляции К. Пирсона. Она является оценкой коэффициента корреляции генеральной совокупности. Отметим, что выражение
где — выборочная дисперсия (2.1.13) значений х, а — выборочная дисперсия значений у, эквивалентно выражению (2.1.19).