1.3.2. Математические ожидания и моменты
Возможно, наиболее важной величиной, связанной со случайной переменной является ее среднее значение, или среднее, или математическое ожидание, которое будет обозначаться как Среднее значение получается путем взвешивания каждой величины связанной с ней вероятностью и путем интегрирования по области значений Таким образом,
при условии, что интеграл существует. В более общем случае, если является случайной переменной, любая функция от является сама по себе случайной переменной, и тогда среднее значение, если оно существует, определяется выражением
Среди функций от представляющих особый интерес, — степенные функции для которых
где или известны как -тый момент х. Среднее которое, конечно же, является первым моментом часто оказывается наиболее важным моментом, в то время как высшие моменты в общем случае менее важны. Целесообразно заметить, что если не уменьшается слишком быстро с ростом х при больших то некоторые из моментов могут вообще не существовать. Примером служит плотность вероятности Коши
все моменты которой расходятся.
Когда случайная переменная принимает только целые значения с вероятностями можно определить моменты с помощью формулы
Однако другой тип момента, определяемый с помощью выражения
и известный как факториальный момент величины иногда бывает проще для целых переменных. В последующих определениях мы ограничимся непрерывными переменными для того, чтобы избежать повторения.
Выражение (1.3.22) определяет моменты от в окрестности начала координат но часто более полезно иметь дело с моментами в окрестности другого значения, такого, как среднее В таком случае они называются центральными моментами, и мы будем обозначать их как
Разница между и его средним значением известна как отклонение
так что можно записать На основе определения для первого центрального момента имеем но высшие центральные моменты являются в общем случае ненулевыми, хотя плотность вероятности которая симметрична относительно его среднего, будет иметь нулевые нечетные центральные моменты. Второй центральный момент известен как дисперсия. Она нужна для того, чтобы определить эффективную ширину плотности вероятности Дисперсия всегда является неотрицательной и обращается в нуль только в особом случае, когда является дельта-функцией, т.е. когда исход полностью определен. Квадратный корень от дисперсии известен как среднеквадратичное отклонение или стандартное отклонение а и, подобно дисперсии, оно является мерой разброса, имеющей ту же размерность, что и среднее Стандартное отклонение иногда используется для нормировки высших моментов Например, отношение
которое может быть как положительным, так и отрицательным, известно как коэффициент асимметрии; оно характеризует безразмерную меру асимметрии плотности вероятности и является безразмерным (см. рис. 1.4). Подобно этому, безразмерное отношение
которое известно как эксцесс, удобно для определения различия в распределениях вероятности; например, вытянутого и узкого распределения от низкого и широкого (см. рис. 1.5). Это отношение, как мы еще увидим, имеет значение 3 для гауссовского распределения, играющего центральную роль в теории вероятностей.
Рис. 1.4. Распределения вероятности с положительной, нулевой и отрицательной асимметриями
Рис. 1.5. Распределения вероятности с эксцессом, большим или меньшем, чем три, или равным трем
Выполняя биноминальное разложение под знаком интеграла в выражении (1.3.26) и интегрируя почленно, получим следующее соотношение между обычными и центральными моментами
В частности, дисперсия определяется выражением
Первый и второй моменты характеризуют наиболее важные особенности распределения вероятности. Иногда удобно перейти от переменной к новой переменной у
которая обладает таким свойством, что ее среднее равно нулю, а ее среднее квадратичное отклонение равно единице. Говорят, что новая случайная переменная у находится в стандартной форме, и расчеты зачастую упрощаются с помощью этого преобразования.
Моменты также могут быть определены совместно для различных случайных переменных Если является совместной плотностью вероятности для то центральный момент порядка определяется математическим ожиданием
В частности, для двух случайных переменных имеются три различные дисперсии: последняя известна как ковариация. В качестве альтернативного обозначения, обычно используемого для того, чтобы различать случайные переменные, выступает индексация. Тогда случайные переменные имеют вид а ковариантность между записывается в виде
Ковариации можно рассматривать как элементы симметричной -матрицы, известной как матрица ковариантности, диагональные элементы которой являются дисперсиями Из неравенства Шварца видно, что
где мы записали и т.д. для стандартного отклонения Нормированная величина
известна как коэффициент корреляции; она ограничена значениями Говорят, что две случайные переменные, корреляционные коэффициенты которых равны +1 или —1, будут или полностью коррелированными, или полностью антикоррелированными, соответственно. Например, если где реальные числа, то ясно, что флуктуируют вверх и вниз вместе, когда число а положительно, и флуктуируют в противофазе, когда а отрицательно. При коэффициент корреляции легко
находится по формуле и равен +1 или —1, так что в этом случае являются полностью коррелированными или антикоррелироваными. В противоположность этому заметим, что если являются статистически независимыми, поскольку
Путем обобщения этого же аргумента можно легко показать, что если являются статистически независимыми случайными переменными, то
В этом случае матрица ковариантности является диагональной.
На практике часто встречаются линейные комбинации статистически независимых случайных переменных Пусть у — новая случайная переменная, определяемая как
где коэффициенты представляют собой произвольные действительные числа, а являются независимыми. Тогда из определения
и из выражения (1.3.36) вытекает, что
И, наконец, мы отметим, что средние и моменты могут быть также введены для комплексных случайных переменных путем очевидного обобщения выражений (1.3.21) и (1.3.22). Если являются комплексными случайными переменными, матрица ковариантности является эрмитовой и определяется формулой
Тогда коэффициент корреляции определяемый выражением (1.3.35), является комплексным, но стандартные отклонения являются по-прежнему действительными; причем модуль ограничен единицей.