§ 112. Определение корреляционных моментов случайных величин
Моменты случайных величин представляют собой математические ожидания некоторых функций случайных величин. Поэтому на основании закона больших чисел оценками моментов случайных величин могут служить средние арифметические полученных в результате
опытов значений соответствующих функций случайных величин. Пользуясь этими оценками, можно определить все интересующие нас моменты случайных величин. Точность определения моментов случайных величин этим способом можно оценить совершенно так же, как в предыдущем параграфе мы оценили точность определения дисперсии. Никаких принципиальных затруднений при этом не возникает. Однако при практическом определении моментов случайных величин по результатам опытов следует иметь в виду, что точность определения моментов ухудшается по мере роста порядка моментов. Поэтому, для того чтобы экспериментально определить моменты выше второго порядка, необходимо, чтобы число опытов было очень большим. Как показывает формула (111.19), относительная погрешность определения дисперсии случайной величины X по формуле (111.11) характеризуется средним квадратическим отклонением
Следовательно, для определения дисперсии с относительным средним квадратическим отклонением 20% необходимо произвести 51 опыт. Для того чтобы определить дисперсию с относительным средним квадратическим отклонением 5%, необходимо произвести 801 опыт. Для определения с соответствующей точностью моментов высших порядков необходимо еще большее число опытов. Поэтому в тех случаях, когда число опытов невелико, приходится ограничиваться определением математических ожиданий и моментов второго порядка случайных величин. В предыдущем параграфе мы рассмотрели вопрос об определении дисперсий случайных величин. Для того чтобы закончить с вопросом определения моментов второго порядка, остается рассмотреть оценки корреляционных моментов случайных величин.
Пусть значения случайных величин полученные в результате независимых, произведенных в одинаковых условиях опытов. Тогда, согласно сказанному выше, для определения корреляционного момента случайных величин можно воспользоваться формулой
Так как при определении корреляционного момента случайных величин их математические ожидания обычно бывают неизвестными, то их заменяют соответствующими средними арифметическими:
В результате получаем следующую оценку корреляционного момента
случайных величин X, Y:
Эта формула дает смещенную оценку корреляционного момента. Для того чтобы убедиться в этом, вычислим математическое ожидание случайной величины
где
а через обозначены случайные значения, которые принимают случайные величины в результате опыта. Так как математические ожидания случайных величин согласно (111.3), равны нулю, то величина представляет собой корреляционный момент двух линейных функций случайных величин
где индекс сверху знака суммы, так же как в предыдущем параграфе, показывает, что слагаемое с индексом должно быть при суммировании пропущено. Применяя для вычисления корреляционного момента формулу (20.22), найдем:
Из формул (112.4) и (112.7) следует, что
Таким образом, формула (112.3) дает смещенную оценку корреляционного момента.
Для того чтобы получить несмещенную оценку корреляционного момента случайных величин достаточно ввести в правую часть
формулы (112.3) поправочный множитель Тогда получим:
Для оценки точности вычисления корреляционного момента по формуле (112.9) вычислим дисперсию случайной величины
На основании формулы (10.9) можем написать, учитывая, что оценка (112.10) является несмещенной:
Но из (112.10) следует, что
Следовательно, для оценки точности определения корреляционного момента по формуле (112.9) необходимо знать моменты четвертого порядка случайных величин
Если случайный вектор распределен нормально, то -мерный случайный вектор с составляющими также распределен нормально, так как его составляющие являются линейными функциями нормально распределенных случайных величин В этом случае для вычисления моментов четвертого порядка можно воспользоваться формулой (29.8). В результате получим:
Из входящих в эти формулы моментов второго порядка ранее не были вычислены только корреляционные моменты случайных Величин с различными индексами Эти
моменты найдем, применяя формулу (20.22) к линейным функциям (112.6) случайных величин
Пользуясь формулами (111.9), (111.16), (112.7) и (112.14), приведем формулы (112.13) к виду:
Подставляя выражения (112.15) в (112.12) и принимая во внимание, что в сумме формулы (112.12) содержится слагаемых первого вида и слагаемйх второго вида, получим:
Подставляя это выражение в (112.11), найдем дисперсию оценки (112.10) корреляционного момента случайных величин X, К:
Очевидно, что дисперсия смещенной оценки (112.4) отличается от выражения (112.17) множителем Однако, как было сказано в предыдущем параграфе, точность смещенной оценки характеризуется не ее дисперсией, а математическим ожиданием квадрата разности между оценкой и определяемой этой оценкой характеристикой, которое представляет собой квадрат средней квадратической ошибки оценки. Принимая во внимание, что математическое ожидание случайной величины где определяется формулой (112.4), равно, согласно найдем по формуле (10.9) квадрат средней квадратической ошибки смещенной оценки (112.4):
Сравнивая эту формулу с (112.17), убеждаемся в том, что смещенная оценка (112.3) корреляционного момента точнее несмещенной Оценки (112.9).
Умея определять по результатам опытов корреляционные моменты и дисперсии случайных величин, можно легко находить и коэффициенты корреляции. Заменяя в общей формуле (17.7) дисперсии и корреляционный момент соответствующими оценками, получим:
При этом, очевидно, совершенно безразлично, какими оценками пользоваться, смещенными или несмещенными. Результат получается один и тот же.
Для определения точности оценки коэффициента корреляции следует определить математическое ожидание и дисперсию функции случайных величин
Так как эта функция нелинейная, то задача определения ее математического ожидания и дисперсии является нелегкой. Для приближенного определения математического ожидания и дисперсии оценки (112.20) коэффициента корреляции можно применить метод линеаризации функций, изложенный в § 31. В результате получим:
Заметим, что относительная точность оценок (112.3), (112.9) и (112.19) корреляционного момента и коэффициента корреляции падает с уменьшением абсолютной величины коэффициента корреляции. Это следует непосредственно из формул (112.17), (112.18), (112.22) и (17.7). В предыдущем параграфе мы видели, что относительная точность оценок дисперсии не зависит от ее величины, а зависит только от числа опытов.