18.5.1. АВТОКОРРЕЛЯЦИОННАЯ ФУНКЦИЯ (АКФ)
Общим для всего раздела является предположение о том, что временной ряд стационарен, т. е. порождающий его механизм не меняется во времени, а соответствующий процесс достиг статистического равновесия. На практике наиболее интересными статистиками являются моменты первого и второго порядков [см. раздел 2.1.2], так что мы накладываем на временной ряд следующие условия:
1) математическое ожидание и дисперсия ряда [см. II, гл. 8 и 9] постоянны во времени:
2) ковариация между любыми двумя членами ряда [см. II, раздел 9.6.1] зависит только от расстояния во времени между этими наблюдениями, или от разности между их номерами:
По определению Автокорреляционная функция (АКФ) определяется формулой
[см. II, раздел 22.2]. Полезно рассматривать АКФ как бесконечную в обе стороны последовательность, полагая .
Для выборочных данных обычно используют выборочное среднее и выборочную дисперсию
и выборочные автоковариацию и автокорреляцию, определяемые формулами
где полагают [см. раздел 2.1.2, п. б), в]. Их следует рассматривать как выборочные описательные статистики. В них усреднение осуществляется по времени, а не по независимым реализациям процесса. Тем самым не обязательно окажется наилучшей оценкой для если предположить, что ряд описывается некоторой параметрической моделью. Однако при должном понимании их недостатков эти выборочные статистики оказываются наиболее полезными. Чтобы установить их свойства, необходимо сделать дополнительные предположения о распределении Приводимые ниже результаты выполняются для гауссовских рядов — это означает, что все частные и совместные распределения [см. II, раздел 13.1] членов временного ряда должны быть нормальными. Будет предполагаться также, что сумма конечна. Это предположение не может оказаться слишком жестким, так как для подавляющего большинства практических задач оказывается пренебрежимо малым для значений к, превышающих некоторую (возможно, большую) величину. Если, однако, из ряда не удалось исключить какую-либо детерминированную компоненту, например, синусоидальную волну, то выборочные автокорреляции отразят это обстоятельство — они не будут затухать при больших лагах.
Следующие приближенные равенства справедливы при фиксированных к и достаточно больших с ошибкой порядка
Выборочные величины являются, таким образом, состоятельными оценками [см. раздел 3.3.1, п. в)], хотя для малых величина имеет заметное смещение [см. определение 3.3.2]. Польза этих формул ограничена в таких задачах, как построение доверительного интервала для раздел 4.2] или выделение значимых корреляций [см. раздел 5.1], так как они содержат те же самые величины, для которых строится оценка. Для этих целей необходим более осторожный подход типа «бутстреп». Начальной точкой является гипотеза о равенстве для всех и в этом случае стандартная ошибка Значения, не попадающие в интервал следует рассмотреть отдельно. Возьмем в качестве примера показанную на рис. 18.5.1, б) выборочную АКФ ряда первых разностей продолжительности дня, изображенного на рис. 18.5.1, а). Применение операции взятия разности связано с высказанным выше предположением, что этот ряд содержит компоненту типа случайного блуждания. Использовались первые 140 точек ряда, остальные точки мы оставили про запас для сравнения с прогнозом, который мы собираемся построить.
В первую очередь мы замечаем, что для Сам факт, что в этом списке так много значений, означает, что мы занизили величину стандартной ошибки (определение стандартной ошибки см. в разделе 2.1.2, п. в)). Соблюдая осторожность, пересмотрим нашу гипотезу, предположив, что только отличны от нуля, что соответствует двум первым выделяющимся значениям
Теперь воспользуемся формулой (18.5.8), полагая для и беря в качестве оценки для величины Мы получим
Заметим, что вообще при проверке гипотез вида для второе слагаемое в формуле (18.5.8) для пропадает при Используя новые доверительные границы, мы видим смутное свидетельство, возможно, значимого отклонения от нуля величин, отвечающих лагам 29 и 30, для которых автокорреляция имеет порядок 0,29; однако при рассмотрении свыше 40 коэффициентов два выделяющихся значения могут появиться и за счет случайных причин. Поэтому мы сохраняем скептицизм по поводу значимости этих корреляций. Таким образом, наше предположение о том, что лишь отличны от нуля, не противоречит имеющимся данным. Мы увидим далее, что это предположение является слишком жестким и должно быть ослаблено. Тем не менее у нас есть полезное начальное