Главная > Статистический анализ данных с пропусками
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

8.6. МОДЕЛИ ВРЕМЕННЫХ РЯДОВ

8.6.1. Введение

В коротком обсуждении моделей временных рядов с неполными данными (пропусками) мы ограничимся параметрическими моделями во временнбй области с нормальными возмущениями, поскольку они больше всего подходят под метод максимального правдоподобия, развитый в гл. 5 и 7. В приложениях, очевидно, особенно важными выглядят два класса моделей этого вида: модели авторегрессии — скользящего среднего (АРСС), описанные в [Box and Jenkins (1976)], и модели пространства состояний или фильтры Калмана, впервые рассмотренные в технической литературе [Kalman (1960)] и интенсивно разрабатываемые в настоящее время в литературе по временным рядам в эконометрии и статистике [Harvey (1981)]. Как показано в следующем разделе, модели авторегрессии относительно легко оцениваются по неполным данным с помощью ЕМ-алгоритма. Анализ моделей Бокса-Дженкинса с компонентами скользящего среднего не так прост, однако МП-оценивание можно проводить, трансформируя их в модели общего пространства состояний, как описано в [Harvey and Phillips (1979); Jones (1980)]. Мы опускаем детали этого преобразования, хотя МП-оценивание моделей общего пространства состояний по неполным данным описано в общих чертах в разделе 8.6.3 в соответствии с подходом [Shumway and Stoffer (1982)].

8.6.2. Авторегрессионные модели одномерных временных рядов с пропусками

Пусть обозначает полностью наблюденный одномерный временной ряд с наблюдениями. Модель авторегрессии порядка предполагает, что значение в момент времени связано со значениями в предыдущих точках времени уравнением

где — постоянная, неизвестные регрессионные коэффициенты, неизвестная дисперсия ошибки. Оценки наименьших квадратов можно найти с помощью регрессии на по наблюдениям

Эти оценки будут только приближенно МП-оценками, так как игнорируется вклад маргинальных распределений в правдоподобие. Это допустимо при малых по сравнению с

При отсутствии некоторых наблюдений в ряде может прийти мысль применить методы регрессионного анализа с пропусками из раздела 8.4. Этот подход может давать полезные грубые приближения, но это не будет соответствовать МП-оцениванию, даже если считать, что пренебрегать маргинальным распределением допустимо, так как 1) переменные с пропусками выступают и как зависимые, и как независимые переменные в регрессии, и 2) модель (8.14) задает специальную структуру вектора средних и ковариационной матрицы У, не используемую в анализе. Поэтому для оценивания модели по неполным временным рядам необходимы специальные варианты ЕМ-алгоритма. Эти варианты относительно легко реализуемы, хотя их описание нетривиально. Мы ограничиваемся случаем, когда

Пример 8.7. Модель для временндго ряда с пропусками. Полагая в получим

Ряд будет стационарным с постоянным по времени маргинальным распределением только при Тогда совместное распределение имеет постоянные маргинальное среднее дисперсию и ковариации для Пренебрегая вкладом маргинального распределения получим, что логарифм правдоподобия для полного У равен и эквивалентен логарифму правдоподобия для нормальной линейной регрессии на для данных Достаточные статистики для полных данных — это где

МП-оценка это где

Теперь допустим, что некоторые наблюдения отсутствуют и выполняется ОС. С помощью ЕМ-алгоритма, по-прежнему игнорируя маргинальное распределение можно получить МП-оценку в. Пусть оценки на итерации. На шаге вычисляют из (8.16), где достаточные статистики для полных данных заменены оценками на шаге

На шаге вычисляют где

и

если и отсутствуют.

На шаге выполняются обычные операции по свертке ковариационной матрицы наблюдений. Однако матрица как правило, велика, поэтому желательно использовать свойства модели для упрощения вычислений. Допустим, что последовательность пропусков между присутствующими наблюдениями Тогда 1) при заданных не зависит от других пропущенных значений и 2) распределение при заданных и зависит от только через «граничные» наблюдения Последнее распределение — многомерное нормальное с постоянной ковариационной матрицей и средними, которые являются взвешенными средними Веса и ковариационная матрица зависят только от числа пропусков в данной последовательности и могут быть найдены сверткой текущей оценки ковариационной матрицы элементам, соответствующим наблюдениям

В частности, допустим, что присутствуют, отсутствует. Ковариационная матрица равна:

Свертка по дает

Из (8.17) и стационарности следует

Подставляя в эти выражения, получаем и для шага Заметим, что оценка пропущенного значения на последней итерации алгоритма.

8.6.3. Калмановская фильтрация

В [Shumway and Stoffer (1982)] рассмотрен фильтр Калмана

где вектор наблюдаемых в момент времени переменных, известная -матрица плана, которая связывает среднее у; с ненаблюдаемым случайным -вектором представляет неизвестные параметры, где ковариационные матрицы, среднее -матрица коэффициентов авторегрессии на Случайный ненаблюдаемый ряд моделью которого является многомерный процесс авторегрессии первого порядка, и представляет основной интерес.

Эту модель можно рассматривать как разновидность модели случайных эффектов для временных рядов, где вектор эффектов имеет корреляционную структуру по времени. Основной целью является оценка ненаблюдаемого ряда для (сглаживание) и для (прогнозирование) по наблюдаемому ряду Если бы параметр в был известен, оптимальными оценками были бы их средние, условные по параметру в и данным Y, называемые калмановскими оценками сглаживания. Набор рекурсивных формул для их вычисления называют фильтром Калмана. На практике в неизвестен, процедуры сглаживания и прогнозирования включают МП-оценивание в с последующей подстановкой в фильтр Калмана МП-оценки в вместо 0.

Такой же подход применяют, когда данные У неполные, заменяя У на наблюденную часть МП-оценивание можно проводить методом Ньютона-Рафсона [Gupta and Mehra (1974); Ledolter (1979); Goodrich and Caines (1979)]. Удобной альтернативой этим методам является ЕМ-алгоритм, в котором отсутствующая часть рассматриваются как отсутствующие данные. Привлекательное свойство этого метода состоит в том, что ожидаемые значения вычисляются при заданных и текущей оценке 0, что совпадает с калмановским процессом сглаживания, описанным выше. Подробности шага приведены в [Shumway and Stoffer (1982)]. Шаг реализуется довольно просто. Оценки вычисляются по авторегрессии для ожидаемых значений достаточных статистик для полных данных, полученных на шаге Е:

Оценкой В служит ожидаемое значение остаточной ковариационной матрицы Наконец, оценка это ожидаемое значение а выбирается из содержательных соображений. Теперь мы опишем частный случай этой очень общей модели.

Пример 8.8. Двумерный временндй ряд, измеренный с ошибками. Табл. 8.5 содержит два неполных временных ряда с данными о суммарных расходах на медицинское обслуживание, где данные, полученные службой Social Security, Administration (SSA), a Y2 - Health Care Financing Administration (HCFA).

(см. скан)

Эти данные анализируются в [Shumway and Stoffer (1982)] с помощью модели

где суммарные расходы для времени по данным истинные расходы, образующие по предположению временной ряд с коэффициентом и остаточной дисперсией дисперсия измерения . В отличие от примера 8.7, здесь не предполагается стационарность ряда так как параметр это фактор роста, моделирующий экспоненциальный рост; предположение, что постоянный по времени — это, вероятно, чрезмерное упрощение.

Таблица 8.6. (см. скан) Последовательность оценок на различных итерациях ЕМ-алгоритма для МП-оценок в примере 8.8

В табл. 8.6 приведена последовательность итераций ЕМ-алгоритма. Начальные значения были выбраны просто по полностью наблюдаемым фрагментам рядов. Последние столбы табл. 8.5 содержат сглаженные оценки на последней итерации ЕМ-алгоритма для 1949-1976 гг. и прогноз на 5 лет (1977-1981 гг.) вместе со стандартными ошибками. Стандартные ошибки прогнозируемых значений возрастают с 355 для 1977 г. до 952 для 1981 г., что отражает большую неопределенность прогноза.

ЛИТЕРАТУРА

(см. скан)

(см. скан)

ЗАДАЧИ

(см. скан)

(см. скан)

1
Оглавление
email@scask.ru