Главная > Статистический анализ данных с пропусками
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

4. ОБРАБОТКА НАБЛЮДЕНИЙ ИЗ ВРЕМЕННЫХ РЯДОВ ПРИ НАЛИЧИИ ПРОПУСКОВ

В этом разделе мы обсудим применение подхода с использованием маргинальной плотности при наличии пропусков, когда наблюдения выборки уже не являются независимыми.

Как и в разделе 8.6 книги Р.Дж. А. Литтла и Д.Б. Рубина, мы рассмотрим процесс авторегрессии порядка см. уравнение книги, не замыкаясь, однако, на задаче построения ЕМ-алгоритма. Условная плотность вероятности выборки из временного ряда за время от до есть

Для плотность (6) определена если известны значений ряда до т. е.

Пусть в выборке за время от до отсутствуют значения Обсуждаемый подход ведет к использованию при наличии пропусков в статистических выводах вместо плотности (6) условной маргинальной плотности

где в числителе и знаменателе стоят маргинальные плотности, полученные интегрированием по Для процесса плотность (7) будет теперь определена, если есть наблюдений ряда подряд до с известными значениями, и через выше обозначен момент времени, с которого начинается «серия» наблюдений без пропусков (т.е. ). Случай, когда такой «серии» не существует, относится к проблеме анализа временных рядов при отсутствии начальных значений, обсуждаемой в конце раздела.

Итак, при наличии пропусков предлагается использовать (7) в статистических выводах. В задачах дискриминантного анализа временных рядов использование (7) дает оптимальный классификатор (см. предыдущий раздел).

Что касается точечного оценивания для зависимых наблюдений, то исследуемый подход приводит к оценкам максимального маргинального правдоподобия (2) с фукцией правдоподобия в виде (7). Утверждения о состоятельности, асимптотической нормальности и эффективности ОММП в условиях регулярности для данных с пропусками, видимо, поддаются обобщению на обсуждаемый случай зависимых наблюдений.

Теперь рассмотрим процесс авторегрессии первого порядка

где случайная величина, распределенная нормально Здесь и далее для краткости принято, что среднее процесса При ненулевом потребуется лишь простая замена на

Предложение. Маргинальная плотность наблюдения для одномерного гауссовского процесса при наличии к пропусков подряд есть:

Доказательство просто: в [Никифоров (1987)] используется метод математической индукции, еще проще ограничиться вычислением условных математического ожидания и дисперсии нормально распределенной случайной величины

Пусть теперь выборка с пропусками из процесса образована наблюдениями причем Тогда (7) равно

где сомножители имеют вид (8) при числе пропусков

С помощью (8) можно полностью описать ЕМ-алгоритм (см. раздел 8.6.2 книги) для авторегрессионного процесса Для этого нужно вывести условные математическое ожидание и дисперсию при произвольной структуре пропусков, т.е. когда один из к пропусков между (в книге получены выражения для а в задаче 8.11 предлагается вывести их для случая Обозначим через число пропусков, отделяющих отсутствующее значение от и аналогично тогда Далее, для

Подставляя в правую часть этого выражения плотности вида (8) с параметрами и к (в силу нормальности достаточно расписать только числитель), получим:

где Выражения, полученные в книге в конце раздела 8.6.2, следуют из (9) при (в обозначениях раздела следует заменить на

В заключение обсудим проблему, связанную с отсутствием изначальных значений при обработке временных рядов и весьма существенную в том случае, когда мы имеем дело с короткими реализациями временного ряда. Пусть мы начали наблюдения в момент времени т.е. в реализации отсутствуют значения Обычный способ [Бокс, Дженкинс (1974)] вычисления плотности в этом случае — «прогнозирование назад» достаточно большого числа реализаций временного ряда (например, для процесса «прогнозируют» реализаций). Этот способ сходен с заполнением пропусков. В подходе с использованием маргинального распределения эта проблема решается естественным образом. В самом деле, можно рассматривать наблюдения, отсутствующие до как бесконечное множество пропусков. Например, пусть мы наблюдаем временной ряд с момента времени Тогда маргинальная плотность для наблюдения есть (8), где положено

Как мы видим, это выражение совпадает с выражением в [Бокс, Дженкинс (1974)], полученным для «точной» функции правдоподобия из других соображений (а именно из условия обратимости процесса).

1
Оглавление
email@scask.ru