Главная > Статистический анализ данных с пропусками
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

8.5. ОБЩАЯ МОДЕЛЬ ПОВТОРНЫХ ИЗМЕРЕНИЙ С НЕПОЛНЫМИ ДАННЫМИ

Неполные данные часто встречаются в долговременных исследованиях, когда объекты наблюдаются в различные моменты времени и/или в разных экспериментальных условиях. Нормальные модели для таких данных часто объединяют структуры ковариационных матриц, аналогичные описанным в разделе 8.3, и структуры средних, которые связывают средние повторных измерений с переменными плана. Следующая общая модель повторных измерений основана на работах [Ware (1985); Helms (1984)] и приведена в [Jennrich and Schluchter (1987)].

Допустим, что гипотетические полные данные для случая состоят из К измерений выходной переменной и что по предположению — независимые многомерные нормальные наблюдения со средним и ковариационной матрицей Мы запишем:

где известная -матрица плана для случая вектор неизвестных коэффициентов регрессии, а элементы известные функции от множества неизвестных параметров Итак, модель задает структуру средних, определяемую набором матриц

плана и ковариационную структуру, определяемую формой ковариационной матрицы Присутствующие данные состоят из матриц плана где наблюденная часть вектора Предполагается, что пропущенные значения Логарифм правдоподобия для полных данных линеен по величинам Поэтому шаг представляет собой вычисление средних и при заданных и текущих оценках и Эта операция проводится с помощью свертки текущей оценки аналогичной свертке в многомерной нормальной модели в разделе 8.2.1. Шаг для этой модели является итеративным за исключением частных случаев, и, таким образом, самая привлекательная черта ЕМ-алгоритма — простота шага утрачивается. Дженрич и Шлухтер [Jennrich and Schluchter (1987)] представляют GEM-алго-ритм (см. раздел 7.4), а также обсуждают метод вкладов и алгоритм Ньютона-Рафсона, которые могут быть удобными при зависимости от умеренного числа параметров

Комбинируя различные структуры средних и ковариационных матриц, можно смоделировать большое число ситуаций. Дженрич и Шлухтер обсуждают такие ковариационные структуры: Независимость: скаляр, I — единичная матрица

Составная симметрия: скаляры, -матрица из единиц, I — единичная -матрица. Авторегрессия порядка 1: скаляры. Полосовая структура: где

Факторная: матрица неизвестных факторных нагрузок, диагональная матрица специфических дисперсий.

Случайные эффекты: известная матрица неизвестная матрица рассеяния скаляр, I — единичная матрица

Отсутствие структуры:

Структура средних также очень гибка. Если единичная матрица то для всех Такая структура постоянного среднего в сочетании с неструктурированной или факторной ковариационной матрицей или с матрицей составной симметрии дает модели, рассмотренные в разделе 8.2, а также в примерах 8.2 и 8.3. Выбирая другие варианты можно легко формировать модель для межобъектных и внутриобъектных эффектов, как в следующем примере.

Пример 8.6. Модели кривых роста при неполных данных. В [Potthoff and Roy (1964)] приведены данные табл. 8.3 о росте 11 девочек и 16 мальчиков. Для каждого объекта в возрасте 8, 10, 12 и 14 лет регистрировалось расстояние от подмозгового придатка до челюстной борозды. Дженрич и Шлухтер подгоняют под эти данные 8 моделей. Мы подгоняем эти же модели под данные, полученные удалением девяти значений в скобках в табл. 8.3. Механизм удаления соответствовал условию ОС, но не ОПС. Точнее, для детей обоих полов с малыми значениями в 8 лет были удалены значения для возраста 10 лет. В табл. 8.4 для всех моделей даны значения логарифма правдоподобия, умноженного на и хи-квадрат-статистики отношения правдоподобия для сравнения моделей. Последний столбец содержит значения последней статистики для полных данных до удаления [см. Jennrich and Schluchter (1987)].

Пусть , обозначает 4 замера расстояний для объекта и пусть переменная плана, равная 1, если ребенок — мальчик, и если девочка. Модель 1 задает различные средние для каждого


Таблица 8.3. (см. скан) Данные о росте 11 девочек и 16 мальчиков

пола и возраста и неструктурированную ковариационную матрицу Матрицу плана для объекта можно записать как

При отсутствии пропусков МП-оценка это вектор из восьми выборочных средних, МП-оценка где объединенная внутригрупповая матрица сумм квадратов и взаимных перекрестных произведений.

Таблица 8.4. (см. скан) Анализ моделей, рассмотренных в примере 8.7

Эта неограниченная модель, модель 1 в табл. 8.4, оценивалась по неполным данным табл. 8.3. Остальные семь моделей также оценивалась по этим данным. Графики наводили на мысль о линейности зависимости между средним расстоянием и возрастом с различными свободными членами и коэффициентами регрессии для мальчиков и девочек. Структуру средних для такой модели можно записать в виде

где представляют общие средние, а коэффициенты регрессии соответственно для девочек и для мальчиков. В модели 2 была такая структура средних и неограниченная

Статистика отношения правдоподобия модели 1 к правдоподобию модели 2 равна при четырех степенях свободы, что указывает на достаточно удовлетворительное согласие для модели 2. Модель 3 получается из модели 2, если положить т. е. если опустить последний столбец Это ограничение означает, что прямые регрессии расстояния на возраст имеют одинаковый наклон для обеих половых групп. Отношение правдоподобия для сравнения модели 3 с моделью 2 равно 4,112 при одной степени свободы, что указывает на плохое согласие. Поэтому надо предпочесть структуру средних модели 2.

Остальные модели табл. 8.4 имеют структуру средних модели налагают ограничения на Ковариационные структуры авторегрессии (модель 5) и независимости (модель 8) не согласуются с данными, судя по статистике хи-квадрат отношения правдоподобия. Полосовая структура (модель 4) и две структуры со случайными эффектами (модели 6 и 7) хорошо подходят под данные. Из этих моделей мы предпочтем по соображениям экономии модель 7. Ее можно интерпретировать как модель со случайными эффектами с фиксированным коэффициентом регрессии для каждого пола и случайным свободным членом, который варьирует от объекта к объекту около общего по полу среднего. В дальнейшем анализе следовало бы рассмотреть оценки параметров выбранной модели.

1
Оглавление
email@scask.ru