Главная > Статистический анализ данных с пропусками
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

6.3. ДВУМЕРНЫЕ НОРМАЛЬНЫЕ ДАННЫЕ С ПРОПУСКАМИ В ОДНОЙ ПЕРЕМЕННОЙ: ТОЧНОСТЬ ОЦЕНИВАНИЯ

Важным результатом раздела 6.1 является определение точности получаемых ОМП.

6.3.1. Асимптотическая ковариационная матрица

Асимптотическую ковариационную матрицу С для мы найдем, вычисляя и обращая информационную матрицу. Логарифм правдоподобия равен по (6.6):

Дважды дифференцируя по получаем

где

и

Обращение этих матриц дает

где

и

Асимптотическую ковариационную матрицу можно получить по уравнению (6.3). Чтобы продемонстрировать вычисления, рассмотрим

параметр среднее переменной с пропусками. Поскольку после подстановки МП-оценок мы имеем

Проводя дальнейшие вычисления, находим асимптотическую дисперсию

Третий член в скобках имеет порядок если данные ОС и ПС (т. е. так как в этом случае Пренебрегая этим членом, получим

Эти выражения можно сравнить с дисперсией Оказывается, что в больших выборках уменьшение дисперсии за счет использования наблюдений с присутствием только пропорционально умноженному на долю наблюдений с пропусками.

6.3.2. Выводы о параметрах по малым выборкам

Если объем выборки велик, интервальные оценки параметров можно получить, применяя аппроксимацию 5.1 (уравнение (5.6)) и следуя схеме из раздела 5.2. В частности, -ный интервал для имеет вид

где дана в

Построение выводов по малым выборкам более затруднено. Рассмотрим, например, с частотной точки зрения выводы относительно Величина полученная из (6.13), в больших выборках имеет стандартное нормальное распределение, но в малых выборках ее распределение сложно и зависит от параметров. В качестве полезной аппроксимации распределения этой величины, хорошо согласующейся с результатами моделирования,

было предложено -распределение с степенями свободы [см. Little (1976)]. Такое же -распределение было предложено и для выводов относительно разности средних основанных на Приближенные методы построения доверительных интервалов по малым выборкам для других параметров, например для пока не развиты.

Другой подход к интервальному оцениванию по малым выборкам заключается в следующем. Задают априорное распределение параметров, а затем выводят апостериорное распределение при фиксированных данных. Точнее, пусть мы предполагаем, что априорно независимы и распределены согласно плотности

Выбор приводит к априорному распределению Джефриса (Jeffreys) для факторизованной плотности [см. Box and Tiao (1973)].

Применяя обычную байесовскую теорию к случайной выборке получим такое апостериорное распределение имеет распределение хи-квадрат с степенями свободы; 2) апостериорное распределение при заданном нормально со средним и дисперсией В соответствии с байесовской теорией регрессии для случайной выборки получим такое апостериорное распределение распределена по хи-квадрат с степенями свободы; 4) апостериорное распределение при заданном нормально со средним и дисперсией апостериорное распределение при заданных нормально со средним и дисперсией Вывод этих результатов см. в [Lindley (1965)]. Кроме того, 6) апостериорно независимы.

Результаты 1—6 означают, что апостериорное распределение любой функции от можно моделировать, генерируя значения следующим образом:

1) независимо извлечь из распределения хи-квадрат с степенями свободы соответственно. Извлечь три независимые величины из стандартного нормального распределения;

2) вычислить где

3) вычислить Например, если

6.3.3. Численный пример

Теперь применим методы, описанные в двух предыдущих разделах, к данным табл. 6.1.

Пример 6.3. Интервальное оценивание для двумерного нормального распределения (продолжение примера 6.2). В табл. 6.2 представлены 95%-ные доверительные интервалы для для данных из табл. 6.1. Интервалы строятся с помощью четырех методов: 1) в соответствии с асимптотической теорией, основанной на обратной наблюдаемой информационной матрице, как в (6.15) для с помощью -аппроксимации интервалов для которая получается при замене в (6.15) нормальной процентили 1,96 на процентиль -распределения с степенями свободы, т. е. на 2,201; 3) вычисление интервалов, заключенных между процентилями порядка 2,5 и 97,5% байесовского апостериорного распределения с априорной плотностью (6.16) при (распределение моделировалось 9999 сгенерированными по методу из раздела 6.3.2 значениями); 4) вычисление нормальных интервалов, полученных подгонкой нормального распределения под модель апостериорного распределения по методу 3 (подгонка состояла в использовании среднего и дисперсии апостериорно сгенерированной выборки). Методы 3 и 4 были реализованы для двух независимых множеств случайных чисел, чтобы получить представление о дисперсии при моделировании.

Как и следовало ожидать, самые узкие интервалы получились по асимптотической теории (метод 1), и, скорее всего, уровень доверия этих интервалов меньше требуемых 95%. Остальные интервалы для сходны. В байесовских интервалах для полученных моделированием, процентили порядка 2,5% намного ближе к МП-оценке 114,7, чем процентили 97,5%. Это отражает существенную ассиметрию апостериорного распределения вправо. Нормальная

(см. скан)

аппроксимация не может отобразить эту ассиметрию, но она обладает реалистическим свойством: приближенные интервалы значительно шире интервалов, полученных в соответствии с асимптотической теорией, а значит, они лучше обеспечат -ное накрытие повторного выбора. Аналогичные замечания относятся и к интервалам для

Обратите внимание, что нижние границы для во всех интервалах, построенных по нормальному распределению, меньше минимально допустимого значения На практике их нужно заменить на —1. Смоделированные байесовские интервалы для выглядят более разумными. Вероятность накрытия истинного значения этими интервалами при повторном выборе требует дальнейшего исследования. Литтл [см. Little (1986)] рассматривает эту вероятность для -аппроксимации апостериорного распределения при различных значениях а и с.

Categories

1
Оглавление
email@scask.ru