Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше
Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике
10.1.7. КОВАРИАЦИОННЫЙ АНАЛИЗ
При сравнении эффектов групп при односторонней классификации часто удается получить дополнительную информацию об относящихся к делу переменных. В случае, например, упомянутых ранее
обработок антикоррозионными составами дополнительная информация, которая могла бы пригодиться при сравнении, включает температуру, время выдержки, влажность и т.
Можно ожидать, что различия в значениях этих дополнительных факторов будут в определенной мере влиять на наблюдаемые различия между обработками. Ковариационный анализ
учитывает такие эффекты. Мы обсудим этот анализ для случая, когда есть результаты наблюдений над одной из таких сопутствующих переменных (или совместно изменяющихся случайных величин), скажем, временем выдержки, X. Тогда получим модель
где
— время выдержки
образца из
группы. Дополнительное условие остается прежним, а именно
Поскольку рассматривается набор гипотез о равенстве групповых эффектов (все
, анализ этой модели методом наименьших квадратов в основном сводится к учету различий во времени выдержки, чтобы элиминировать эффекты таких различий при сравнении обработок. Матрица плана А получается в этом случае добавлением нового столбца к матрице плана односторонней классификации без ковариации, приведенной в (10.1.3). Вот этот новый столбец:
Для получения МНК-оценок параметров мы решаем уравнения
где
. В данном случае имеем:
откуда
Можно переписать выражение 1) в виде а
Подставив это в выражение 2), получим
что можно было бы сравнить с соответствующими оценками в случае, когда нет ковариаций (10.1.6). Подстановка в выражение 3) дает уравнение для
которое можно решить:
Вот остаточная сумма квадратов:
В этой модели «работают»
параметров и одно дополнительное условие. Значит, число независимых параметров равно
и остаток пропорционален случайной величине с распределением хи-квадрат с
степенями свободы. Следовательно, оценка дисперсии ошибки равна:
Оказывается, что все требуемые нам величины сводятся в таблицу:
(см. скан)
Последний столбец — обычный дисперсионный анализ, который проводится при отсутствии дополнительной информации об X. Остальные два столбца содержат соответствующие вычисления для
Отсюда и возник термин ковариационный анализ. Используя введенные обозначения, получим
Далее, покажем, что
Это можно записать и в иной форме:
Давайте вспомним тождество, установленное ранее для классификации групп без учета сопутствующих переменных, а именно
Обозначив общую сумму квадратов относительно среднего через
и используя обозначения, введенные в таблице дисперсионного анализа, получим
Обозначив
через
соответственно, можно вывести (тем же методом, что и для упомянутого выше тождества) аналогичные тождества:
Отсюда видно, что (поскольку
в каждом столбце остаточный член можно получить, вычитая первые два члена из общего разброса.
Для проверки гипотезы Н, что все группы эффектов одинаковы, т. е.
рассмотрим следующую таблицу дисперсионного анализа.
Таблица 10.1.3. Ковариационный анализ
(см. скан)
При гипотезе Н мы исследуем сокращенную модель
Теперь получилась модель, которая постулирует линейную регрессию
на
, а значит, как в примере 8.2.4, МНК-оценки для
при гипотезе Н (обозначенные через
получаются из:
В соответствии с примером 8.12.13 остаток равен:
Отсюда
и
Следовательно, увеличение остатков, обусловленное гипотезой Н, равно:
Порядок для гипотезы Н равен
поэтому функция критерия такова:
Если гипотеза Н верна, то
имеет распределение
Основные результаты для проверки гипотезы
мы можем свести в следующую таблицу:
(см. скан)
Хотя естественный интерес концентрируется на проверке групповых эффектов, отчасти интересно проверить и гипотезу
поскольку ее отбрасывание означает, что в модели имеет смысл учитывать ковариацию.
При справедливости гипотезы Н эта модель превращается просто в обычную модель односторонней классификации без всяких ковариаций, так что
откуда дополнительное уменьшение равно:
Теперь, поскольку гипохеза Н имеет порядок 1, ее проверка основывается на критерии
который имеет распределение
когда
Аналогичные методы приложимы и к моделям, включающим дополнительные классифицирующие факторы и/или сопутствующие переменные. Так, например, при двусторонней перекрестной классификации с двумя сопутствующими факторами
и X и одинаковым числом наблюдений во всех ячейках мы могли бы воспользоваться моделью
с дополнительными условиями
Гипотезы проверяются обычным путем. Так, проверяя гипотезу, что «нет эффекта строки», мы должны получить остаточную сумму для этой гипотезы и сравнить ее увеличение по отношению к остаточной сумме для полной модели. Основные вычисления можно представить в виде таблицы, где один столбец представляет собой обычный дисперсионный анализ для перекрестной классификации без учета ковариаций, а остальные столбцы соответствуют вычислениям