Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике 4. ЛИНЕЙНАЯ МОДЕЛЬ МНОГОМЕРНОГО ДИСПЕРСИОННОГО АНАЛИЗАВ этой главе мы кратко расскажем о проверке линейных гипотез в задачах одномерного дисперсионного анализа, что приведет нас к известному -критерию. С помощью одномерного дисперсионного анализа мы перейдем к многомерному случаю. Читателю, знакомому с одномерным дисперсионным анализом, данная глава все же будет полезна, так как позволит увидеть аналогии в ходе рассуждений, а также убедиться в возникновении новых аспектов при изучении многомерного дисперсионного анализа. 4.1. ОДНОМЕРНЫЙ СЛУЧАЙПодвергнем наблюденных величин дисперсионному анализу. Предположим, что каждое наблюдение принадлежит нормально распределенной генеральной совокупности и отдельные наблюдения взаимно независимы. Предположим, что вектор-столбец с компонентами удовлетворяет линейному соотношению
При этом элементы будут неизвестными параметрами и, напротив, элементы X — известными числами. Матрицу X называют матрицей плана, или блок-схемой. Она определяется соответствующим экспериментом. Далее мы примем, что все нормально распределенные совокупности имеют одинаковую дисперсию, т. е. для всех Чтобы Дисперсионный анализ оказался возможным, потребуем, чтобы ранг матрицы плана X был отличен от и число наблюдаемых значений превосходило
Составленный из наблюдений вектор-столбец у в силу сделанных выше предположений есть реализация -мерной нормально распределенной случайной величины (I — единичная матрица). Отсюда следует уравнение модели
где вектор обозначает случайные составляющие измеренных значений. Цель дисперсионного анализа — нахождение оценок неизвестных параметров и проверка определенных гипотез. Гипотезы мы выдвигаем в виде
а их альтернативы — в виде
где К — заданная неслучайная матрица положительного ранга, относительно которой мы предполагаем, что число строк совпадает с ее рангом:
Все это в целом составляет линейную модель для одномерного случая. Для проверки гипотезы используется известный -критерий, Его можно вывести из критерия отношения правдоподобия (см, также [1]). В дальнейшем мы приведем выражение статистики. В отличие от модели регрессионного анализа для модели дисперсионного анализа типично то, что столбцы матрицы плана X не являются линейно-независимыми. Из-за этого построение критерия несколько усложняется. Допустим, что в X можно найти линейно-независимых столбцов. Путем перенумерации столбцов можно достигнуть того, что первые столбцов окажутся линейно-независимыми. Соответствующую перенумерацию произведем и для После этой предварительной подготовки мы разобьем матрицу X на две подматрицы
Расчленению X соответствует также разбиение К:
В этих обозначениях статистика -критерия имеет вид
Это выражение можно вычислить в каждом конкретном случае, поскольку в него наряду с заданными наблюдениями входят только матрицы которые определяются соответствующей матрицей плана X и гипотезой, подлежащей проверке. Если гипотеза верна, отношение (4.7) имеет степенями свободы. Гипотеза отклоняется на уровне значимости а, если
В противном случае гипотеза принимается. Вывод выражения (4.7) читатель может найти, например, [74]. Заметим, что при критерий применим не для каждой выдвинутой гипотезы Указанный -итерий может быть использован для проверки гипотезы лишь при выполнении равенства
Для краткости положим
С учетом (4.10) и -статистику запишем в виде
Можно показать, что и однозначно определяются матрицей плана X и матрицей гипотезы в частности, они не зависят от выбора в X «базисной матрицы» На основании (4.3) квадратичная форма в знаменателе (4.12) распределена по закону При справедливости нулевой гипотезы (4.4) и условия (4.3) квадратичная форма в числителе выражения (4.12) имеет -распределение, причем числитель и знаменатель стохастически независимы друг от друга. При анализе широко известных блок-схем -факторной классификации, иерархической классификации и т.д.) при проверке нулевых гипотез о группах главных эффектов либо взаимодействий квадратичные формы в числителе и знаменателе (4.12) превращаются в привычные суммы квадратов из соответствующих таблиц дисперсионного анализа. Проблема оценки неизвестных параметров и их линейных комбинаций тесно связана с проверкой гипотез. Предположим, мы хотим оценить вектор
Как не для любой произвольно выдвинутой гипотезы вида (4.4) можно сконструировать критерий проверки, так и не для каждого вектора у может быть найдена оценка. По аналогии с К указанную матрицу С расчленяем на две подматрицы
Вектор у допускает оценку при условии, что
В этом случае искомой оценкой является
Среди всех линейных оценок у оценка у имеет наименьшую дисперсию. Кроме того, она несмещенная. При использовании оценок параметров -критерий можно представить в другом виде. Оценкой вектора средних значений (см. формулу (4.1)) является
Условие возможности построения оценки в этом случае выполняется, так как столбцы могут быть представлены в виде линейных комбинаций столбцов т. е. существует такая матрица что
благодаря чему получаем
Используя (4.16) с учетом того, что матрица симметричная и идемпотентная, получаем в знаменателе -критерия (4.12) выражения:
Соотношение такого рода большинству читателей известно: в правой части стоит сумма квадратов отклонений измеренных значений от оценок соответствующих средних значений. В этом месте нам хотелось бы подчеркнуть, что
— несмещенная оценка дисперсии ошибки измерения. В данном случае символ означает стандартное отклонение. В других формулах используется для обозначения ранга матрицы гипотезы. Чтобы можно было преобразовать числитель -критерия, нужно найти оценку вектора параметров
При условии, что гипотеза проверяема, т. е. выполняется (4.9), параметр допускает оценку
так что
Отсюда видно, что чем меньше тем больше оценка 6 соответствует гипотезе Используя (4.18) и (4.21), получим выражения для -критерия:
|
1 |
Оглавление
|