Главная > Справочник по прикладной статистике. Том 1
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

10.1.6. КЛАССИФИКАЦИИ БОЛЕЕ ВЫСОКОГО ПОРЯДКА

По, мере включения в классификацию новых факторов анализ быстро становится громоздким. Мы можем повторить иерархическую структуру для включения в классификацию третьего фактора, внутри которого наш предыдущий пример образует гнездо. Этот третий фактор мог бы быть, например, «континентом», а используемая модель приняла бы тогда вид

где главная группа параметров относится к континентам, подгруппа параметров — к странам, а подгруппа — к городам.

Аналогично мы можем рассматривать перекрестную классификацию трех факторов, в которой каждая пара факторов образует перекрестную классификацию, как обсуждалось в разделе 10.1.5. Далее мы обсудим этот случай более подробно. Оба эти обобщения «чистые»: одно из них — чисто иерархическое, а второе — чисто гнездовое (перекрестное). Новое свойство, проявляющееся при трех и более факторах, — это наличие возможности получить смеси из иерархических и перекрестных классификаций. Чтобы проиллюстрировать сказанное, рассмотрим модель для исследования забастовок в международных промышленных компаниях:

где в качестве факторов рассматриваются: а) страны компании и в) предприятия . А в качестве отклика можно было бы взять, например, (потери в человеко-днях из-за забастовок в рабочих дней в году) за период на предприятии .

Допустим, каждая компания имеет промышленное предприятие в каждой стране, тогда «страны» и «компании» образуют двустороннюю перекрестную классификацию, в которой каждая ячейка, т. е. комбинация страны и компании, образует основную группу в двусторонней иерархической классификации с предприятиями в качестве подгрупп. Подробности анализа смешанных классификаций, как, впрочем, и чисто иерархических, с тремя факторами, приведены в книге [Scheffe (1959)].

Рассмотрим теперь более подробно трехстороннюю перекрестную классификацию. Данные, относящиеся к ожирению, могут быть представлены в виде перекрестной классификации в зависимости от действия лекарств, режима питания и типа личности. Вот соответствующая модель:

где Здесь относятся к лекарствам, представляют различные режимы питания (диеты), а связаны с разными типами личностей. Отметим, что наряду с этими тремя наборами параметров надо учитывать взаимодействия первого порядка между каждой парой факторов, а также параметры представляющие взаимодействие второго порядка между всеми тремя факторами, поскольку без них наша модель окажется не в состоянии описывать общий случай различий в математических ожиданиях для всех ячеек. В частности, отсутствие взаимодействия второго порядка свидетельствует о том, что, например, взаимодействие первого порядка между лекарствами и диетами будет одинаковым для всех типов личности (т. е. для каждого к лекарства и диеты взаимодействуют одним и тем же способом, что выражается только через параметры Аналогично и для взаимодействий первого порядка между остальными парами факторов. Мы рассмотрим только сбалансированный случай, когда во всех ячейках представлено одинаковое число наблюдений Число параметров такой модели равно

а число ячеек равно Значит, число избыточных параметров —

Воспользуемся следующими дополнительными условиями:

Метод наименьших квадратов позволяет получить оценки параметров с помощью минимизации выражения

с учетом приведенных выше дополнительных условий. Причем параметры в этом выражении обрабатываются просто как алгебраические переменные. Вот МНК-оценки

Для оценок остальных параметров тоже есть соответствующие выражения. А вот остаточная сумма квадратов:

Поскольку число наблюдений равно а число независимых параметров равно остаточная сумма квадратов имеет степеней свободы.

Как и при двусторонней перекрестной классификации, здесь параметры образуют ортогональные группы лишь в том случае, если удовлетворяется условие «пропорциональности частот». Это применимо и к данному случаю с разными частотами в ячейках. Поэтому в обычных обозначениях мы имеем

Различные суммы квадратов в этом выражении можно найти после повторной минимизации с учетом соответствующей гипотезы или воспользовавшись представлением выражения для отклонений в виде суммы различных компонентов. Соответствующая таблица дисперсионного анализа представлена в табл. 10.1.2.

Число степеней свободы в каждом случае (за исключением двух последних строк) определяется числом включенных независимых параметров, т. е. общим числом параметров, связанных с каждым эффектом без числа независимых наложенных ограничений.

В столбце средних квадратов использовалась следующая система обозначений:

(кликните для просмотра скана)

Аналогично и для (заметьте, что это не дисперсии!).

При соответствующих гипотезах каждая сумма квадратов распределена независимо от остатка и пропорциональна случайной величине с распределением хи-квадрат. Критерий строится как обычно. Например, для проверки различий между лекарствами мы пользуемся тем фактом, что при отсутствии таких различий (т. е. когда все D, равны нулю) величина распределена как Аналогично, чтобы проверить, что «нет взаимодействия между лекарствами и типами личностей», обращаемся к статистике с распределением Отбрасывание этой гипотезы означает, что одни лекарства оолее эффективны (по сравнению с другими) для некоторых типов личностей.

Если остатки обращаются в нуль и все проверки оказываются невозможными. Если, однако, мы захотим при этом предположить, что взаимодействие второго порядка равно нулю, то остальные гипотезы снова станут проверяемыми. Для них по предположению величина будет играть роль остатка, что должно учитываться в Соответствующих критериях. Так, например, для проверки возможного эффекта диеты мы воспользуемся величиной которая имеет распределение когда различие между диетами отсутствует.

1
Оглавление
email@scask.ru