Главная > Статистический анализ данных с пропусками
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

Глава 2. ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТОВ И ПРОПУСКИ В ДАННЫХ

2.1. ВВЕДЕНИЕ

Планирование экспериментов проводится обычно таким образом, чтобы статистический анализ можно было осуществить путем несложных вычислений. В частности, стандартному плану экспериментов соответствует анализ на основе метода наименьших квадратов, обеспечивающий оценки параметров, стандартные ошибки контрастов параметров и таблицу дисперсионного анализа. Оценки, стандартные ошибки и таблицы легко вычисляются в большинстве планируемых экспериментов благодаря сбалансированному плану. Например, при исследовании двух факторов анализ особенно прост, когда для каждого сочетания уровней факторов берется одинаковое число наблюдений. В [Cochran and Сох (1957); Davies (1960); Kempthorne (1952); Winer (1962)] и более поздних работах по планированию экспериментов собрано много соответствующих примеров.

Поскольку в эксперименте значения факторов задаются исследователем, то пропуски, если они есть, содержатся в выходной переменной намного чаще, чем в значениях факторов Поэтому мы ограничимся ситуацией, когда пропуски только в Если такие пропуски есть, то исходный баланс отсутствует. В результате соответствующий анализ наименьших квадратов намного усложняется, даже при предположении ОПС. В этой ситуации интуитивно привлекателен подход с заполнением пропусков, позволяющий восстановить баланс и затем использовать стандартные методы анализа.

Преимущества заполнения пропусков перед анализом фактических данных состоят в следующем: 1) легче определить структуру данных в терминах планируемых экспериментов (например, как сбалансированный неполный блок); 2) легче вычислить необходимые итоговые значения статистик; 3) легче интерпретировать

результаты анализа, так как можно опираться на традиционные характеристики и суммарные значения. Было бы прекрасно, если бы можно было найти такой способ заполнения пропусков, при котором анализ полученных полных данных оказывался бы корректным. В действительности в этом направлении можно еще многое сделать.

При условии независимости пропусков от значений выходной (зависимой) переменной, т. е. при ОС, существует большое число различных методов заполнения, дающих правильные оценки всех параметров эффектов, подлежащих оцениванию. Кроме того, можно легко ввести поправки к остаточному среднему квадрату (ошибок), стандартным ошибкам и суммам квадратов, имеющим одну степень свободы. К сожалению, поправки к суммам квадратов с числом степеней свободы больше одного ввести сложнее, хотя и это можно сделать.

Методы, при которых каждый пропуск заполняется только одним значением, непосредственно применимы только для анализа однофакторной модели с фиксированными эффектами с одним членом для ошибки. К линейным моделям с фиксированными эффектами с числом факторов более одного относятся, например, иерархические модели, в которых суммы квадратов приписываются эффектам в определенном порядке при подборе модели по последовательности вложенных (nested) моделей с фиксированными эффектами, расщепленные планы с повторными измерениями, в которых для исследования эффектов используются различные слагаемые ошибки, а также модели со случайными и смешанными эффектами, в которых отдельные параметры интерпретируются как случайные величины. Для анализа, при котором рассматривается более одной модели с фиксированными факторами, в общем случае для каждой модели надо заполнять различные множества пропущенных значений. Более подробное обсуждение приведено, например, в [Anderson (1946); Jarrett (1978)], см. также раздел 8.5 настоящей книги.

1
Оглавление
email@scask.ru