9.3. БОЛЕЕ СЛОЖНЫЙ ПРИМЕР: ЭКСПЕРИМЕНТ ДАРВИНА

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

9.3. БОЛЕЕ СЛОЖНЫЙ ПРИМЕР: ЭКСПЕРИМЕНТ ДАРВИНА

Пример с леди, дегустирующей чай, хотя и дает повод поговорить об основных принципах планирования эксперимента, все же не является типичным. Во-первых, он направлен, скорее, на доказательство или опровержение способности леди к различению ситуаций, тогда как более общий план должен был бы оценивать величину этого эффекта. Во-вторых, более общие планы снабжены механизмом «блокирования», позволяющим продолжить эксперимент (т. е. включить больше наблюдений) без потери преимуществ из-за неоднородности экспериментального материала и подходящих условий малого эксперимента.

Эти дополнительные моменты были выявлены и обсуждены Р. Фишером [см. Fisher (1951)] при знаменитом эксперименте, выполненном Чарльзом Дарвином для установления того, способствует ли перекрестное опыление растений увеличению их роста по сравнению с самоопылением, и если да, то насколько. Этот эксперимент и обсуждение его Фишером были описаны в примере 5.7.1. Использованные Дарвином классические принципы характеризуются следующими признаками:

1) блокированием: прямое сравнение можно было сделать только для пары растений, одно из которых подверглось перекрестному опылению, а Другое — самоопылению, причем оба растения выращивались в одном цветочном горшке, следовательно, в настолько близких внешних условиях, насколько это возможно. Такой прием снижает влияние неустранимых различий между внешними условиями выращивания одного и другого растения, плодородием почвы в одном горшке и в другом и т. д.;

2) повторяемостью: конечно же, использовались несколько цветочных горшков. В данном конкретном эксперименте на самом деле было 15 повторений (дублирований основного экспериментального модуля). Благодаря усреднению всех 15 повторений Дарвин смог минимизировать вклад ошибки эксперимента в исследуемый эффект высоты растений;

3) сбалансированностью: оба вида растений использовались равное число раз, так что ни один из них не получил преимущества.

Р. Фишер предложил еще один дополнительный признак:

4) рандомизацию: Дарвин фактически не воспользовался этим приемом, который был указан Фишером как необходимый для того, чтобы стал возможным состоятельный анализ эксперимента. В данном контексте термин «рандомизация» означает определение для каждого из 15 горшков с помощью физического процесса рандомизации (подобного подбрасыванию монеты), какое из двух семян, с каким способом опыления (самоопыление или перекрестное) должно

занять, скажем, северную, а какое — южную сторону горшка. В поддержку своих представлений Фишер утверждал, что когда верна нуль-гипотеза, что отсутствует систематическое различие между перекрестным опылением и самоопылением, наблюдаемые различия в значительной степени могут объясняться условиями окружающей среды. Поэтому надо сравнивать фактически наблюдаемые различия с теми, что могли бы появиться при всех других перестановках мест закладки семян (равноправных с точки зрения нуль-гипотезы), которые могли бы возникнуть в процессе рандомизации. Действительно, с такой точки зрения только «оброк» рандомизации позволяет обратиться к вероятностному рассмотрению.

Анализ эксперимента основан на «модели рандомизации», т. е. на представлении о том, что имеющиеся данные образуют некоторую выборку из генеральной совокупности равновероятных потенциально возможных наборов данных, полученную в результате рандомизации, как показано в примере 5.7.1. Можно заметить, что даже в таком простом примере, как рассматриваемый, вычисления нетривиальны. А в более сложном эксперименте над вычислениями, связанными с анализом рандомизации, придется попотеть. Возможно, по этой причине в докомпьютерную эру обсуждались и альтернативные модели. Главная конкурирующая точка зрения состоит в том, что наши 15 пар семян фактически представляют собой случайную выборку из (двумерной) совокупности пар растений с некоторым значением математического ожидания разности между ростом растений с перекрестным опылением и самоопылением. Обычно в качестве оценки для используется среднее из наблюдаемых разностей на основании центральной предельной теоремы теории вероятностей рассматриваются как реализации независимых нормально распределенных случайных величин. Практически одинаковые вычисления определяют значимость наблюдаемых различий независимо от того, получены ли они с использованием модели рандомизации или с помощью этого варианта модели нормального распределения.

На первый взгляд кажется, что модель нормального распределения противоречит соображениям Фишера о необходимости рандомизации как существенной части планирования эксперимента. В действительности, однако, она вполне согласуется с тем, что рандомизация служит одним из ключевых моментов, пусть не из-за фишеровских соображений, приведенных выше, но в силу не менее веских причин: без рандомизации ошибки эксперимента нельзя рассматривать как взаимно независимые и одинаково распределенные случайные величины.

<< Предыдущий параграф

Следующий параграф >>

Оглавление