2.3. КОРРЕКТНАЯ РЕАЛИЗАЦИЯ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ ПРИ ПРОПУСКАХ В ДАННЫХ
Мы предполагаем, что X представляет такой план эксперимента, что при присутствии всех анализ данных можно проводить с помощью известных стандартных формул и программ. Вопрос состоит в том, как использовать эти формулы и программы (для полных данных), когда часть пропущена.
Точный анализ наблюдаемых данных легко описывается в предположении, что причина появления пропусков в У не зависит от значения при условии ОС). Надо просто игнорировать строки X, соответствующие пропущенным и провести вычисления, рассмотренные в разделе 2.2, по оставшимся строкам X, соответствующим наблюденным Затруднения, связанные с таким предложением, состоят в том, что специальные формулы и программы, предназначенные для полных Y, уже нельзя использовать, так как отсутствует исходная сбалансированность. Вследствие этого 1) труднее описать структуру данных, поскольку теперь надо оговаривать всю матрицу плана, а не просто дать указание на один из традиционных планов экспериментов; 2) вычислительные затраты по оперативной памяти и процессорному времени могут оказаться больше, поскольку необходимы формулы в общем виде, как, например, в (2.2), а не специальные выражения для отдельных различных планов; 3) может быть утрачена ясность статистической интерпретации, поскольку не даются результаты и выводы, соответствующие традиционным специальным планам.
Тем не менее, применяя уравнения из раздела 2.2 к объектам с присутствующими мы получим корректные оценки наименьших квадратов, стандартные ошибки, суммы квадратов и F-критерии, если в данных будут пропуски. Для обозначения величин, полученных из уравнений по объектам с присутствующими мы будем использовать символы В остальной части этой главы описаны способы получения этих величин с применением только тех процедур, которые нужны для полных данных и в которых для упрощения вычислений используется специальная структура