ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА
В наше время благодаря расширению возможностей ЭВМ становится все проще анализировать большие массивы данных. Это приводит к бурному росту приложений многомерной статистики, что вызывает в свою очередь развитие соответствующей теории, причем статистическая теория меняется в сторону ее "компьютеризации".
Книга Дж. Себера вполне отражает эту тенденцию развития регрессионного анализа. Она занимает особое место среди имеющихся у нас книг по данному предмету и располагается где-то посредине между трудно читаемыми научными монографиями и практическими руководствами рецептурного плана. По стилю изложения она, пожалуй, примыкает к соответствующим разделам тома 2 недавно переведенной и быстро разошедшейся известной монографии М. Кендалла и А. Стьюарта "Статистические выводы и связи" и к ранее вышедшей книге Г. Шеффе "Дисперсионный анализ", но отличается большей элементарностью и полнотой вводной части. Книга Дж. Себера современна (она основана на работах до 1975 г. включительно) и почти наполовину состоит из описания вычислительных аспектов, регрессионного анализа, многие из которых у нас раньше не освещались. К тому же в книге много полезных задач с набросками их решения.
Благодаря этим особенностям, книга послужит, по нашему мнению, хорошим пособием как для студентов-математиков (особенно вычислительной специализации), так и для специалистов-экспериментаторов, а также окажется полезной для самообразования.
Изложение основано на курсах разного уровня, читавшихся автором на протяжении многих лет. Это, с одной стороны, способствует большей легкости усвоения, но с другой — приводит к трудностям при "сшивании" материала различной сложности и к некоторой непоследовательности изложения. Например, такие понятия, как условные математические ожидания, распределения
и т. д., используются без строгого определения, хотя долго обсуждается элементарное понятие независимости (кстати, после
того, как оно уже было использовано ранее без определения), на протяжении книги часто фигурирует в качестве примера полностью рандомизованный план, хотя нигде не определяются понятие рандомизации и его смысл, и т. д.
По этим причинам книга не может рассматриваться как введение в математическую статистику: она предполагает - понимание ее некоторых фундаментальных понятий, и внимание автора сосредоточено в основном на вычислительных аспектах. Прежде всего выделим содержательные главы 11 и 12, которые полностью новы для советского читателя. В первой из них изложены алгоритмы, лежащие в основе различных программ регрессионного анализа для ЭВМ. На этой основе в главе 12, по-видимому, впервые в мировой литературе систематически излагаются различные эвристические методы выбора наилучшего подмножества регрессоров — трудной проблемы, имеющей огромное прикладное значение. Отметим также изложение пересчета результатов при добавлении или пропуске регрессоров, введение в альтернативные к классическим методы оценивания
упрощение анализа при наличии пропущенных наблюдений
работы с ортогональными полиномами, сплайнами
и эмпирическими остатками
Модному сейчас использованию обобщенных обратных матриц при анализе вырожденных моделей уделяется сравнительно скромное место, что способствует большей наглядности изложения (хотя и делает его более пространным).
Полезно также, что дисперсионный и ковариационный анализ излагается в главах 9 и 10 на основе уже разобранного регрессионного анализа, что способствует унификации и ясности изложения. К сожалению, в книге нет упоминания о смешанных моделях дисперсионного анализа [см. Rao (1973), Searle (1971), Kendall, Stewart (1968)].
Интерес представляют и разделы, где на элементарных примерах обсуждаются сравнительно тонкие и малоизвестные вопросы теории. Среди них выделим:
1) Обстоятельное обсуждение различных аспектов проблемы построения доверительных интервалов, в частности, для совокупности оцениваемых параметров
для всех точек оцениваемой поверхности отклика над некоторой областью аргумента (гл. 5 и 7), для обратной задачи предсказания аргумента по измерениям зависимой переменной
д.
2) Влияние сбалансированности плана эксперимента на устойчивость
-критерия при нарушении нормальности ошибок.
3) Проверка предположений регрессионного анализа на основе изучения эмпирических остатков.
Стоит отметить, что вопросам планирования эксперимента в книге уделено малое, место, а имеющиеся подходы несовершенны. По этому поводу читатель может обратиться к имеющимся
у нас руководствам, например к книге В. В. Федорова (1971)
В заключение следует сказать, что чтение книги оставляет впечатление полезной и обстоятельной беседы с человеком, мастерски владеющим вычислительными и статистическими аспектами регрессионного анализа. Полагаю, что книга Дж. Себера привлечет внимание к изложенным в ней вопросам регрессионного анализа и послужит повышению уровня прикладных и теоретических работ в этой области.
М.Б. Малютов