Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
5.2. МОДЕЛИ, ВКЛЮЧАЮЩИЕ ПРЕОБРАЗОВАНИЯ, ОТЛИЧНЫЕ ОТ ЦЕЛЫХ СТЕПЕНЕЙПолиномиальные модели из параграфа 5.1 включали степени и смешанные произведения степеней предикторов Здесь, мы приведем примеры других типов преобразований, часто полезных при построении регрессионных моделей. Модели, получаемые при преобразовании только Хj«Обратное» преобразование. Если в уравнении (5.0.1) мы положим то получим модель
Логарифмическое преобразование. При выборе уравнение (5.0.1) можно записать так:
Преобразование типа квадратного корня. Например,
Ясно, что существует много преобразований и можно постулировать модели, содержащие меньше или больше таких членов. В одной и той же модели может содержаться, конечно, несколько различных преобразований. Нередко трудно решить, что предпочесть, если можно сделать любое преобразование. Выбор часто осуществляется на основе предыдущих знаний о факторах данной задачи. Цель преобразований такого рода состоит в том, чтобы получить для преобразованных переменных более простую регрессионную модель, чем для исходных. В статье Дж. Бокса и П. Тайдуэлла о преобразованиях независимых переменных (см.: Box G. Е. P., Tidwell P. W. Transformation of independent variables.- Technometrics, 1962, 4, p. 531- 550) предложена итеративная процедура поиска преобразований отдельных переменных на основе имеющихся данных. Преобразования могут также включать одновременно несколько переменных например Преобразования такого типа иногда предлагаются исходя из формы искомого уравнения в преобразованных переменных. Простой пример приведен в работе Дж. Бокса и Кокса, посвященной анализу преобразований (см.: Box G. Е. Р., Сох D. R. Ап analysis of transformations.- Journal of the Royal Statistical Society. Series B, 1964, 26, p. 211-243, discussion - p. 244- 252, cm. p. 222-223), где рассматриваются, однако, в основном преобразования зависимой переменной. Поскольку модель такого типа еще не упоминалась, мы ниже (см. с. 279) обсудим пример. Хорошие преобразования предикторов иногда предлагаются также на основе построения различных диаграмм. См., например, работы Э. Хёрла о подгонке кривых к данным (Ноег1 А. Е. Fitting curves to data.- Chemical Business Handbook.-New York: McGrow-Hill, 1954) и Дж. Долби о быстром методе выбора преобразования (Dolby J. L. A quick method for choosing a transformation.- Technometrics, 1963, 5, p. 317-325), а также работу Дж. Тьюки о сравнительной анатомии преобразований (Тuкеу J. W. On the -comparative anatomy of transformations.- Annals of Mathematical Statistics, 1957, 28, p. 602-632). Основная информация, необходимая для обоснованного выбора ряда преобразований, которые можно использовать для зависимой переменной, отражена в работе: Bartlett М. S. The use of transformations.- Biometrics, 1947, 3, p. 39-52. Нелинейные модели, которые «внутренне» линейныНелинейные модели (т. е. модели, нелинейные по оцениваемым параметрам) можно подразделить на два класса, которые удобно назвать внутренне линейными и внутренне нелинейными. Если модель внутренне линейна, то ее с помощью подходящего преобразования можно привести к стандартной форме линейной модели в виде уравнения (5.0.1). Если же нелинейную модель нельзя представить в такой форме, то она внутренне нелинейна (т. е. действительно нелинейна, периодична). В этом параграфе мы сосредоточим внимание на моделях, которые внутренне линейны и могут обрабатываться с помощью матричных методов, описанных в гл. 2. Необходимые преобразования обычно охватывают как отклики, так и предикторы. Рассмотрим примеры. Мультипликативная модель.
где неизвестные параметры, мультипликативная случайная ошибка. Логарифмирование уравнения (5.2.4) по основанию переводит модель в линейную форму:
Преобразованная модель (5.2.5) имеет форму уравнения (5.0.1), и поэтому здесь можно применять стандартные методы исследования линейной регрессии, описанные в гл. 2. Однако следует подчеркнуть, что для того, чтобы критерии значимости и оценки доверительных интервалов были обоснованными, необходимо соблюдение условий вовсе не для ). Поэтому экспериментатор должен быть готов после построения модели проверить справедливость этого предположения с помощью исследования остатков, как описано в гл. 3. Альтернативная модель, которую часто рассматривают применительно к этому случаю, есть
Общие методы линейной регрессии, приведенные в гл. 2, непригодны для этой модели, так как она внутренне нелинейна. При применении метода наименьших квадратов приходится обращаться к итеративным процедурам нахождения оценок Эти процедуры кратко, обсуждаются в гл. 10. Теперь мы перескажем пример преобразования предикторов, приведенный Дж. Боксом и Д. Коксом. Он содержит модель типа уравнения (5.2.5), для которой на основании имеющихся данных были получены следующие оценки с и параметров
Числа, следующие за знаками плюс и минус, представляют собой стандартные отклонения. Эти данные показывают, например, что предположение бессмысленно. Если мы положим так и подставим в уравнение (5.2.4), то получим модель, предполагавшуюся при анализе:
Дж. Бокс и Д. Кокс замечают, что эта модель «соответствует данный удивительно хорошо». Экспоненциальная модель.
Логарифмируя обе части по натуральному основанию, получим
«Обратная» модель.
Обращая обе части, получим
В этом случае экспериментатор должен использовать в качестве отклика обратную величину зависимой переменной. Более сложная экспоненциальная модель.
Применяя обращение, вычитая единицу и затем логарифмируя по натуральному основанию обе части, получим
Это пример последовательного преобразования зависимой переменной для сведения сложной нелинейной модели к линейному виду. Способ, каким ошибка входит в первые из каждой пары моделей, приведенных выше (см. уравнение (5.2.10)), может показаться несколько странным. Причина этого обстоятельства состоит в том, что «если мы преобразуем и подбираем именно ту модель, которая соответствует вторым уравнениям каждой пары (см. уравнение (5.2.11)), то первые уравнения должны соответствовать нашим действительным гипотезам относительно Во всех случаях, когда модели преобразуются, как в этих примерах, метод наименьших квадратов применяется к преобразованной модели вида (5.0.1) и, конечно, оцениваемые коэффициенты будут «МНК-оценками» только относительно преобразованной модели. И остатки надо исследовать методами из гл. 3 именно для этих преобразованных откликов, а вовсе не для исходных. Вот два других примера внутренне нелинейных моделей:
и
Последняя модель обсуждается в работе: Shah В. К., Кhatгi С. G. A method of fitting the regression curve - = a + бл: + ppx.- Technometrics, 1965, 7, p. 59-65. ЗаключениеРассмотренные в этом параграфе преобразования для сведения сложных моделей к линейным в настоящее время начали более или менее широко применяться. Когда, как мы здесь предполагаем, предикторы не содержат ошибок, в решении таких задач нет трудностей. Однако, когда преобразования включают зависимую переменную У, следует особенно тщательно следить, чтобы предпосылки метода регрессионного анализа (независимость ошибок, при преобразовании не нарушились. Часто можно избежать преобразования зависимой переменной путем отыскания подходящего преобразования Х-переменных (как, скажем, в ранее упомянутой работе Дж. Бокса и П. Тайдуэлла).
|
1 |
Оглавление
|