Главная > Прикладной регрессионный анализ, книга 1
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

1.7. ОБРАТНАЯ РЕГРЕССИЯ (СЛУЧАЙ ПРЯМОЙ ЛИНИИ)

Допустим, что мы подобрали уравнение прямой по множеству данных а теперь хотим для определенного значения скажем получить предсказанное значение соответствующее значению X, да еще хотя бы какой-нибудь доверительный интервал, устанавливаемый для X вокруг Вот практический пример такой задачи. Величина представляет собой оценку возраста дерева, полученную по подсчету годовых колец, тогда как соответствующая оценка, полученная методом радиоуглеродной датировки .

Рис. 1.11. Обратная регрессия: оценивание X по для данного значения и получения -ных «фидуцнальных интервалов» для X

Подобранная прямая — это «калибровочная кривая» для радиоуглеродной датировки относительно более точных данных по подсчету годовых колец. Теперь применение метода радиоуглеродной датировки к некоторому объекту дает значение Какие утверждения мы можем сделать насчет истинного возраста нашего объекта? Эта задача называется задачей обратной регрессии. (В других примерах может оказаться истинным средним значением или средним арифметическим наблюдений.)

Есть несколько альтернативных способов получения (одного и того же) решения задач этого типа. Для начала допустим, что истинное среднее значение, а не единичное наблюдение или среднее арифметическое наблюдений. Интуитивно кажется, что разумно поступить так. Нарисовать полученную прямую и кривые, соединяющие конечные точки -ных доверительных интервалов

для истинного среднего значения при данном X (рис. 1.11). На высоте провести горизонтальную линию, параллельную оси Там, где эта линия пересечет кривые доверительных интервалов, опустить перпендикуляры на ось X, что и даст нижний и верхний -ные «фидуциальные пределы», обозначенные на рис. и соответственно. Перпендикуляр, опущенный на ось X из точки пересечения двух прямых, дает обратную оценку X, определяемую как решение уравнения относительно а именно:

Для получения значений и можно поступить и так. На рисунке это Х-координата точки пересечения прямой

и кривой

где

— обычная процентная точка для -критерия, число степеней свободы для Приравнивание уравнений (1.7.1) и (1.7.2), сокращение перенесение квадратного корня из левой части уравнения в правую, возведение обеих частей в квадрат для избавления от корня приводит к следующему квадратному уравнению относительно

где

Мы получим то же самое уравнение для так что и оказываются корнями уравнения (1.7.3). Таким образом, после некоторых преобразований, должно получиться:

или, в ином виде,

где Когда «мало», скажем 0,05 или еще меньше, допустимо, принять, что оно равно нулю, и получить приближенный ответ. Заметим, что можно записать

Таким образом, чем «более значим» коэффициент тем больше будет знаменатель и тем меньше будет сам Понятно, что будет возрастать, если модуль мал, и будет плохо определен, если начнет возрастать или убывать или и то и другое одновременно. Обратное оценивание, как правило, не имеет большого практического значения, если регрессия не достаточно хорошо определена, т. е. если не значим, откуда следует, что величина должна была бы быть меньше, чем (скажем) приблизительно 0,20. (Значение -критерия, равное 2,236, например, должно бы это обеспечить.)

Когда же линия регрессии определена недостаточно хорошо, могут возникнуть странности. Так, например, корни и могут оказаться комплексными или же они будут действительными, но оба лягут по одну сторону от линии регрессии. Картинки обычно сразу делают очевидным, почему возникли эти странности, когда линия оценена недостаточно хорошо, гиперболы, определяемые конечными точками доверительных интервалов, обычно плохо выгибаются или резко загибаются вниз (или вверх, как может быть в данном случае). На рис. 1.12 показаны два примера.

Другой способ записи квадратного уравнения (1.7.3), который допускает обобщение на случай многих предикторов, можно упростить. Вот он:

где X представляет в уравнении (1.7.3) либо

Рис. 1.12. Странности обратной регрессии: (а) комплексные корни; (б) действительные корни, но лежащие по одну сторону от линии регрессии. В обстоятельствах такого рода обратная регрессия не могла бы иметь большого практического значения

(Примечание. Представленные выше вычисления — это вычисления истинного среднего значения. Для получения более общей формулы, в которой фигурирует не как истинное среднее значение, а как среднее из наблюдений, надо везде в уравнениях (1.7.2), (1.7.4), (1.7.5), (1.7.6) и (1.7.8) заменить на как описано выше. Тогда даст формулу для отдельного наблюдения, применимую для единственного нового результата, как в примере с радиоуглеродной датировкой из этого параграфа. А когда положим то получим формулы для истинного среднего значения, приведенные выше.

Мы заимствовали термин «фидуциальные пределы» для у И. Вильямса, который превосходно изложил эту тему в гл. 6 своей книги «Регрессионный анализ» (Williams Е. J. Regression analysis.- New York: Wiley, 1959). Вместо того чтобы ввязываться в теоретическую дискуссию об использовании этого термина, мы просим читателя рассматривать такие интервалы просто как обратные доверительные интервалы для X при данном

1
Оглавление
email@scask.ru