Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
1.2. Линейные модели регрессииОдна из наиболее общих задач Статистики состоит в случайными величинами, то наблюдения можно представить точками на плоскости, получая так называемую диаграмму рассеяния. Затем можно попытаться подобрать по этим точкам некоторую гладкую кривую таким образом, чтобы они располагались как можно "ближе" к этой кривой. Ясно, что нам не следует ожидать того, что все точки диаграммы лягут на соответствующую кривую, поскольку каждая из случайных величин в рассмотренных выше примерах подвержена случайным флуктуациям в результате воздействия факторов, которыми мы не в состоянии управлять. Даже если между какими-то двумя величинами, как, например, между температурой и давлением, существует совершенно определенная связь, то на диаграмме рассеяния все же будут наблюдаться флуктуации, вызванные ошибками измерений. Весьма часто тип эмпирической кривой определяется экспериментальными или теоретическими соображениями, как в приводимых ниже примерах. Пример 1.1. Закон Ома утверждает, что если Пример 1-2. Согласно законам механики, для удержания от соскальзывания по наклонной плоскости с углом наклона 0 тела, имеющего вес Пример 1.3. Теоретическая Пример 1-4. При более тщательном проведении экспериментов оказывается, что уравнение, связывающее давление и объем, имеет вид линейности уравнения связи, переходя к логарифмам в обеих частях указанного равенства:
или в соответствующих обозначениях
Поэтому значения Пример 1.5. Закон обратного квадрата утверждает, что сила, с которой притягиваются друг к другу два тела, расстояние между которыми равно
где
По экспериментальным данным можно оценить значение Пример 1.6. Эксперименты показывают, что металлический стержень при нагревании удлиняется и это удлинение пропорционально повышению температуры. Если взять пару идентичных стержней и приложить их концами друг к другу, то приращение их суммарной длины ровно в два раза превысит приращение длины одного стержня, так что удлинение стержня пропорционально его исходной длине: Мы приходим к рассмотрению модели прямой линии
Если в нашем распоряжении нет никаких теоретических или экспериментальных соображений, которые могли бы помочь в выборе типа эмпирической кривой, то такой выбор иногда бывает осуществить довольно трудно, как это показывает рис. 1.1. Здесь прямая линия представляется не, менее удобной для использования, чем любая другая, поскольку она описывается малым числом параметров, хотя очевидна необходимость иметь какую-то. меру, характеризующую качество подбора кривой, чтобы можно было сравнивать различные эмпирические кривые. Иногда точки на диаграмме рассеяния располагаются таким образом, что не наблюдается никакого их группирования, и соответственно нет никаких оснований предполагать наличие в наблюдениях какого бы то ни было тренда. Например, на основании диаграммы рассеяния, представленной на рис. 1.2, можно говорить либо о полном отсутствии связи между величинами
Рис. 1.1. Аппроксимация одних и тех же данных двумя различными кривыми.
Рис. 1.2. Диаграмма рассеяния: отсутствие связи между переменными X и у. Во многих случаях одна из переменных, скажем X, не случайна, а фиксирована или управляема. Например, X может обозначать год выпуска, Для описания того, каким образом функцию
Весьма элегантным методом оценивания параметров оценивания, приводящий к оценкам, обладающим определенными оптимальными свойствами, основывается на привлекательной идее выбора таких значений
Рис. 1.3. Метод наименьших квадратов заключается в минимизации Ясно, что указанный принцип наименьших квадратов может быть применен к любой кривой регрессии Из предыдущих примеров мы видели, что обе переменные
и далее можем эффективно действовать таким образом, как если бы величина X вовсе не была случайной. Конечно, любые получаемые при этом выводы являются условными по отношению к наблюдаемым значениям Пример 1.7. Предположим, что имеется популяция, состоящая из
опять выражающее линейную зависимость. Важным применением моделей регрессии является употребление их в прогнозировании. В этом случае подбирается модель, позволяющая предсказывать значения
Рис. 1.4. Истинная модель, состоящая из двух прямых линий. Хотя мы в состоянии хорошо аппроксимировать по имеющимся данным левую часть графика, тем не менее было бы опрометчиво делать прогнозы о значениях Часто случайная величина
В этой книге мы концентрируем внимание на важном классе линейных моделей, в которых функция регрессии имеет вид
т. е. линейна по параметрам
где После того как произведен выбор модели, ее неизвестные параметры Следующей задачей, рассмотренной в книге, является задача проверки гипотез. Например, нас могли бы заинтересовать задачи проверки гипотез в примере Помимо проверки гипотез, мы можем пожелать построить доверительные интервалы для тех или иных параметров или для линейных комбинаций параметров либо получить доверительные интервалы для значений будущих наблюдений. Такие построения проводятся в гл. 5. В весьма важной гл. 6 рассматриваются предположения о характере распределений случайных составляющих В связи с важностью одномерной линейной регрессии, она подробно обсуждается в гл. 7. В гл. 8 рассмотрена полиномиальная регрессия, в которой возникают свои собственные проблемы. До сих пор мы обычно предполагали, что подлежащая изучению модель уже выбрана. Однако во многих практических ситуациях возникает необходимость решить, какие из возможных переменных Остаток настоящей главы и гл. 2, в которой рассматривается многомерное нормальное распределение, призваны снабдить читателя некоторыми теоретическими сведениями, необходимыми для чтения остального материала.
|
1 |
Оглавление
|