Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
1.1. ПРЯМОЛИНЕЙНАЯ ЗАВИСИМОСТЬ МЕЖДУ ДВУМЯ ПЕРЕМЕННЫМИВо многих экспериментальных работах мы хотим исследовать, как изменения одной переменной влияют на другую. Иногда две переменные связаны точным уравнением прямой линии. Например, если сопротивление Заметим, что для любого заданного роста встречаются различные веса и наоборот. Такая вариация может, в частности, получиться из-за ошибки измерений, но прежде всего это, конечно, следствие разброса между индивидами. Поэтому не приходится ожидать никакого единственного однозначного уравнения связи между ростом и весом. Однако мы можем обнаружить, что средний наблюденный вес при заданном росте растет с увеличением роста. Геометрическое место точек средних наблюденных весов при данных ростах (при изменении роста) назовем регрессионной кривой веса от роста.
Рис. 1.1. Рост и вес 30 мужчин-америкаицев Обозначим это следующим образом: Пусть мы теперь располагаем надежными данными по индивидуальным ростам, но не знаем соответствующих весов, которые хотим оценить. Что мы должны сделать? Мы должны найти из регрессионной линии веса от роста средние наблюденные веса индивидов данных ростов и использовать эти средние как оценки весов, которыми мы не располагали. Пары случайных переменных, таких, как пара (рост—вес), имеют двумерное распределение вероятностей некоторого типа. Если мы установим связь между зависимой случайной величиной У и величиной X, которая является переменной, но не является случайной переменной, то уравнение У относительно X будет называться уравнением регрессии. Хотя это название, строго говоря, некорректно, оно, как мы уже говорили, укоренилось и широко распространено. Почти всюду в этой книге мы будем предполагать, что переменные-предикторы не подвержены случайной вариации, тогда как отклики, напротив, подвержены. С практической точки зрения весьма редко такое предположение оказывается безупречным, но если это не так, то требуются гораздо более сложные методы построения зависимостей. Чтобы обойти возникшую трудность, мы используем метод наименьших квадратов только в таких ситуациях, где можно предположить, что вся возможная случайная вариация в любом предикторе столь мала по сравнению с наблюдаемым диапазоном его изменения, что ею вполне можно пренебречь.
Рис. 1.2. Зависимость отклика от фактора И это предположение выполняется не часто, но оно подразумевается в каждой работе, посвященной методу наименьших квадратов, где предикторы считаются «фиксированными». (В таком контексте слово «фиксированный» означает «неслучайный», а вовсе не то, что предикторы вообще не могут иметь различных значений или уровней.) За дальнейшими подробностями обратитесь к параграфу 2.14. Можно убедиться, что знать вид зависимости весьма полезно и когда зависимость строго линейная, и когда она линейна лишь для средних значений. (Зависимость может быть, конечно, более сложной, чем линейная, но мы будем пока рассматривать именно этот простой случай.) Прямолинейная зависимость может быть полезна, даже если известно, что такое соотношение вообще не может быть верным. Рассмотрим зависимость отклика от фактора, показанную на рис. 1.2. Она, очевидно, нелинейна в диапазоне (Подобные замечания можно сделать и в тех случаях, когда рассматривается более чем одна независимая переменная (предиктор). Пусть мы хотим исследовать, каким образом отклик данных, которые «покрывают» некоторую область в «пространстве X». Пусть точка
Рис. 1.3, Точка вне области, покрываемой данными
|
1 |
Оглавление
|