Главная > Выборочный метод
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

5.5.3. ОЦЕНИВАНИЕ СРЕДНИХ И СУММАРНЫХ ЗНАЧЕНИИ

В этом параграфе обсуждается оценивание средних и суммарных значений совокупности с помощью линейной регрессии. Функции оценок этих характеристик, рассмотренные в 5.3 и 5.4, относительно просты. Они представляли собой элементарные и легко обозримые комбинации сумм. При оценивании средних и суммарных значений признаков для совокупности с помощью линейной регрессии, также как при оценивании условных средних (см. 5.5.2), для построения функции оценок необходимы параметры регрессии. Однако оценивание по регрессии имеет ряд преимуществ по сравнению с другими методами оценивания или по крайней мере не уступает им.

При применении метода наименьших квадратов оба параметра уравнения линейной регрессии (5.5.1) получают, как известно, из системы уравнений

и

    (5.5.14)

— значение функции регрессии в точке т. е.

    (5.5.16)

Равенство (5.5.14) показывает, что линейная регрессия обладает следующим свойством: сумма эмпирических значений равна сумме теоретических значений функции регрессии при значениях аргумента

    (5.5.17)

Таким образом, искомое суммарное значение признака для совокупности может быть выражено через суммарное значение признака которое предполагается известным:

    (5.5.19)

Это равенство является основой для нахождения соответствующей оценки суммарного значения X с помощью линейной регрессии. Для оценки среднего значения признака совокупности служит равенство

    (5.5.20)

Равенство (5.5.20) одновременно показывает, что линейная регрессия обладает свойством, состоящим в том, что точка лежит на линии регрессии; X — значение функции регрессии в точке

При оценке по регрессии руководствуются следующими соображениями.

Исследуя единиц выборки, получают значения Можно рассчитать параметры а (5.5.3) и b (5.5.4) уравнения регрессии (5.5.6) для выборки. Это случайные величины, и они представляют собой оценки параметров А и В уравнения регрессии для совокупности. Линия регрессии (5.5.2) лишь случайно отклоняется от «истинной» неизвестной линии регрессии (5.5.1). Поэтому оценку суммарного значения X для совокупности получают, заменяя А и В в (5.5.14) или (5.5.19) их оценками а и b, т. е. заменяя сумму из N значений функции на N значений функции регрессии выборки .

В результате получают:

Если вместо а подставить в (5.5.21) его значение то получим окончательные формулы для оценки суммарного значения X:

    (5.5.22)

Оценку среднего значения X для совокупности можно получить, либо разделив (5.5.23) на N, либо заменив в (5.5.20) А и В на a и b

    (5.5.2.4)

Эта оценка представляет собой значение функции регрессии выборки в точке Y (см. рис. 22). Как рисунок, так и формулы (5.5.23) и (5.5.24) показывают, что оценка по регрессии есть сумма прямой оценки (соответственно ) и поправочного члена [соответственно (5.5.24)], который учитывает расстояние между средними значениями факторного признака для совокупности и для выборки.

Формулы для стандартных ошибок оценок здесь не выводятся (см., например, [32], [33], [5, русский перевод, с. 213]). Стандартная ошибка оценки среднего составляет:

Если объем совокупности велик то (5.5.25) превращается в

    

Естественно, это значение равно стандартной ошибке оценки условного среднего в точке [см. формулы (5.5.7) и (5.5.8)].

Поскольку оценка суммарного значения для совокупности с помощью соотношения получают ее стандартную ошибку:

    (5.5.27)

Относительные стандартные ошибки оценок суммарного и среднего значений (5.5.22) и (5.5.24) равны:

соответственно при т. е. при

    (5.530)

Из приведенных формул для абсолютных и относительных стандартных ошибок непосредственно видно, что точность оценивания тем выше, чем сильнее коррелированы между собой результативный и факторный признаки.

Оценки по линейной регрессии в общем случае не являются несмещенными, т. е.

и

    (5.5.31)

Однако если результативный и факторный признаки приблизительно стохастически пропорциональны, т. е. линия регрессии проходит близко от начала координат , соответственно , то систематическая ошибка (смещение), обусловленная выбором функции оценки, равна нулю. Функций оценок в этом случае несмещенные. При практическом применении оценок по регрессии эта предпосылка в большинстве случаев выполняется; однако и при а систематической ошибкой можно, как правило, пренебречь, так как она мала по сравнению с возможными случайными отклонениями, мерой которых является стандартная ошибка оценки. В сомнительных случаях следует, конечно, рассчитать величину смещения и сравнить ее со стандартной ошибкой [3].

Доверительные интервалы могут, как и в 5.5.2, рассчитываться с помощью квантилей нормального распределения, а при малых — с помощью квантилей -распределения Стьюдента.

Categories

1
Оглавление
email@scask.ru