Главная > Выборочный метод
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

5.4.2. ОЦЕНИВАНИЕ ОТНОШЕНИЙ

Естественным кажется рассматривать отношение суммарных значений двух признаков в выборке в качестве оценки отношения Т, т. е.

    (5.4.19)

t представляет собой отношение случайных величин х и у (соответственно х и у) и поэтому, естественно, оно является случайной величиной. Очевидно, что t — самостоятельная функция оценки отношения Т, т. е.

    (5.4.20)

Однако в общем случае I не будет несмещенной оценкой Т. Формулу для определения величины смещения, т. е. систематической ошибки

    (5.4.21)

здесь не приводим.

Можно показать (см., например, [32], [33]), что систематическая ошибка когда оба признака стохастически пропорциональны, т. е. когда линия пропорциональности признаков (см. рис. 19) одновременно является линией регрессии (см. 5.5).

Во многих задачах статистического оценивания предположение о стохастической пропорциональности признаков выполняется. Так, урожай зерна на поле стохастически пропорционален площади этого поля. Можно также показать [3], что на практике систематическая ошибка, обусловленная выбором функции оценки, как правило, настолько мала по сравнению со случайными, мерой которых является среднее квадратичное отклонение оценки, что ею можно пренебречь.

Вывод формулы для стандартной ошибки оценки I достаточно труден [32], [33], Формула эта имеет следующий вид:

    (5.4.22)

Формулы (5.4.19) и (5.4.22) — основные формулы оценивания по отношению. На них базируется изложение материала в 5.4.3. Если объем выборки мал то формулу (5.4.22) можно представить в таком виде:

    (5.4.23)

показывает порядок величины возможного отклонения случайной величины t от параметра Т.

Во многих случаях при оценивании отношений достаточно задать величину оценки и ее стандартную ошибку.

Расчет доверительного интервала, который покрывает параметр Т с заданной вероятностью, предполагает дополнительно знание распределения оценки. Согласно [10,

т. II, с. 109—111) построение доверительных интервалов с помощью квантилей нормального распределения возможно, если если же, как это часто бывает на практике, линия регрессии проходит через начало координат, т. е. то формула (5.4.24) пригодна уже при

С вероятностью (1 — а) выполняется неравенство

    (5.4.24)

т. е. именно с этой вероятностью истинное значение Т покрывается интервалом

Выполнение требовании или можно всегда обеспечить выбором соответствующего объема выборки. Покажем, как это делается. Для этого примем, что величина коэффициента вариации признака для единиц совокупности равна 0,5 (среднее квадратичное отклонение составляет 50% среднего значения признака ). В практических задачах коэффициент вариации редко бывает больше 0,5. Поскольку

то

    (5.4.26)

Пусть в нашем примере следовательно,

Из рис. 18 видно, что значение почти независимо от объема совокупности достигается при , т. е. уже при малом объеме выборки формула (5.4.24) может с полным основанием применяться для вычисления доверительного интервала. С помощью рис. 18 можно проверить в каждом случае правомерность вычислений по формуле (5.4.24).

Формула (5.4.22) показывает, что стандартная ошибка уменьшается с увеличением объема выборки и и коэффициента корреляции . Это объясняется тем, что при коэффициенте

корреляции, близком к 1 (см. рис. 19), отдельные точки располагаются около линии пропорциональности признаков, т. е. индивидуальные значения мало отличаются от искомого значения Т. Поэтому достаточно даже небольшого количества единиц (пар чисел), чтобы получить точную оценку Т.

Для того чтобы получить численное значение стандартной ошибки нужно из отдельных значений и полученных при обследовании выборки, вычислить следующие величины: Если принять во внимание формулы (5.4.13)-(5.4.19), а также то, что

    (5.4.27)

то необходимо вычислить следующие суммы:

    (5.4.30)

С помощью настольных электромеханических или электронных вычислительных машин нетрудно провести соответствующие вычисления и определить отдельные характеристики и стандартную ошибку . Для контроля вычислений нужно обращать внимание на то, чтобы размерность (единицы измерения) стандартной ошибки совпадала с размерностью отношения

Будем теперь преобразовывать исходную формулу (5.4.22) и обсуждать получаемые результаты.

Принимая во внимание, что коэффициент вариации оценки равен

    (5.4.31)

получим, что

    (5.4.32)

и соответственно

    (5.4.33)

Эти равенства наряду с содержат выборочные коэффициенты вариации признаков Поскольку

— коэффициенты вариации оценок х и у, т. е. случайных величин, стоящих в числителе и знаменателе оценки t (5.4.19)), то (5.4.32) может быть переписана следующим образом:

    (5.4.35)

Эта формула, наряду с коэффициентом корреляции , содержит коэффициенты вариации - оценок числителя и знаменателя отношения Т (5.4.6).

Можно заметить, что при больших значениях коэффициента корреляции становится малым. Когда же обращается в нуль. В этом случае все точки

лежат на линии пропорциональности признаков, т. е. все и отсюда . Следовательно, результат оценивания есть не случайная величина, поэтому

Если в формуле (5.4.22) коэффициенты вариации заменить их выражениями через средние квадратичные отклонения , то получим: и соответственно

    (5.4.37)

Здесь также можно перейти от выборочных средних квадратичных отклонений к стандартным ошибкам оценок. Формула (5.4.36) при этом примет вид:

    (5.4.38)

Равенство (5.4.38) показывает зависимость от стандартных ошибок случайных величин, стоящих в числителе и знаменателе отношения

Во всех до сих пор обсуждавшихся модификациях основной формулы (5.4.22) содержатся характеристики, вычисляемые по значениям признаков единиц выборки Все эти характеристики рассчитываются с помощью сумм (5.4.30), а сами суммы — уже непосредственно по отдельным значениям результатов выборки.

Если в заменить их выражениями (5.4.13), (5.4.14) и (5.4.17), то после некоторых преобразований получим:

    (5.4.39)

и соответственно

    (5.4.40)

Оба эти равенства позволяют, не вычисляя дисперсии и коэффициента корреляции, а только с помощью сумм (5.4.30), определить стандартную ошибку и, следовательно, коэффициент вариации оценки t.

Поскольку

и в скобках заключен квадрат выражения , т. е.

то формула (5.4.39) принимает вид:

н соответственно

    (5.4.43)

Если точек нанести на координатную плоскость (см. рис. 20), то есть расстояние по оси от точки до линии пропорциональности а среднее квадратичное отклонение

    (5.4.44)

является мерой колеблемости отдельных значений вокруг линии пропорциональности признаков. Тогда (5.4.42) переписывается в виде

и соответственно

    (5.4.46)

Приведенные равенства могут также применяться для расчета необходимого объема выборки, когда. показатели точности задаются в виде стандартной и предельной ошибки или их относительных величин. При этом, конечно, возникает гораздо больше трудностей, чем при расчете объема выборки в 5.3.4.

Рис. 20. Линия пропорциональности признаков для выборки

При оценивании отношений необходима дополнительная информация о двумерных характеристиках: коэффициенте корреляции или среднем квадратичном отклонении sd (5.4.44). Относительно можно разрешить равенства (5.4.22) и (5.4.23), (5.4.32) и (5.4.33), (5.4.36) и (5.4.37), (5.4.45) и (5.4.46). Если, например, выразить из (5.4.22) и (5.4.23), то получим формулы для определения объема выборки, которыми можно пользоваться

если известны выборочные коэффициенты вариации признаков

    (5.4.47)

соответственно

    (5.4.48)

Совершенно аналогично получают и другие формулы, поэтому мы их здесь не приводим.

Categories

1
Оглавление
email@scask.ru