Главная > Выборочный метод
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

6.2.2. ПРОИЗВОЛЬНОЕ РАЗМЕЩЕНИЕ ЕДИНИЦ ВЫБОРКИ ПО L СЛОЯМ

В этом параграфе мы выводим общие формулы оценок суммарных и средних значений и стандартных ошибок этих оценок. Они подходят для любого произвольного размещения единиц выборки по L слоям. Должно выполняться лишь единственное условие:

    (6.2.11)

6.2.2.1. Оценки среднего ... и суммы X

Мы исходим из равенства (6.2.4):

    (6.2.12)

Суммарное значение признака X для совокупности слагается из суммарных значений всех L слоев. Как показано в 5.3, среднее выборочное значение есть несмещенная и состоятельная оценка истинного среднего значения признака в слое, т. е.

    (6.2.13)

Отсюда мы получаем несмещенную оценку суммарного значения

Если в равенстве (6.2.12) значения заменить их несмещенными оценками, то получим несмещенную оценку суммарного значения признака X для совокупности:

Оценка суммарного значения признака Для совокупности представляет собой сумму оценок суммарных значений для слоев, вычисленных методом прямого оценивания. Учитывая (6.2.14), получаем:

    (6.2.17)

т. е. (6.2.16) есть несмещенная и состоятельная оценка. Она распределена нормально со средним квадратичным отклонением [см. (6.2.29)].

Несмещенную, состоятельную и нормально распределенную оценку среднего значения X признака для совокупности можно получить, подставив в (6.2.6) вместо средних значений их оценки или разделив оценку суммарного значения (6.2.16) на

    (6.2.18)

Оценка среднего значения признака для совокупности есть взвешенное среднее арифметическое выборочных средних для всех слоев.

6.2.2.2. Стандартные ошибки оценок

При оценивании среднего (или суммарного) значения отдельного слоя находят которое представляет собой случайную величину со средним квадратичным отклонением (стандартной ошибкой ):

    (6.2.19)

Значение есть оценка истинного среднего слоя. — среднее квадратичное отклонение отдельных значений признака слоя (6.2.10). Оценка (6.2.16) суммарного значения для совокупности, будучи суммой (линейной комбинацией) независимых случайных величин, сама является случайной величиной. Поэтому ее математическое ожидание [см. (6.2.17)] и дисперсия могут быть рассчитаны по общим правилам теории вероятностей.

Если переписать (6.2.16) подробно:

    (6.2.20)

то, принимая во внимание теорему о том, что дисперсия суммы попарно независимых случайных величин равна сумме дисперсий слагаемых, т. е.

или в более компактной записи:

    (6.2.22)

получим дисперсию оценки (6.2.20):

или

    (6.2.24)

есть произведение случайной величины и константы Следовательно,

    (6.2.25)

Учитывая, что окончательно получаем дисперсию оценки (6.2.16):

    (6.2.26)

или

Таким образом,

Формулу (6.2.28) можно упростить. Тогда получим следующую формулу для стандартной ошибки оценки (6.2.16) суммарного значения признака X при расслоенном отборе:

Если наряду с суммарным значением признака X для совокупности представляют интерес также суммарные значения для слоев и их оценки, то одновременно с оценками суммарных значений признака для слоев рассчитываются с помощью (6.2.19) и их стандартные ошибки Стандартную ошибку оценки суммарного значения признака для совокупности можно тогда согласно (6.2.23) и (6.2.26) рассчитать, используя стандартные ошибки оценок суммарных значений для слоев по формуле

    

Стандартную ошибку оценки среднего легко получить, приняв во внимание, что

    (6.2.31)

Из этого следует, что

    

и поэтому стандартная ошибка оценки среднего значения для совокупности X при расслоенном отборе равна:

Если объем выборки (т. е. если ), то (6.2.23) переходит в

(6.2.28) — общая исходная формула для определения стандартных ошибок оценок при расслоенном отборе. Все остальные рассмотренные здесь формулы могут быть получены из нее или из формулы (6.2.33).

При расслоенном отборе для достаточно больших объемов выборок оценки нормально распределены. Доверительные интервалы могут быть поэтому рассчитаны по

формуле (5.3.33) с помощью квантилей нормального распределения:

    (6.2.35)

С вероятностью (1 — а) интервалы (6.2.35) и (6.2.36) покрывают истинное среднее X или соответственно истинное суммарное значение X интересующего нас признака для всех единиц совокупности.

Из анализа формулы (6.2.28) или (6.2.33) вытекают важные требования, которые должны быть приняты во внимание при возможном расслоении совокупности, т. е. разделении N единиц совокупности на L слоев.

Стандартные ошибки , т. е. точность метода оценивания, зависят от трех величин:

Легко видеть, что если расслоение совокупности не задано однозначно из содержательных соображений и имеется возможность выбора принципа расслоения, то большая точность оценивания достигается при таком способе расслоения, когда средние квадратичные отклонения по возможности малы. Однако малые величины средних квадратичных отклонений свидетельствуют о высокой степени однородности единиц в каждом слое относительно исследуемого признака (признаков). Поэтому положительный эффект расслоения (см. 6.2.5) достигается тогда, когда признак, по которому производится расслоение, коррелирует с исследуемым, т. е. является факторным по отношению к исследуемому, а исследуемый признак выступает как результативный. Признаком расслоения мы называем качественный, количественный или территориальный критерий, в соответствии с которым решается вопрос о принадлежности единицы к определенному слою.

Если, например, нужно оценить суммарные затраты на отопление и освещение за год для всех N = 9155 школ ГДР в 1964 г. (см. Statistisches Jahrbuch der DDR, 1965) с помощью выборки объема n = 900, то простой случайный отбор мало эффективен. Следует учитывать, что из-за различной величины школ эти затраты по школам будут сильно различаться между собой и поэтому оценка (5.3.20) будет иметь большую стандартную ошибку. В рассматриваемом примере возможно несколько способов разделения N единиц совокупности на слон. Могут быть, например, избраны

Таблица 6.2

следующие признаки (критерии расслоения):

а) число учеников в школе;

б) число учителей в школе;

в) бюджет школы за прошлый год;

г) территориальный признак.

Распределение школ по слоям по первому признаку можно провести так, как показано в табл. 6.2.

Аналогично можно произвести расслоение по другим признакам. Для признака г) в качестве слоя можно рассматривать школы одного округа.

При расслоении по признакам а) б), в) можно с увё-ренностью предположить, что значения признака «годовые затраты на отопление и освещение» для единиц (школ) внутри слоя имеют меньший разброс, чем в нерасслоенной совокупности Признаки а), б), в) коррелируют с исследуемым признаком. При территориальном же расслоении, напротив, едва ли можно ожидать положительного эффекта расслоения, т. е. повышения точности оценивания по сравнению с простым случайным отбором.

При заданных стандартные ошибки и (6.2.33) зависят от — числа единиц, вовлеченных в выборку из отдельных слоев. Естественно, должны удовлетворять условию (6.1.4):

При достаточно больших существует большое число способов размещения единиц выборки по L слоям, которые удовлетворяют (6.1.4), и все эти способы дают разные значения стандартных ошибок и соответственно . В рассмотренном примере имеется практически бесконечно много возможных вариантов определения числа школ, подлежащих опросу в каждом из шести слоев, при общей выборке из школ.

Оценивание на основе расслоенного отбора предполагает, что число единиц выборки, извлекаемых из каждого слоя, заранее однозначно определяется.

Categories

1
Оглавление
email@scask.ru