2.2. ВЫБОРОЧНЫЕ РАСПРЕДЕЛЕНИЯ: ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ
Выбрав определенную статистику, такую, как среднее выборки (среднее значение наблюдений), и отметив ее значение, мы вынуждены признать, что при повторении процедуры выборки численное значение
этой статистики во второй выборке будет, вероятно, отличаться от ее значения в первой выборке. Последовательность таких повторений породила бы последовательность числовых значений статистики; одни значения встречались бы чаще, другие — реже. Таким образом, мы можем представить совокупность значений вместе с распределением вероятностей среди них. Это и есть выборочное распределение статистики.
В примерах 2.1.1 и 2.1.2 рассматривалась статистика
— количество дефектных единиц в выборке. В примере 2.1.2 она трактовалась как реализация (т.е. наблюдение) случайной переменной
[см. II, гл. 4], которая имеет распределение
[см. II, раздел 5.2.2]. В этом случае число обследованных брусков
является числом «испытаний», как это понимается для биномиального распределения,
неизвестной долей дефектных изделий в партии.
Статистика
является реализацией случайной величины
Выборочное распределение статистики
оказывается распределением вероятностей (2.1.2) [см. II, раздел 4.3] соответствующей случайной переменной
. В примере 2.1.3 рассматривались статистики
при этом
были реализациями случайной переменной X, распределенной
[см. II, раздел 11.4].
С точки зрения обозначений удобно рассматривать
как реализацию случайной переменной
— как реализацию случайной переменной
, наконец,
— как реализацию
где случайные переменные
(т.е. взаимно независимые [см. II, раздел 4.4] и одинаково распределенные переменные). При этом их общее распределение — это распределение исходной случайной переменной X. Взаимная независимость [см. II, определение 4.4.1] наблюдаемых событий
обеспеченная процедурой выборки, отражается в предположении взаимной независимости случайных переменных
а тот факт, что все наблюдения
взяты из одного и того же распределения, отражается в приписывании всем
распределения X. О переменной
можно говорить как о статистической копии X [см. определение 2.2.1].
Определение 2.2.1. Статистические копии, индуцированные случайные переменные, случайная выборка. Говорят, что случайные переменные
будут статистическими копиями заданной случайной переменной X, если
взаимно независимы и одинаково распределены, причем их общее распределение совпадает с распределением X. Множество независимых наблюдений
переменной X называется случайной выборкой. По соображениям удобства можно считать
наблюдением
— наблюдением
Эти случайные переменные
индуцируются (порождаются) наблюдениями
Аналогично статистика
порождает случайную переменную
(Определение, случайной выборки из конечной совокупности можно найти, например, в [II, раздел 5.3].)
В примере 2.1.3, таким образом, статистики
могут рассматриваться как реализации индуцированных случайных переменных соответственно
и
где
статистические копии х.
Теперь случайная переменная становится суммой
взаимно независимых переменных
и поэтому сама оказывается распределенной нормально с математическим ожиданием
и стандартным отклонением
[см. раздел 2.5.3, а)]. Это распределение
будет выборочным распределением статистики
Подобным образом выборочным распределением статистики
, является распределение индуцированной случайной переменной
В примере 2.1.4 имелось к взаимно независимых случайных переменных
распределения которых уже не были одинаковыми. Вместе с наблюдаемыми значениями
переменной
нас были неслучайные переменные
известные точно. Статистика
рассматривается как реализация случайной переменной
являющейся взвешенной суммой независимых случайных переменных
Выборочным распределением статистики
будет распределение вероятностей индуцированной случайной переменной
В этом примере оказывается, что
— независимые нормально распределенные случайные переменные с параметрами
Отсуда вытекает [см. раздел 2.5.3] нормальность выборочного распределения переменной
с ожиданием
и дисперсией
В свете этих примеров можно дать формальное определение выборочного распределения.
Определение 2.2.2. Выборочное распределение статистики. Пусть
представляют собой собрание данных, в которых
для каждого
может рассматриваться как реализация случайной переменной
Пусть
— множество неслучайных переменных, значения которых известны (сюда может входить, например, объем выборки). Пусть рассматриваемой статистикой будет
Выборочным распределением этой статистики называют распределение вероятностей индуцированной случайной переменной
В этих выражениях
могут быть скалярными или векторными величинами [см. I, разделы 5.1, 5.2]. В последнем случае
— векторные случайные переменные [см. II, раздел 13.3.1]. Аналогично переменные
могут быть скалярными или векторными. Статистика А
может быть скалярной функцией векторных аргументов или сама может быть вектором. Тогда и выборочное распределение оказывается многомерным распределением вероятностей [см. II, раздел 13.1]). Далее приводятся дополнительные примеры.
Пример 2.2.1. Выборочное среднее. Предположим, что
— случайная выборка [см. определение 2.2.1] из распределения Пуассона с параметром В [см. II, раздел 5.4]. Рассмотрим статистику
Эта статистика, выборочное среднее, порождает случайную переменную
где
— взаимно независимые, одинаково распределенные переменные [см. раздел 1.4], подчиняющиеся распределению Пуассона с параметром
Распределение суммы
независимых переменных, распределенных как
будет следовать
[см. II, раздел 7.2], так что
откуда
Эта формула выражает выборочное распределение статистики х.
Пример 2.2.2. Случайная выборка из двумерного распределения. (Выборочное распределение статистики, имеющей векторное значение.) Предположим, что X является двумерной векторной случайной переменной, определяемой выражением
где
и
— одномерные переменные, совместное распределение которых является двумерным нормальным распределением с параметрами
[см. II, раздел 13.4.6]. Случайная выборка объема
из этого распределения будет состоять из
упорядоченных пар
представляющих собой независимые реализации пары
Статистика
где
позволяет сделать выводы относительно X и
Чтобы обсудить выборочное распределение статистики
с векторными значениями, введем индуцированные двумерные случайные переменные
являющиеся статистическими копиями X в том смысле, что
взаимно независимы и для любого
распределены так же, как X. Таким образом, пары
будут независимыми всегда, когда к, и для любых
будут иметь такое же двумерное нормальное распределение, как
и
Отсюда следует, что индуцированная случайная переменная
имеет двумерное нормальное распределение с
Такое же распределение имеет и переменная
Искусственные выборки: имитация. Опубликованные собрания независимых реализаций случайных переменных с определенным распределением обеспечивают возможность создания небольших моделируемых случайных выборок. Когда требуются выборки сравнительно
большого объема, такая процедура становится недостаточной и предпочтение отдается генерированию реализаций с помощью компьютера (моделирование на ЭВМ).
В разделе F списка литературы приведены работы, включающие таблицы случайных чисел, принадлежащих различным распределениям: числа с равномерным распределением см., например, в [RAND Corporation, (1955)]; числа с нормальным распределением см. в [Wold (1954)]; двумерные нормальные пары см. в [Fieller, Lewis and Pearson (1957)]; числа с экспоненциальным распределением см. в [Clark and Holtz (1960)] или в [Barnett (1965)]. Так как сумма чисел, подчиняющихся экспоненциальному закону, имеет гамма-распределение, моделируемые выборки гамма-переменных (и, следовательно,
-переменных) можно получить из «случайных чисел», следующих экспоненциальному закону.
Сведения о генерировании случайных реализаций можно найти в книге [Newman and Odell (1971)] (а также в работах, включенных в раздел F списка литературы или в [Abramowitz and Stegun, ed. (1970), section 26.8-D].