3.4.2. КРИТЕРИЙ ФАКТОРИЗАЦИИ И ЭКСПОНЕНЦИАЛЬНОЕ СЕМЕЙСТВО
В примерах 3.4.1, 3.4.2 и 3.4.3 показано прямое применение определения достаточности. Более прост подход с использованием критерия факторизации, который позволяет немедленно ответить на вопрос о существовании достаточной статистики. Этот критерий состоит в следующем.
Теорема 3.4.1. Критерий факторизации для достаточности.
Пусть
— выборочная п.р.в. наблюдений
Статистика
достаточна для в тогда и только тогда, когда
может быть разложена в произведение вида
где сомножитель
не зависит от
. (В частности,
может быть постоянным.)
Пример 3.4.4. Критерий факторизации и распределение Бернулли. В примере 3.4.1. совместное распределение данных имеет п.р.в.
(с заменой
в (3.4.1) на в). Это выражение того же вида, что и (3.4.4),
. Следовательно,
достаточна для
.
Для данных примера 3.4.2 совместная п.р.в. в точке
равна:
что также имеет форму (3.4.4), если в ней положить
Пример 3.4.5. Критерий факторизации и нормальное распределение. Для
выборки в точке
равна:
где
Отсюда следует, что статистика
достаточна для
.
Подобным образом для нормального распределения с
получаем, что
откуда
— достаточная статистика для дисперсии в (а следовательно, и для стандартного отклонения
Пример 3.4.6. Критерий факторизации и гамма-распределение. Для однопараметрического гамма-распределения [см. II, раздел 11.3] с параметром формы
, для которого п.р.в. в точке х равна
получаем
Здесь разложение на множители (3.4.1) достигнуто для
достаточной статистики для в. 1
В теореме 3.4.1 не требовалось, чтобы
были наблюдениями над независимыми и одинаково распределенными переменными. Для однопараметрических распределений, однако, обычно рассматривается ситуация, когда
образуют случайную выборку из общего однопараметрического распределения, как в примерах 3.4.4, 3.4.5 и 3.4.6. При таких обстоятельствах и слабых ограничениях распределение, обладающее достаточной статистикой, должно принадлежать к экспоненциальному семейству распределений, определяемому следующим образом.
Определение 3.4.2. Экспоненциальное семейство. Однопараметрическое экспоненциальное семейство (или класс экспоненциального типа) одномерных распределений имеет в
следующую
где
— произвольные функции указанных аргументов, ограниченные только тем, что
— плотность распределения, т. е.
должна быть неотрицательна и нормализована. (Этот класс иногда называют классом Дармуа—Питмана—Купманса.)
При применении критерия факторизации из теоремы 3.4.1 к (3.4.5) можно увидеть, что распределение выборки можно записать в форме произведения:
откуда статистика
достаточна для
.
Если к тому же
несмещенная оценка
, то она удовлетворяет неравенству Крамера—Рао (3.3.5) [см. (3.3.8)]. Оценка
в таком случае несмещенная, эффективная и достаточная.
Примером экспоненциального семейства могут служить п.р.в. однопараметрического гамма-распределения с параметром формы
[см. пример 3.4.6]:
что имеет вид (3.4.5) с
Достаточная статистика
есть
или любая функция от нее в соответствии с примером 3.4.6, где установлено, что статистика
достаточна для в.
В приведенных выше примерах рассмотрены биномиальное и отрицательное распределения.
Пример 3.4.6 а. Биномиальное распределение как член экспоненциального семейства. Если X — число успехов в фиксированном количестве
испытаний Бернулли с вероятностью успеха
, то п.р.в. X в точке
равна:
откуда
Это выражение имеет форму (3.4.5) с
Поэтому биномиальное распределение входит в экспоненциальное семейство, и статистика
достаточна для
[см. пример 3.4.4].
Пример 3.4.6, б. Отрицательное биномиальное распределение принадлежит экспоненциальному семейству. Если по контрасту с ситуацией из примера 3.4.6 а,
— число испытаний Бернулли (0), требующееся для достижения фиксированного числа х успехов, то
имеет отрицательное биномиальное распределение, для которого
(ср. с примером 3.3.0). Здесь
и снова мы видим, сравнивая с (3.4.5), что плотность распределения вероятности принадлежит экспоненциальному семейству и
— достаточная статистика для
.
Пример 3.4.6 в. Влияние усечения. Положим, что X — пуассоновская переменная с параметром
и что в выборке
наблюдений X значение
встретилось
раз,
Вероятность получения такой выборки равна:
Поскольку это произведение имеет вид (3.4.4), где
и
то
(сумма всех к наблюдавшихся значений) достаточна для
.
Теперь предположим, что нулевые значения
были ненаблюдаемы, возможно, из-за ошибок эксперимента или неприспособленности оборудования; тогда X имеет усеченное пуассоновское распределение
раздел 6.7] с отсутствующим нулевым классом [см. II, пример 6.7.2]. Плотность распределения вероятности в точке
в этом случае будет равна:
Вероятность выборки равна:
что также имеет вид произведения (3.4.4) с
(та же статистика, что и для неусеченного случая),
Следовательно,
достаточна для
.
Этот последний пример иллюстрирует общий результат об усечении X (непрерывной или дискретной) с п.р.в.
и достаточной статистикой для в. Оказывается, если наблюдаемы лишь значения X, удовлетворяющие условию
то у усеченного распределения тоже есть достаточная статистика для в. Действительно, поскольку
принадлежит к экспоненциальному семейству (3.4.5), усеченную п.р.в. можно представить в виде
где
и, таким образом,
где
Следовательно,
тоже принадлежит экспоненциальному семейству и имеет достаточную статистику для
.