6.7. ОЦЕНКИ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ ПО ГРУППИРОВАННЫМ, ЦЕНЗУРИРОВАННЫМ И УСЕЧЕННЫМ ДАННЫМ
6.7.1. ДИСКРЕТНЫЕ ДАННЫЕ
Рассмотрим таблицу частот:
Наблюдения производятся над генеральной совокупностью с дискретной
. В нашей таблице
— наибольшее значение наблюдений. Данные наблюдений могут быть представлены не в такой полной форме. В частности, они могут быть: а) усечены, б) сгруппированы, в) цензурированы.
а) Усечение. В качестве примера рассмотрим таблицу частот:
Здесь данные усечены, т. е. частоты
отсутствуют (это может быть, например, следствием ошибок регистрации измерительного прибора). Имеющиеся наблюдения тогда можно представить как выборку из некоторой гипотетической совокупности с п.р.в.
Если исходная генеральная совокупность имеет пуассоновское распределение с параметром
то усеченное распределение (усеченное так, как сказано выше) имеет п.р.в., равную
при этом функция правдоподобия будет пропорциональна
Опуская неинформативные множители, за функцию правдоподобия в этом случае можно взять
где, как обычно, у обозначает среднее выборки,
— объем выборки. Оценка максимального правдоподобия
есть подходящий корень уравнения правдоподобия
которое в нашем примере соответствует квадратному уравнению
б) Группировка и цензурирование. В качестве другого примера записи данных рассмотрим следующую таблицу частот:
Здесь частоты
отдельно не фиксируются, они сгруппированы, известна лишь их сумма
. Аналогично сгруппированы частоты
Что касается частот
то ни одна из них не фиксируется отдельно; известно лишь, что число элементов выборки со значением, которое больше или равно
было
. Последняя операция над данными называется цензурированием (аналогично можно было бы цензурировать левый конец, т. е. данные с наименьшими значениями, или цензурировать оба конца). В этом случае функция правдоподобия имеет вид
где
— правый хвост ф.р. На практике данные могут быть сгруппированы, но не цензурированы, или цензурированы, но не сгруппированы, а также одновременно и сгруппированы, и цензурированы, с усечением или без усечения. Во всех подобных ситуациях можно быть уверенным, что с помощью численных методов уравнение правдоподобия будет решено.
Пример 6.7.1. Данные из пуассоновского распределения, сгруппированные по ячейкам. В качестве примера сгруппированных дискретных данных рассмотрим таблицу частот из раздела 3.2.2. При пуассоновском с параметром в исходным распределением функция правдоподобия имеет вид
где значения
известны.
В этом примере эффект группировки (два наблюдения в классе «12, 13 или 14») незначителен, поэтому можно ожидать, что значение в, максимизирующее функцию правдоподобия, будет близко к соответствующему значению при условии, что оба наблюдения будут принадлежать классу «13». Отсюда следует, что это значение
можно
принять в качестве первого приближения о.м.п. Оно равно средней модифицированных данных, т. е. 3,871. Истинная оценка максимального правдоподобия максимизирует функцию
т. е. является корнем уравнения правдоподобия. Это уравнение, как нетрудно проверить, имеет вид
Подходящий корень
что достаточно близко к первому приближению