Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
14.4. Статистические оценкиСтатистическая оценка может быть кратко описана следующим образом: наблюдается событие, которое может быть вызвано любой одной причиной из семейства взаимно исключающих друг друга возможных причин (или связано с любым одним явлением из семейства возможных явлений природы). Каждой из этих возможных причин приписано значение определенного параметра или совокупности параметров. Требуется по результатам наблюдения определить, которая из причин скорее всего имеет место, т. е. найти соответствующее значение параметра или совокупности параметров. Итак, как и в случае статистической проверки гипотез, мы зададим пространство У всех возможных значений некоторой наблюдаемой величины (или величин) и совокупность известных вероятностей Эта абстрактная формулировка станет, может быть, более ясной, если мы разъясним ее на простом примере. Пусть известно, что некоторая величина у определяется гауссовским распределением с нензвестным средним значением
являющееся функцией точки у пространства У. При тех же условиях можно поставить задачу оценки Согласно определению оценки, ею является всякая функция от у, независимо от того, дает ли она хорошее, отличное или смехотворно произвольное значение для истинного значения параметра. Существуют различные критерии, позволяющие судить о пригодности и качестве оценки. Во-первых, когда распределения в У полностью определяются заданием а, так что каждая плотность из семейства плотностей распределений вероятностей в Y может быть записана в виде
где
Если распределение вероятностей в У не определяется полностью одним параметром, то условие, соответствующее (14.39), тем не менее может быть написано; однако в этом случае оно представляет собой более сильное ограничение. Так, например, если семейство распределений определяется двумя параметрами а и
Несмещенность не является достаточной гарантией качества оценки. Оценка а
Если а
Условие оптимальности оценки, которое мы будем употреблять, будет состоять в том, что среди всех несмещенных оценок данного класса оптимальная оценка должна будет обладать минимальной дисперсией. Как и при проверке гипотез, нередко представляет интерес, насколько улучшаются статистические выводы с увеличением числа независимых наблюдений. Пусть дана последовательность оценок Оценка наибольшего правдоподобия.Принцип наибольшего правдоподобия, изложенный в предыдущем разделе, применим также и к оценкам. Интуитивная идея такого применения состоит в следующем. Пусть при некотором частном наблюдении получено значение у и при этом известно, что в у действует какая-либо плотность из семейства плотностей распределения вероятностей
Это уравнение называется уравнением правдоподобия. Решение его относительно а есть функция а(у), являющаяся некоторой оценкой для а. Возможны решения, имеющие вид являются разумными оценками, так как не зависят от у, и мы исключим их из рассмотрения. Остальные решения уравнения (14.43) называются оценками наибольшего правдоподобия. Известно, что оценки наибольшего правдоподобия обладают свойствами, которые позволяют найти при некоторых обстоятельствах иные оправдания их применения, помимо изложенного выше грубо интуитивного оправдания. При определенных условиях оценки наибольшего правдоподобия обладают минимальной дисперсией в широком классе несмещенных оценок. При более общих условиях оценки наибольшего правдоподобия являются состоятельными и обладают асимптотически минимальной дисперсией. Если имеется
относительно Пример 14.4.1. Пусть У есть
и требуется оценить
Эта оценка является несмещенной, поскольку
Так как
и не зависит от Оценка
Мы можем теперь показать, что среди всех несмещенных линейных оценок
где
поэтому числа
Дисперсия
Согласно равенству (14.50) и неравенству Шварца,
и, следовательно,
Наблюдения и статистики.До сих пор, рассматривая как проверку гипотез, так и задачи, связанные с оценками, мы предполагали заданным пространство результатов наблюдений У, или выборочное пространство. Во многих классических процедурах проверки гипотез производится некоторое число N наперед заданных измерений или наблюдений, которые и доставляют статистические данные. Эти N измерений дают совокупность Предположим, например, что с помощью радиолокатора, работающего импульсами, определяется наличие отражающего объекта в определенном направлении на расстоянии от 20 до 21 мили. В идеальном случае данные, которые поступают на приемное устройство радиолокатора и на основе которых мы можем делать необходимые выводы, состоят из последовательности отрезков, по одному на каждый импульс, с непрерывной записью напряжения как функции времени, длительностью 2/186000 сек. (время, в течение которого радиоволны пробегают 2 мили). Непрерывная запись такого рода содержит несчетное множество значений. Уменьшить это количество данных можно различными путями. Так, например, можно отсчитывать каждый отраженный импульс лишь однажды, т. е. в течение каждого интервала времени, соответствующего дистанциям от 20 до 21 мили, один раз измерять амплитуду принятого сигнала. Предположим, что радиолокатор работает в данном направлении в течение времени, достаточного для излучения и возвращения обратно К импульсов. Тогда выборочная точка имеет Сокращение количества данных при переходе от исходного пространства измерений к выборочному пространству можно рассматривать как отображение или преобразование. Если исходное пространство результатов наблюдений обозначить через М, а входящие в него точки через Совершенно очевидно, что выбор статистики является частью общей статистической задачи и что его нужно делать с должным вниманием. Обычно при сокращении исходных данных часть информации, пригодной для отыскания решения, теряется; однако это происходит не всегда. Так, например, можно показать, что если про некоторую систему величин известно, что эти величины распределены в соответствии с гауссовским законом распределения вероятностей с неизвестными средним значением и дисперсией, и если производятся Гренандер ввел термин «наблюдаемые координаты» для начальной статистики, используемой для получения статистических выводов, касающихся вероятностных процессов. Этот термин кажется подходящим для ситуаций, которые мы здесь рассматриваем, и мы будем пользоваться им в последующих параграфах.
|
1 |
Оглавление
|