Главная > Селекция и распознавание на основе локационной информации
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

ГЛАВА 8. ОЦЕНКА ЭФФЕКТИВНОСТИ СЕЛЕКЦИИ

8.1. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ПОРЯДКОВЫХ СТАТИСТИК

Теория порядковых статистик изучает свойства элементов упорядоченной выборки. Упорядочением (ранжированием) выборки называется расположение ее элементов в порядке возрастания или убывания. В дальнейшем для определенности будем рассматривать

только выборки, элементы которых расположены в порядке возрастания, т. е. для любых выполняется Элементы ранжированной выборки представляют собой случайные величины, законы распределения которых хотя и связаны с законами распределения генеральной совокупности, из которой получена выборка, однако отличаются от них весьма значительно. Конечно, ранжированная выборка может быть получена и случайно, однако вероятность этого события равна и уже при менее 0,01. Элементы упорядоченной выборки как статистические величины и объект статистического исследования называются порядковыми статистиками.

Интуитивно почти очевидно, что при известном законе распределения генеральной совокупности вид и параметры закона распределения порядковой статистики определяются как ее номером в выборке, так и объемом выборки .

Приведем вывод формул, которые позволяют связать интегральную функцию и плотность распределения порядковой статистики в выборке объема с интегральной функцией и плотностью исходного распределения. Вероятность того, что в выборке объема ровно элементов не превосходят некоторого значения , следовательно, остальные элементов превосходят это значение, распределена по биномиальному закону

Отсюда вероятность того, что порядковая статистика не превосходит этого значения

Плотность распределения (8.2) находим дифференцированием этого выражения

Сумму в (8.3) удается свернуть, в результате чего это выражение становится более компактным:

Можно предложить более простое, хотя, возможно, и менее строгое, обоснование этой формулы. Все множество возможных значений случайной величины разобьем на три подмножества: Вероятность того, что ровно элементов в выборке объема окажутся левее точки элементов — правее точки можно вычислить, использовав биномиальную схему:

Аналогично вероятность попадания ровно одного из элементов в интервал при биномиальной схеме распределения

Совместная вероятность этих двух независимых событий равна их произведению и, очевидно, совпадает с Отсюда непосредственно следует формула (8.4).

В дальнейшем будем часто пользоваться наибольшими и наименьшими порядковыми статистиками. Вероятность того, что наибольшая из случайных величин с интегральной функцией распределения окажется меньше некоторого значения или, что то же самое, все случайные величины в выборке объема окажутся меньше этого значения можно рассчитать по формуле

Это непосредственно следует из определения интегральной функции распределения. Плотность распределения наибольшей порядковой статистики определяется дифференцированием

Аналогично интегральная функция распределения наименьшей порядковой статистики

Дифференцируя (8.9), определяем плотность распределения наименьшей порядковой статистики

Формулы (8.7) — (8.10) можно получить и непосредственно из (8.2) и (8.4).

Если - четная функция, т. е. то Вообще, если т. е. она симметрична относительно некоторого значения с, то и

Это означает, что для симметричной плотности распределения исходной случайной величины при изучении свойств экстремальных

порядковых статистик достаточно ограничиться изучением одной из них, например максимальной.

Рассмотрим далее числовые характеристики порядковых статистик — математическое ожидание и дисперсию. Обозначим через математическое ожидание и дисперсию наибольшей порядковой статистики для исходного распределения

Распределение экстремальных порядковых статистик данного типа подробно рассмотрены в [69]. С ростом распределение группируется возле среднего значения которое возрастает приблизительно пропорционально Что касается то этот параметр стремится к нулю, однако скорость сходимости является очень малой. Предельным для распределений является двойной показательный. - закон который близок к зависимостям порогового типа.

Параметры используются при оценке эффективности селекции и обнаружения в локаторах второго эшелона. В последнем случае значение (число разрешаемых объемов) может достигать десятков и сотен тысяч (табл. 8.1).

Таблица 8.1 (см. скан)

Приведенные в табл. 8.1 данные позволяют оценить математическое ожидание и дисперсию наибольшей порядковой статистики при произвольных исходных нормальных распределениях. С учетом (8.7)

где — параметры исходного распределения. В результате замен переменных получаем

Аналогично

В силу симметрии плотности исходного распределения относительно значения для параметров распределения наименьшей порядковой статистики имеем

Распределения порядковых статистик в значительной мере отличаются от гауссовских. Количественной характеристикой этих отличий являются моменты более высоких порядков — асимметрия и эксцесс (табл. 8.2). Напомним, что для нормального распределения асимметрия равна нулю, а эксцесс . С ростом асимметрия и эксцесс возрастают, хотя скорость этого роста уменьшается. В дальнейшем при оценке эффективности селекции распределения экстремальных порядковых статистик будем


Таблица 8.2. (см. скан)

аппроксимировать гауссовскими, параметры которых — математическое ожидание и дисперсия — совпадают с соответствующими значениями распределений порядковых статистик. Возможность подобной замены объясняется тем, что при оценке эффективности селекции распределения экстремальных порядковых статистик используются в композиции с другими (преимущественно гауссовскими) распределениями. В результате композиция распределений оказывается более близкой к гауссовскому, чем распределения отдельных слагаемых. Кроме того, при малых форма распределений порядковых статистик мало отличается от формы гауссовского, а при больших дисперсия этих распределений оказывается столь малой, что их вклад в суммарное распределение сводится в основном к сдвигу математического ожидания; параметры формы результирующего распределения при этом изменяются мало. Строгое доказательство этих соображений потребовало бы проведения довольно громоздких выкладок и вычислений. Правомерность гауссовской аппроксимации подтвердим более простым и вместе с тем более убедительным способом: сравним результаты расчета вероятности правильной селекции, полученные при использовании точных формул для распределений порядковых статистик, с результатами, полученными при их аппроксимации гауссовскими распределениями.

Как будет показано далее, погрешность оценки вероятности правильной селекции не превышает 0,001 во всем диапазоне изменения параметра

В заключение отметим, что порядковые статистики не являются статистически независимыми. Их совокупность представляет собой простую марковскую последовательность. Это, в частности, означает, что порядковая статистика в сочетании с ее рангом (номером в упорядоченной выборке) обладает некоторыми свойствами оценок. Между порядковой" статистикой и ее рангом существует определенная статистическая связь, которая с ростом объема выборки становится все более жесткой, переходя в пределе в функциональную зависимость. В некоторых случаях оценки параметров распределений, полученные при использовании порядковых статистик, оказываются даже более эффективными, чем, например, оценки максимального правдоподобия. Так, оценка среднего равномерного распределения

(А — размах распределения), определяемая только по экстремальным статистикам

имеет дисперсию оценки

Точность этой оценки выше точности выборочного среднего. Однако применительно к нормальным распределениям эффективность оценок вида (8.18) уступает оценке выборочного среднего.

В любом случае с большей или меньшей степенью определенности порядковая статистика характеризует не столько какое-либо конкретное измерение, сколько наблюдаемую выборку в целом. Это означает, что принятие решений при селекции основывается, по существу, на использовании полной информации, полученной по всем объектам наблюдаемой группы.

Приведенные краткие сведения из теории порядковых статистик позволяют провести оценку эффективности используемых при селекции статистических решающих правил порядкового типа.

1
Оглавление
email@scask.ru