Главная > Порядковые статистики — их свойства и приложения
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

Безэталонная классификация

Все знают, как сортируют по крупности помидоры или лимоны: их высыпают на плоскость с отверстиями определенного диаметра, в которые мелкие проваливаются, а более крупные остаются. Провалившиеся мелкие вновь попадают на плоскость с отверстиями еще меньшего диаметра, где процедура повторяется. Так происходит классификация, причем присутствует система эталонов — отверстий с заданными диаметрами. Желая классифицировать любые другие объекты, например камешки из кучи щебня, на мелкие, средние и крупные, мы вновь должны будем обратиться к эталонам. Нам придется конкретизировать понятие «мелкие», сопоставив ему определенное значение наибольшего веса, скажем «средние» — до и «крупные» — свыше Далее, нам нужно будет запастись материальными воплощениями этих значений в эталонах — гирях соответствующего веса и, естественно, компаратором — рычажными весами. Процедура классификации будет заключаться в последовательном сравнении образцов со старшим эталоном и отбором «крупных», затем оставшихся с младшим и отбором «средних». В результате останутся «мелкие».

Источником ошибки здесь будет неверное чтение показаний компаратора либо сбои в работе самого компаратора.

А можно ли разделить кучу щебня на мелкие, средние и крупные камешки не имея гирь-эталонов, а лишь сравнивая камешки между собой? Мы уже знаем, что можно, но для этого понадобится знать закон распределения параметра, по которому производится классификация — в нашем случае веса.

Воспользуемся тем, что, хотя отсутствие эталонов не дает возможности получить реализацию вектора X — выборку значений, наличие компаратора позволяет получить реализацию вектора рангов Потребуется таким образом, разбить на «мелкие», «средние» и «крупные» ранги объектов — номера объектов в ранжированной выборке

Обратимся к рис. 11, где изображена функция распределения а на оси х нанесены, отмеченные римскими цифрами, значения эталонов. Количество эталонов На этой же оси расположены значения параметра X в выборке объема однако нанести их на ось невозможно, так как они неизвестны. Точки, соответствующие значениям поэтому нанесены условно, а арабские цифры означают их ранги.

Если соединить эталонов с выборкой из объектов, т. е. в нашем случае смешать 10 камешков и 4 гири в одну выборку объемом и ранжировать ее, то гири получили бы ранги тем большие, чем больше их

Рис. II

вес. Если с этими же гирями смешивать все новые и новые десятки камешков, можно заметить, что ранги гирь варьируют от выборки к выборке тем меньше, чем больше

Теперь принцип классификации без эталона ясен: нужно, зная и определить ранги эталонов в выборке объемом а затем разбить пространство рангов на область, сравнивая ранги объектов с рангами эталонов. При этом произойдет и классификация объектов по значениям параметра X (по-прежнему неизвестным нам), поскольку, как было показано выше, ранги и соответствующие им выборочные значения связаны тем более тесно, чем больше объем выборки.

Источником ошибок классификации является конечность выборки, не позволяющая точно определять ранги значений эталонов. Задавшись, однако, значениями ошибок первого и второго рода, можно определить необходимый для получения требуемой точности объем выборки.

Итак, закон распределения случайной величины заключает в себе шкалу (эталон), а компаратор, воплощенный в той или иной форме, позволяет эту шкалу построить и использовать для оценивания, идентификации и классификации.

Все это очень интересно, скажет искушенный читатель, но где же взять закон распределения параметра, который неизмерим? Ведь закон распределения строится именно путем обработки большого числа измерений случайной величины. В силу такой точки зрения закон распределения неизмеримого параметра считается неизвестным, а вернее, просто не вызывает интереса у исследователей. Принято считать, что если измерение возможно, он не нужен, а если невозможно — бесполезен. Однако физики знают множество примеров, когда распределение величины известно из теории, а измерение ее выборочного значения невозможно или затруднительно. Так, скорость молекул газа в сосуде подчинена закону распределения Максвелла с известными параметрами, если известны давление и температура.

Точно также без наблюдения за отдельными молекулами можно указать закон распределения их удаления от какой-либо исходной точки при диффузии. Кроме того, существуют величины, неизмеримость которых относительна. Сейчас мы фиксируем скорость бегуна секундомером, а у древних греков не было эталона подходящего масштаба для измерения времени бега на спортивных соревнованиях,

поэтому на олимпиадах древности могла быть зафиксирована лишь последовательность - бегунов на финише — их ранги. Тем не менее каждый бегун обладал определенным значением неизмеримого тогда параметра — скорости. Сейчас эта «величина в себе» объективизировалась так, что известны и ее закон распределения, и мгновенные значения.

Таким образом, безэталониые процедуры могут, с одной стороны, найти область приложения, где законы распределения уже известны, а с другой — стимулировать процесс выяснения этих законов.

1
Оглавление
email@scask.ru