Главная > Методы анализа данных. Подход, основанный на методе динамических сгущений
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

9.1.2. Агрегирование данных о предпочтениях

Агрегировать данные о предпочтениях — значит дать сжатое их описание, притом сделать это наилучшим образом с помощью одного или многих отношений предпочтения заданного типа. Очень часто стремятся после этого объединить (синтезировать) предпочтения судей в единую классификацию сравниваемых объектов для того, например, чтобы выбрать наиболее ценные объекты.

Всюду в дальнейшем будет обозначать множество отношений предпочтения исследуемого типа. Часто эти отношения будут снабжаться оцифровкой 7, выбранной из множества допустимых оцифровок, определенного для каждого Одновременно для индивидуального отношения предпочтения судей вводятся множества допустимых оцифровок и функция несходства для измерения расхождения между любой оцифровкой из и любой оцифровкой на

Пригодность пары где отношение предпочтения из а у — оцифровка к объединению индивидуальных предпочтений судей будет измеряться величиной

Таким образом, пригодность тем выше, чем ближе эта величина к 0.

Наконец, наилучший синтез индивидуальных предпочтений по определению будет осуществляться парой доставляющей решение задачи:

В дальнейшем предполагается, что множество конечно и для каждого задача

имеет единственное решение которое будем называть оптимальной оцифровкой предпочтения

Исчерпывающее перечисление известных вариантов приведенной выше модели вывело бы нас очень скоро за рамки этой главы, поскольку задача часто сопряжена с комбинаторными трудностями [24], [15], [18], [4], [30], [22], [5], [11]. Поэтому мы ограничимся здесь несколькими наиболее известными вариантами. Медианные отношения.

(мера несходства, обобщающая расстояние Хемминга).

Для отношение турнира} задача решена с применением мажорантного правила Кондорсе [23]. Подробно изученный случай, когда отношение порядка} приводит к задачам, решаемым методами ветвей и границ [9], [24], [18] или методами целочисленного программирования [22]. Последние применяются также для других случаев: отношение предпорядка - отношение квазипорядка}, но с гораздо большими трудностями. Все же в связи с этим можно рекомендовать читателю работы [13], [15], [25], [3].

Отношения, максимизирующие количество информации. В этом случае оцифровки являются вероятностными отношениями, отображениями из в [0, 1], такими, что

Полагают

Этот критерий, идущий от теории информации, особенно интересен статистическими свойствами, которыми обладают решения задачи [1].

В модели 1 Брэдли-Терри [6], [81, [91, [18].

вероятностное отношение, х строго предпочтительнее

Задача может быть решена методами, применимыми для исследования медианных порядков.

В модели 2 Брэдли-Терри [6], [1]

вероятностное отношение, х строго предпочтительнее

Алгоритм Форда [12] позволяет, при некоторых ограничениях, решить задачу

Средние отношения. Теперь оцифровки являются нотациями, т. е. отображениями в качестве выбирают

В методе Борда [24], [11]

-нотация, х строго предпочтительнее

Задача решается путем вычисления средней функции значимости индивидуумов.

В методе пермутоэдра [18]

Задача решается методом вычисления путей наименьшей длины в графе, снабженном оценкой [18], [19].

В методе оптимальной оцифровки с порогами [7].

нотация, х строго предпочтительнее и если где отношение квазипорядка, то нотация, х строго предпочтительнее неразличимы

Этот метод, содержательный, только когда индивидуальные данные являются квазипорядками, был придуман для устранения неустойчивости аналогичного метода, основанного на алгоритме Крускала (17] и содержательного только тогда, когда индивидуальные данные являются предпорядками [19]. Оцифровка основана на свойстве квазипорядков, установленном в [27]. Задача выражается в терминах выпуклого анализа: в двух выпуклых множествах найти две точки, находящиеся на минимальном расстоянии.

Categories

1
Оглавление
email@scask.ru