Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
Глава 12. АДАПТИВНЫЕ РАССТОЯНИЯ12.1. ВВЕДЕНИЕВ большинстве существующих алгоритмов используется единая мера сходства для всего множества 12.2. МЕТОД АДАПТИВНЫХ РАССТОЯНИЙ12.2.1. Пространство представительствОпределим пространство представительств
Мера сходства между подмножеством
Если 12.2.2. АлгоритмИспользуется общий алгоритм, описанный в гл. 1, применительно к введенному выше пространству представительств 12.2.2.1. Функция назначенияСледуя 1.2.4, определим функцию назначения Если
Поскольку
Таким образом, каждый класс 12.2.2.2. Функция представительстваСледуя 1.2.3, определим функцию представительства Если
Ниже будет раскрыт смысл пары Предложение. Если В — конечное подмножество
единственная, причем Это утверждение является следствием двух классических результатов. 1. Квадратичная метрика 2. Точка, относительно которой инерция множества В минимальна, совпадает с центром тяжести В. Это утверждение является следствием теоремы Гюйгенса. Отсюда, в частности, следует, что функция представительства будет ставить в соответствие разбиению 12.2.2.3. Свойства алгоритмаСходимость доказана для общего случая (см. 1.3.6). Критерий имеет вид
где Очевидно, что метрика не выбрана раз и навсегда, а определяется для каждого класса заново. Приведем другие выражения критерия. Используя свойства расстояния Махаланобиса, можно доказать следующие предложения. Предложение 1. Критерий (2) может быть записан в виде
где Доказательство. Критерий (2) является суммой инерций, а каждая инерция в метрике Махаланобиса равна Предложение 2. С помощью описанной процедуры определяются такие классы, для каждого из которых произведение дисперсий по главным осям инерции минимально. Доказательство. Можно заменить матрицы
Свойство инвариантности Предложение 3. Последовательность разбиений Доказательство. Известно, что при преобразовании базиса, задаваемом невырожденной матрицей 12.2.3. Случай необратимой ковариационной матрицы12.2.3.1. Постановка задачиОписываемый алгоритм на всех шагах итерации для каждого класса требует обращения соответствующей ковариационной матрицы. Это возможно тогда и только тогда, когда подпространство, порожденное каждым классом, имеет размерность Пусть на некотором шаге
Вклад Предложение 4. Если
Доказательство. Обозначим через X и вектор-столбцы пространства
где
Согласно предположению матрица
С другой стороны, последние
Из равенства Следствие. Если матрица 12.2.3.2. РешениеПоскольку не существует расстояния, минимизирующего величину На предыдущем шаге вклад
Достаточно выбрать такое
и вклад
Будем действовать как при доказательстве предложения 4: заменяя
Обозначим через —
Будем искать матрицу
где
Матрица Определим расстояние где
Тогда
Таким образом, расстояние 12.2.4. Пример применения метода адаптивных расстояний12.2.4.1. Исходные данныеМы будем использовать данные из [4] и [8] для решения задачи оценивания смеси распределений. Имеется 150 точек, взятых из 3 двумерных нормальных распределений, определяемых средними
и ковариационными матрицами
На рис. 12.2 представлено геометрическое изображение данных, на рис. 12.1 приводятся координаты элементов выборки. Первые 50 точек принадлежат первому распределению, точки с номерами 51—100 имеют распределение со средним (кликните для просмотра скана) 12.2.4.2. РезультатыИспользовался алгоритм адаптивных расстояний, причем число классов задавалось равным 2, 3, 4, 5, 7, 9. Для каждого случая производилось 20 классификаций и выбиралась та, которой соответствовало наименьшее значение критерия. На рис. 12.3 (а)-(е) представлены соответствующие результаты классификации и значения критерия
Рис. 12.3(a). Два класса
Рис. 12.3(6). Три класса
Рис. 12.3(b). Четыре класса
Рис. 12.3(г). Пять классов
Рис. 12.3(д). Семь классов
Рис. 12.3(e). Девять классов 12.2.4.3. Результаты, полученные методом динамических сгущений с использованием единого расстоянияЧисло классов было взято равным трем. Каждое представительство состояло из трех точек исходного множества. Использовалось евклидово расстояние. На рис. 12.4 приводится наилучшая из 20 классификаций.
Рис. 12.4. Метод динамических сгущений (расстояние фиксировано) 12.2.4.4. ЗаключениеСравним результаты двух методов. В случае адаптивного расстояния 3 элемента были ошибочно классифицированы, тогда как при применении обычного метода динамических сгущений число таких элементов равнялось 23 (точка считается ошибочно классифицированной, если после работы алгоритма она относится не к тому классу, из которого она выбрана). Здесь виден недостаток методов, в которых дисперсия вычисляется в единой метрике. Такие методы имеют склонность к выделению классов сферической формы. В описываемом примере данные сформированы из классов другого вида. Результаты показывают, что использование адаптивных расстояний помогает преодолеть этот недостаток. Заметим, что метод разделения смеси распределений [8] дает примерно те же результаты, что и метод адаптивных расстояний. В самом Деле, разница между двумя алгоритмами невелика и заключается только в вычислении расстояний: водном случае в качестве расстояния между точкой и парой
где
|
1 |
Оглавление
|