Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
2.6. МЕТОД ЦЕНТРА ТЯЖЕСТИПредставление классов центрами тяжести очень распространено. По словам Уишарта [13], очевидно, Торндайк 112] является первым, кто предложил процедуру итеративного уточнения местоположения центров тяжести, в чем можно убедиться, в частности, прочитав следующую его фразу (1954 г.): «Вообще говоря, элемент является неправильно расклассифицированным, если он к членам другого кластера ближе, чем к членам своего следующее изменение не сможет уменьшить величину среднего внутриклассового разброса». Затем Себастьян [11], Дженси [71 и Форжи [6] усовершенствовали процедуру итеративного повторного перераспределения элементов по классам, близкую по своей сути к той, что была предложена Торндайком. Наконец, Мак-Куин [9] предложил следующую процедуру. Из подлежащей классификации совокупности объектов извлекаем случайным образом Болл и Холл [1] и [2] создали очень популярный в США метод, названный ISOOATA. Он состоит в случайном отборе В статье Фридмана и Рубина [51 подвергается сомнению критерий внутриклассовой дисперсии и предлагается критерий, инвариантный относительно линейного преобразования переменных. Все описанные алгоритмы требуют от пользователя «размещения» своих объектов в евклидовом пространстве, в то время как в предлагаемом нами подходе этого не требуется. 2.6.1. Пространство представительствКаждый элемент множества Отправляясь от этого метрического пространства Мера адекватности между
2.6.2. Оптимизационная задачаВ данном случае оптимизационная задача состоит в отыскании такой пары
где Очевидно, что критерий выражает среднюю внутриклассовую дисперсию разбиения 2.6.3. АлгоритмАлгоритм, описанный в 1.3.5, дает возможность найти локальный оптимум для этой задачи. Для того чтобы он был применим к этой задаче оптимизации, необходимо соблюдение условий, сформулированных в следующих двух гипотезах. Гипотеза 1. Минимум Проверим соблюдение этого условия в нашем случае:
Одно из хорошо известных свойств евклидова расстояния определяет справедливость следующего положения: минимум
где
(с очевидностью следует из определения Замечание. Метод центра тяжести требует дополнительно (по сравнению с предыдущим методом) определения на элементах множества 2.6.4. Распространение на непрерывный случайРаспространим метод центра тяжести на случай, когда Рассмотрим вероятностное пространство — определенная на
где
2.6.4.1. ОпределенияПусть 1) мера, определенная на множествах 2) положительная мера 3) положительная мера 4) две числовые и
5) будем называть центром тяжести подмножества множества
где Теорема Лебега — Никодима. Пусть
причем 2.6.4.2. Построение алгоритма динамических сгущенийНапомним используемые обозначения. Расстояние
Будут использованы также два разбиения Построение функции назначения. Определим класс
Его построение сводится, таким образом, к построению следующей разделяющей гиперплоскости
Если
Построение функции представительства. Вычисляем
при Критерий
Так как
Замечание. Если Алгоритм метода центра тяжести является, следовательно, частным случаем только что определенного алгоритма. 2.6.4.3. ТеоремаАлгоритм, определенный таким образом, приводит к убыванию критерия Доказательство. Пусть
По определению центра тяжести для всякого
так что
Функция назначения
Следовательно, при любом
откуда, суммируй на
из этого вытекает, что
Пусть 2.6.4.4. ПримерРассмотрим вероятностное пространство Лебега — Никодима существует плотность
причем
Требуется произвести разбиение множества
Рис. 2.1 Вариант 1. Положим
Соответственно
Вариант 2. Положим
Соответственно
Рис. 2.2
|
1 |
Оглавление
|