Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
15.3. МЕТОД С ОГРАНИЧЕНИЯМИ НА РАЗБИЕНИЯ15.3.1. ВведениеЗадача состоит в определении элементов пространства представительств, позволяющих получить разбиение, близкое к заданному. Она похожа на задачу дискриминантного анализа, однако не требует оценки или определения a priori функции плотности для каждого класса. Более того, можно найти простое решающее правило, зависящее только от множества классифицируемых объектов 15.3.2. Описание метода и алгоритмаАлгоритм может быть разделен на две части: в первой определяется наилучший представитель для каждого класса, а во второй проверяется, не притягивает ли этот представитель элементы, принадлежащие другим классам. Пусть
где Используемый алгоритм заключается в следующем. 1. Начальный шаг. Определяются для каждого из заданных классов 2. Назначение. По представителям С строится разбиение
3. Представительство. Пусть Если
принимает максимальное значение. 4. Критерий остановки. Производится проверка: если множество представителей изменилось, то осуществляется переход к шагу (2), иначе работа алгоритма прекращается. Замечание. Существуют и другие способы начала работы алгоритма, кроме описанного на шаге 1. В качестве представителя класса С можно, например, взять элемент, наиболее удаленный от всех других классов, т. е.
для каждого набора Этот метод можно применять к различным расстояниям для того, чтобы определить расстояние и набор соответствующих представителей, порождающих разбиение, наиболее близкое к заданному. 15.3.3. Применение классификации с ограничениями на разбиенияПусть дано 26 букв латинского алфавита и 10 цифр. Каждому символу соответствует несколько характеристик (написаний). Цель анализа состоит в том, чтобы для каждого символа определить написание, представляющее его наилучшим образом и достаточно сильно отличающееся от написаний других букв. Определенный таким образом набор написаний позволяет лучше распознавать новые написания. Множество таких характеристик было найдено (см. [13]). Анализ может быть разделен на две части. В первой части производится описание, цель которого определить существенные черты, позволяющие различать семейства написаний. При этом каждому написанию ставится в соответствие описательный вектор. Поскольку на следующем этапе будут применяться методы многомерного анализа, необходимо, чтобы описывающие переменные (координаты описательного вектора) были однотипными. Для получения количественных описывающих переменных можно воспользоваться методами оцифровки. Затем с помощью факторного анализа соответствий можно будет изучить связи между множеством выбранных количественных переменных и множеством написаний. Такой подход позволяет геометрически визуализировать соотношения между написаниями и переменными в метрике Вторая часть анализа заключается в классификации и дискриминации. Ищется простое правило, решающее вопрос о соответствии написания одному из символов. Здесь можно использовать классические методы, например линейный дискриминантный анализ или метод ближайшего соседа. Ни один из этих методов не позволяет отобрать новый набор характеристик. Однако дискриминантный анализ дает возможность оценить силу дискриминации данного набора характеристик. Например, выбрав дискриминантную функцию
где При таком определении решающего правила имеются два пути улучшения дискриминантной способности: модификация дискриминантной функции множество ошибочно классифицированных его написаний, а также множество написаний других символов, попавших в класс
а показателем отклонения от элементов из
Задача сводится к определению
Рис. 15.1 Описанный выше метод был применен для анализа 121 вида написаний, получаемых на устройстве точечной печати, например буква А может быть представлена четырьмя написаниями (рис. 15.1).
Рис. 15.2 Для буквы
|
1 |
Оглавление
|