Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
4.2. Оценка и представление результатов обработки данных нечеткими методами автоматической классификации4.2.1. Оценка качества нечеткой классификацииКак правило, результаты классификации, помимо содержательного осмысления и интерпретации, подлежат некоторой объективной оценке. В силу разнородности нечетких методов автоматической классификации, что особенно характерно для группы эвристических методов, каких-либо универсальных показателей качества полученной классификации не предлагается. В случае эвристических алгоритмов методы оценки классификации иногда предлагаются вместе с конкретным алгоритмом классификации. В частности, для оценки классификации С. Тамура, С. Хигути и К. Танака [163, с. 64-65] используют такие показатели, как коэффициент корректно классифицированных объектов, коэффициент некорректно классифицированных объектов и коэффициент нерасклассифицированных объектов. Следует, однако, указать, что для вычисления подобных коэффициентов необходимо знать реальную структуру данных или, в крайнем случае, иметь в наличии экспертное разбиение, так что эти коэффициенты могут быть использованы для оценки собственно метода классификации, а не результатов его применения к некоторым данным с неизвестной структурой. В отличие от эвристических методов нечеткого подхода к решению задачи кластерного анализа, для группы оптимизационных методов предложены несколько показателей, характеризующих полученное нечеткое разбиение
где, как и ранее,
Наиболее известными из предложенных показателей является коэффициент разбиения, предложенный в работе [85] и подробно обсуждавшийся в работах [58], [166]:
а также энтропия разбиения, предложенная в работе [58]:
Данные показатели обладают следующими свойствами: 1) В случае, когда полученное разбиение является четким, то есть 2) В случае, когда полученное разбиение является наиболее неопределенным, то есть когда Таким образом, диапазон значений коэффициента разбиения определяется неравенством Главной целью использования коэффициента разбиения образом, их полезность, однако невозможно судить, какое значение показателей является наилучшим и наиболее соответствующим числу классов» [144, с.135]. Таким образом, целесообразным оказывается использование пропорциональной экспоненты, предложенной в работе [184]:
диапазон значений которой не зависит от числа нечетких кластеров в нечетком разбиении и выражается неравенством Коэффициент разбиения
что можно переписать в виде Помимо модификации коэффициента разбиения
где
Исследуя коэффициент разбиения
где W — матрица четкого разбиения, имеющая, так же, как и матрица Р, размерность с
элементы которой определяются следующим образом:
Взаимосвязь между коэффициентом четкости
Используя методологию, детально рассмотренную в работе [166], можно построить соответствующий график, называемый Е. Траувертом ( (см. скан) Рис. 4.1. Диаграмма Траувсрта и ее интерпретация Представление матрицы нечеткого разбиения Р с помощью диаграммы Трауверта соответствует среднему всех представлений векторов принадлежностей, составляющих матрицу Р. Интерпретация диаграммы Трауверта может проводиться в двух направлениях, как это изображено на рис. 4.1: 1) по направлению от 2) по направлению от Последняя ситуация известна также, как случай «цепочек», «мостиков» между кластерами и схематически изображена на рис. 1.4 в виде кластеров А и В. Е. Трауверт отмечал, что Предпринятое рассмотрение различных методов оценки нечеткой классификации наглядно демонстрирует, что показатели, характеризующие нечеткое разбиение, несмотря на их полезность для анализа полученной классификации, не могут быть использованы для выявления действительной структуры исследуемой совокупности объектов, так что нельзя не согласиться с В. Педричем, отмечавшим, что при решении задачи нечеткой классификации «будет разумным использовать различные методы и сравнивать полученные результаты» [144, с. 135]. Соображения, подобные приведенному замечанию, просматриваются также в работах [96], [97], [98]. В свою очередь, помимо оценки качества разбиения, можно также исследовать некоторые характеристики отдельных кластеров для детального рассмотрения их структуры. К примеру, Э. Г. Распини [149], [150] для исследования свойств отдельных кластеров использовал уже упоминавшееся соотношение
выражающее относительный размер кластера
показывающее среднюю плотность точек вокруг некоторой точки
В. Педричем [144] предлагается весьма интересный и многообещающий подход к решению проблемы представления структуры нечетких кластеров, так что целесообразно его рассмотреть подробнее. Поскольку значение функции
так что, производя нормализацию этого показателя умножением правой части выражения (4.16) на константу с
то есть
Таким образом, получается множество ядер
где первая составляющая правой части представляет собой существенную для рассмотрения структуру, а вторая соответствует малосущественной структуре множества Для аналитического представления
где символ Т обозначает операцию транспонирования, так что центрами гиперсфер будут точки
При взятии первой производной
дает решение
где
Налагая дополнительные ограничения в форме системы уравнений
где
Таким образом, построение аналитического представления ядер Наряду с гиперсферической формой, в работе [144] также рассматривается ситуация гиперзллиптической формы ядер нечетких кластеров, рассуждения для которой незначительно отличаются от приведенных выше. Порог
Следует отметить, что величина, определяемая выражением (4.27), соответствует мощности нечеткого множества что в результате ядра нечетких кластеров автоматически устанавливаются распределением значений принадлежностей. Вместе с тем, как указывает В. Педрич, порог
|
1 |
Оглавление
|