Главная > Методы анализа данных. Подход, основанный на методе динамических сгущений
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

8.3. ПРИМЕНЕНИЕ ДИСКРИМИНАНТНОГО ТИПОЛОГИЧЕСКОГО АНАЛИЗА

8.3.1. Методология

Цель дискриминантного анализа состоит в том, чтобы для исследуемой совокупности найти решающее правило, которое дало бы возможность различать априори заданные группы. Это правило должно позволять относить каждого нового индивидуума к одной из групп. Задание априорного разбиения на классы, необходимое для применения методов классического дискриминантного анализа, фактически предопределяет результаты. С другой стороны, очень часто оказывается, что разбиение совокупности на классы имеет элементы субъективизма или даже случайно.

Дискриминантный типологический анализ сходен с дискриминант-ным анализом с точки зрения построения решающего правила, однако в процессе работы итеративного алгоритма он позволяет ставить под сомнение априорные группы.

Алгоритм, начинаясь с некоторого априорного разбиения, определяет дискриминантное подпространство, затем относит каждого индивидуума к тому классу, чей центр тяжести в проекции на дискриминантное подпространство является самым близким. Полученное к моменту сходимости алгоритма разбиение будет устойчивым в смысле применяемого правила отнесения индивидуумов к классам.

Если выбор начального разбиения удачный, то для новых индивидуумов этот алгоритм даст правило отнесения, незначительно отличающееся от правил факторного дискриминантного анализа. Если, напротив, классы начального разбиения размыты и недостаточно однородны, то алгоритм даст правило отнесения, которое приведет к еще менее надежным классам, чем заданные априори.

Прежде чем описать результаты, полученные с помощью дискриминантного типологического анализа, приведем несколько основных предположений, при которых он использовался.

Пусть множество из индивидуумов, характеризуемых числовыми параметрами. С помощью дискриминантного типологического анализа отыскивается разбиение множества на классов фиксировано) и подпространство размерности фиксировано), которое минимизирует внутриклассовую инерцию, объясняемую

Пространство снабжено метрикой (задаваемой матрицей, обратной к матрице ковариаций множества Этот поиск осуществляется с помощью алгоритма типа динамических сгущений.

В программе (дискриминантного типологического анализа) пользователем определяются три входных параметра:

разбиение с которого начинает работу алгоритм;

требуемое число классов

требуемое число дискриминантных осей

Далее мы приводим некоторые соображения, позволяющие наилучшим образом выбирать эти три параметра.

Обычно разбиение либо оценивается, либо выбирается случайным образом. Во всех алгоритмах классификации, когда начальное разбиение выбирается случайным образом, есть опасность, что алгоритм сойдется к неинтересным решениям. Вот почему в алгоритмах этого типа рекомендуется делать множество прогонок, меняя начальное разбиение. С другой стороны, существуют методы, позволяющие частично преодолеть это неудобство (например, использование сильных форм, см. 1.3.7, а также [3]).

Подобной опасности, Кто существу, нет в дискриминантном типологическом анализе, где в качестве начального выбирается разбиение, составленное из априорных классов. Действительно, даже если это разбиение вызывает сомнение, классы не лишены смысла. Более того, пользователь все равно должен проверить, не являются ли априорные классы (или хотя бы некоторые из них) хорошо распознаваемыми — случай, когда применимы методы классического дискриминантного анализа. По этому поводу заметим, что если в качестве начального выбирается разбиение на априорные классы, то первая итерация типологического дискриминантного анализа приводит к тем же результатам, что и факторный дискриминантный анализ.

Во всяком случае, какими бы ни были результаты первого анализа, именно они подсказывают, как естественным образом проводить последующую обработку. В частности, если классы начального разбиения плохо распознаваемы (это тот случай, когда дискриминантный типологический анализ применяется в полной мере), то результаты такого анализа подсказывают, как надо перегруппировать, расщепить, смешать классы и получить начальное разбиение для второго этапа алгоритма. Результаты этого этапа позволят аналогичным образом начать возможный третий этап и т. д.

Указанный процесс останавливается, когда выбранное разбиение оказывается устойчивым.

Выбор числа требуемых классов диктуется числом классов начального разбиения.

Необходимое число дискриминантных осей, по-видимому, разумно выбирать близким к например или

8.3.2. Результаты

Первый этап анализа. Анализ с начальным разбиением, заданным априори. Анализ начинается с разбиения на 7 классов заданного априори. Выбрано

Согласно табл. 8.1 установим соответствие:

(см. скан)

Алгоритм останавливается на 5-й итерации и дает разбиение В табл. 8.2 приведено разложение классов разбиения по классам исходного разбиения

Таблица 8.2 (см. скан) Начальное разбиение и разбиение к моменту сходимости алгоритма

Представление центров тяжести (ЦТ) классов

Рис. 8.1

Рис. 8.2

Комментарии. Как и можно было предвидеть, априорное разбиение на 7 классов оказалось неустойчивым. Точнее: класс «исправных» распался на два;

класс также распался на два, часть его сгруппировалась с классом образуя новый класс;

классы и относительно устойчивы; классы и оказались более размытыми и наблюдается тенденция смешивания их.

Изучение представления центров тяжести привело к интересным результатам (аналогично представлению на плоскости в факторном анализе совокупность элементов тем лучше представлена, чем больше разброс ее по осям). Ось 1 отделяет класс от других; несомненно, здесь мы имеем дело с устойчивым классом. Аналогично классы и Ту, хорошо представленные по осям 2 и 3, должны быть устойчивыми. Отметим, наконец, что в случае использования 4 осей классы и ведут себя сходным образом. Согласно табл. 8.2 объединение классов интерпретируется как объединение априорных классов Эти два последних класса определяются наличием дефекта соударения соответственно при торможении и в обоих режимах одновременно. Объединение классов интерпретируется просто как множество объектов из имеющих дефект соударения по крайней мере в режиме торможения. Специалисты указали, что класс (входящий в представляет собой множество машин из имеющих характерный дефект производства (напомним, что априорное разбиение на типы определялось только по особенностям функционирования).

Малая стабильность класса (машины без дефекта) отражает то, что понятие исправной машины является «размытым». Перечисленные результаты и их интерпретация подсказывают следующее новое разбиение множества на 5 классов:

Введение класса оправдано определениями априорных классов и

— гул только при торможении;

— гул при разгоне и торможении.

В классе объединены машины, имеющие небольшой (с точки зрения специалиста) дефект — гул или удар — только в режиме разгона, что соответствует классам Машины, рассматриваемые априори как бездефектные, но не попавшие в естественно объединять с этими машинами, имеющими небольшой дефект.

Второй этап анализа. Дискриминантный типологический анализ начинается с разбиения определенного выше. Выбрано

Алгоритм сходится за 2 итерации к разбиению аналогичному разбиению С с точки зрения интерпретации классов.

Представление центров тяжести классов.

Рис. 8.3

Рис. 8.4

Комментарии. Как уже отмечалось, алгоритм сходится за 2 итерации к разбиению . Табл. 8.3 подтверждает устойчивость разбиения, выбранного в качестве начального для нашего алгоритма.

Таблица 8.3 (см. скан)

Графическое представление показывает, что: первая дискриминантная ось позволяет выделить вторая ось разделяет классы четвертая ось позволяет разделить классы . Пять полученных классов, помимо устойчивости, допускают содержательную интерпретацию.

Табл. 8.4 помогает сравнить классификацию нашей совокупности, полученную в результате дискриминантного типологического анализа с априорной классификацией.

Таблица 8.4 (см. скан)

Объединения не удивительны, они соответствуют дефекту одного типа и, по-видимому, отражают следующий факт. Когда оператор слышит аномалию, более ярко выраженную при торможении, чем при разгоне, он имеет тенденцию забывать аномалию при разгоне (в самом деле, прослушивание при торможении осуществляется после прослушивания при разгоне).

Класс выделившийся из класса соответствует, как мы видели, дефекту, достаточно хорошо объясняемому метрологически. Метрологический анализ показал, что 11 машин обладают резко выраженным доминирующим дефектом. Эти машины вошли в класс насчитывающий 13 элементов.

Диагноз относительно семейства исправных машин может показаться слишком строгим, но, как оказалось, он не удивляет специалистов и определенным образом подтверждается метрологической экспертизой.

Напротив, объединение семейств в класс не столь удовлетворительно, хотя довольно естественно назвать класс С классом «небольшого дефекта в режиме разгона».

Интересно было посмотреть, проведя новый анализ, можно ли различить семейства в задаче разбиения на 6 вместо пяти классов.

Начальное разбиение для этого анализа соответствовало разбиению в том случае, когда группа не отделяется от класса образуя 6-й класс.

Полученный результат при этом не заслуживает большого доверия. В самом деле, 3 из 12 элементов класса начального разбиения присоединились к классу

Нам показалось разумным ограничиться результатами, полученными на этапе анализа, давшем разбиение на пять «естественных» классов. Отметим, кстати, что, по нашему мнению, неуместно требование любой ценой разделить группы методом дискриминантного типологического анализа. Поступая так, теряют большую часть преимуществ этого метода, а устойчивость полученных результатов в итоге оказывается сомнительной.

В наших исследованиях мы рассматривали вместе режимы разгона и торможения. Однако переменные, соответствующие режиму торможения, являются мешающими для распознавания семейств, которые различаются по переменным, соответствующим режиму разгона. Кроме того, чтобы разделить семейства и нам кажется разумным ввести второй уровень дискриминации, проводя исследования только по переменным в режиме разгона.

Дополнительные исследования. Эти исследования учитывали работу машины только в режиме разгона, цель их — выяснить, можно ли разделить:

группы и входящие в

группы и входящие в

группу и подгруппу входящие в

Наиболее убедительными оказались результаты следующего анализа. Выбрано было Начальное разбиение следующее:

(см. скан)

Индивидуумы групп и рассматриваются при этом как анонимные: они не участвуют в анализе, но распределяются затем по классам, полученным к моменту сходимости алгоритма. Результаты этого анализа можно резюмировать так: он недвусмысленно показал, что нельзя разделить классы и

напротив, оказалось возможным построить исходя из этого анализа второй уровень дискриминации, позволяющий расщепить класс Те элементы из и которые расположены в одном и том же классе, неправильно классифицируются;

разделение групп и исходя из результатов этого анализа также возможно. Лишь элементы в классе в классе 2 неправильно классифицируются;

напротив, границы семейства исправных машин очень нечеткие. В частности, тщетно пытаться отделить подгруппу исправных от группы

анализ показывает, что можно ввести второй уровень дискриминации и добиться разделения классов «гул» и «удар» при разгоне.

Categories

1
Оглавление
email@scask.ru