Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
13.5. Главные компоненты в задачах классификацииОбщие идеи использования главных компонент в задачах классификации. Дуализм в постановке задачи. Очевидно, возможность геометрической интерпретации и возможность наглядного представления исследуемых наблюдений Так, например, одного взгляда на рис. 13.3, на котором изображены проекции тридцати одного Уловить же это распадение непосредственно в исходном восемнадцатимерном пространстве Источником оптимизма в отношении результатов использования такого проецирования исследуемых многомерных наблюдений на плоскость являются, как легко сообразить, геометрические экстремальные свойства главных компонент, в частности вышеупомянутые свойства 1—3, в соответствии с которыми проецирование исходной совокупности наблюдений в пространство меньшей размерности, «натянутое» на В действительности далеко не всякие геометрические свойства исходной совокупности наилучшим образом сохраняются при проецировании в плоскость первых двух главных компонент.
Рис. 13.3. Расположение проекций 18-мерных наблюдений на плоскость первых двух главных компонент Так, если при проецировании исходных данных на плоскость стараются максимально сохранить разделимость существующих в исходном многомерном пространстве «сгустков», скоплений точек, то базисные оси такой плоскости будут, вообще говоря, отличаться от первых двух главных компонент. Так же, как и от осей, дающих решение аналогичной задачи при требовании (к результату проецирования) наиболее точно «выловить» резко выделяющиеся на фоне основной группы наблюдения, и т. д. Решению подобных задач, т. е. поиску плоскостей, проецирование исходных данных на которые максимально сохраняет те или иные, но наперед заданные, их геометрические свойства, посвящен раздел IV, а соответствующие методы называются методами целенаправленного проецирования. Перед тем как перейти к некоторым конкретным примерам применения главных компонент в задачах классификации, обратим внимание читателя на возможную двойственность (дуализм) в интерпретации многомерного наблюдения Действительно, если в матрице наблюдений
рассматривать в качестве наблюдения столбцы Очевидно, задачи классификации в одном Замечание о необходимости нормировки в пространстве Для того чтобы это оказалось учтенным при проектировании «наблюдений»
гдед И наконец, в целях большего удобства технического представления результатов исследования (графиков, таблиц и т. п.) помимо необходимой нормировки иногда еще дополнительно центрируют рассматриваемые наблюдения т. е. переходят в конечном счете к наблюдениям В дальнейшем, как правило, будем предполагать вспомогательные операции нормировки и центрирования в пространстве П" (X выполненными, но в целях упрощения обозначений будем опускать две верхние волнистые черточки при записи соответствующих пронормированных и процентрированных наблюдений. Применение главных компонент при анализе структуры семейного потребления Результаты проецирования Таблица 13.1 (см. скан) Применение главных компонент при анализе производительности труда рабочих. Различные показатели производительности труда Задача изучения зависимости показателей производительности труда от набора регулируемых (и нерегулируемых) признаков
Рис. 13.4. Исследование взаимосвязей между признаками, характеризующими структуру и объем семейного потребления Схема 1. Состоит из двух этапов: 1) разбиение исследуемой совокупности рабочих на однородные группы в пространстве объединенных признаков (X, Y), например, с помощью главных компонент, построенных по набору признаков 2) статистическое исследование зависимостей типа Схема 2. Состоит из трех этапов: 1) разбиение исследуемой совокупности рабочих на однородные группы в пространстве признаков-аргументов 2) расщепление вектора признаков-аргументов 3) статистическое исследование зависимостей типа
и
произведенное отдельно внутри каждой однородной группы подпространства
означает векторную функцию от ( В [9] приводятся результаты статистического анализа исходных данных по 100 работницам-ткачихам Интересный пример применения главных компонент, в прямой и двойственной постановках задачи, связанный со статистической обработкой экспертных оценок применительно к задаче классификации картин абстрактной живописи, читатель найдет в [181].
|
1 |
Оглавление
|