Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
13.2. Определение, вычисление и основные числовые характеристики главных компонентВо многих задачах обработки многомерных наблюдений и, в частности, в задачах классификации исследователя интересуют в первую очередь лишь те признаки, которые обнаруживают наибольшую изменчивость (наибольший разброс) при переходе от одного объекта к другому. С другой стороны, не обязательно для описания состояния объекта использовать какие-то из исходных, непосредственно замеренных на нем признаков. Так, например, для определения специфики фигуры человека при покупке одежды достаточно назвать значения двух признаков (размер — рост), являющихся производными от измерений ряда параметров фигуры. При этом, конечно, теряется какая-то доля информации (портной измеряет до одиннадцати параметров на клиенте), как бы огрубляются (при агрегировании) получающиеся при этом классы. Однако, как показали исследования, к вполне удовлетворительной классификации людей с точки зрения специфики их фигуры приводит система, использующая три признака, каждый из которых является некоторой комбинацией от большого числа непосредственно замеряемых на объекте параметров. Именно эти принципиальные установки заложены в сущность того линейного преобразования исходной системы признаков, которое приводит к главным компонентам. Формализуются же эти установки следующим образом. Следуя общей оптимизационной постановке задачи снижения размерности (13.2) и полагая анализируемый признак X
(где матрица
а ее строки удовлетворяют условию ортогональности), что
Полученные таким образом переменные Первой главной компонентой k-й главной компонентой Замечание 1 (переход к центрированным переменным). Поскольку, как увидим ниже, решение задачи (а именно вид матрицы линейного преобразования L) зависит только от элементов ковариационной матрицы 2, которые в свою очередь не изменяются при замене исходных переменных хпеременными Замечание 2 (переход к выборочному варианту). Поскольку в реальных статистических задачах располагаем лишь оценками Вычисление главных компонент. Из определения главных компонент следует, что для вычисления первой главной компоненты необходимо решить оптимизационную задачу вида
где
Следовательно, задача (13.7) может быть записана
Вводя функцию Лагранжа
что дает систему уравнений для определения
(здесь Для того чтобы существовало ненулевое решение системы (13.8) (а оно должно быть ненулевым, так как
Этого добиваются за счет подбора соответствующего значения Учитывая, что
Поэтому для обеспечения максимальной величины дисперсии переменной
Подставляем Далее аналогично можно показать, что Таким образом соотношения для определения всех
где
Основные числовые характеристики главных компонент. Определим основные числовые характеристики (средние значения, дисперсии, ковариации) главных компонент в терминах основных числовых характеристик исходных переменных и собственных значений матрицы 2: а) б) ковариационная матрица вектора главных компонент:
Умножая слева соотношения
на
и, следовательно:
Из (13.10), в частности, следует подтверждение взаимной некоррелированности главных компонент, а также в) сумма дисперсий исходных признаков равна сумме дисперсий всех главных компонент. Действительно,
Следствие. Из б) и в), в частности, следует, что критерий информативности метода главных компонент (13.9) может быть представлен в виде
где Кстати, представление Действительно, анализируя с помощью (13.9) изменение относительной доли дисперсии, вносимой первыми Замечание 3. Использование главных компонент оказывается наиболее естественным и плодотворным в ситуациях, в которых все компоненты К таким примерам можно отнести исследование структуры бюджета времени индивидуумов (все
Рис. 13.1. Изменение относительной доли суммарной дисперсии исследуемых признаков, обусловленной первыми Если же различные признаки
где Замечание 4. В некоторых задачах оказывается полезным понятие так называемых обобщенных главных компонент, при определении которых оговаривают более общие
где
где Заметим, кстати, что если в качестве матрицы весов выбрать матрицу
то, как легко показать, обобщенные компоненты (в метрике Проиллюстрируем определение главных компонент на численном примере, заимствованном из [279]. Пример 13.1. По данным измерений (в мм) длины
Решая, в соответствии с (13.4), кубическое уравнение (относительно К) вида
находим Подставляя последовательно численные значения
В качестве главных компонент получаем
Здесь под Вычисление относительной доли суммарной дисперсии, обусловленной одной, двумя и тремя главными компонентами, в соответствии с формулой (13.9) дает
Отсюда можно сделать вывод, что почти вся информация о специфике размеров панциря данного вида черепах содержится в одной лишь первой главной компоненте, которую и естественно использовать при соответствующей классификации исследуемых особей.
|
1 |
Оглавление
|