Главная > Методы анализа данных. Подход, основанный на методе динамических сгущений
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

5.3.4. Разложение псевдоинерции

Как и ранее, предполагаем, что данные так разбиты на классов что удовлетворяется достаточное условие вычислимости псевдоцентров тяжести (см. 5.3.2.3).

Пусть псевдоцентры тяжести классов. Тогда полная псевдоинерция запишется в виде

Величина разложена на три члена, которые мы последовательно рассмотрим.

1) Прежде всего, в выражении

мы узнаём псевдоинерцию класса относительно его псевдоцентра тяжести.

Следовательно, величина

играет ту же роль, что и внутриклассовая инерция в случае, когда векторы являются полными.

Мы назовем эту величину внутриклассовой псевдоинерцией и обозначим ее через Следовательно, по определению

2) С другой стороны, имеем

Однако выражение в квадратных скобках равно нулю по определению псевдоцентра тяжести класса (см. 5.3.2.3).

3) Наконец, последний член запишется так:

Но в случае полных данных межклассовая инерция выражалась в виде (см. 5.3.1)

поскольку Сравнив правые части последних двух выражений, мы видим, что величина играет ту же роль, что и межклассовая инерция. Назовем это выражение межклассовой псевдоинерцией и обозначим через в. Итак,

Теперь мы в состоянии записать полную псевдоинерцию в виде

Как и в случае полных данных, есть постоянная (т. е. не зависящая от способа разбиения) характеристика облака неполных объектов.

В то же время зависят от способа разбиения множества на классов. В частности, есть показатель концентрации объектов классов вокруг их псевдоцентров тяжести, показатель взаимной удаленности классов друг от друга.

Замечание. Величина показателя которую мы только что определили, должна интерпретироваться с осторожностью, так как она является только аппроксимацией истинного значения В частности, легко показать, что означает, что все данные сливаются с центром тяжести класса, к которому они принадлежат.

Categories

1
Оглавление
email@scask.ru