13.4.2.2. Мера сходства между объектом и представителем
Для того чтобы определить меру сходства между объектом и представителем, рассмотрим образ пространства
при ортогональном преобразовании
которое переводит расстояние, задаваемое симметричной, положительно определенной матрицей
в расстояние, задаваемое диагональной матрицей
составленной из собственных значений матрицы
Мера сходства между объектом
и представителем
задается равенством
вектор перекодированных значений переменных на объекте х.
13.4.3. Оптимизируемый критерий
В качестве критерия мы будем использовать отображение
причем, как и в 13.3.3, справедливы определение (3) и выражения для входящих в него параметров, кроме
в данном случае
где
центр тяжести,
расстояние Махаланобиса, ассоциированное с классом
Формула (4) принимает вид
где
вектор значений переменных для объекта
диагональная, положительно определенная матрица, соответствующая
Таким образом, можно записать:
Определим матрицу
Тогда
Матрица К определяется в 13.3.3. Таким образом, критерий
позволяет оценить, насколько адекватны разбиение
и представительство
13.4.4. Задача оптимизации
Задача состоит в том, чтобы одновременно определить: разбиение
на однородные классы (с минимальной суммой внутриклассовых инерций);
семейство квадратичных расстояний
локально адаптируемых к структуре
числовые метки, которые были бы совместимы с начальными неоднородными данными.
По тем же причинам, что и в 13.3.4, векторы перекодированных значений переменных полагаются нормированными и центрированными в метрике
Таким образом, решается следующая задача оптимизации:
где
вектор-столбец из
единиц.
13.4.5. Описание алгоритма
См. 13.3.5.
13.4.5.2.3. Оцифровка количественных данных
Первый подход. При использовании полиномиальной регрессии решение имеет вид
где
Второй подход. Если минимизировать невязку, то, как и в 13.3.5.2.3, получим
вектор, принадлежащий гиперплоскости
удовлетворяющий
где
является
-ортогональным проектором на
ортогональное дополнение
Третий подход. Здесь описывается оцифровка посредством прямого разложения квадратичного адаптивного расстояния. Для этого каждому классу
поставим в соответствие матрицу Махаланобиса:
где
ковариационная матрица класса
(см. 7).
является аналогом матрицы
задающей в классе
расстояние
Матрица
вещественна, симметрична и положительно определена, значит, можно найти матрицу
такую, что
Минимум инерции класса
равен
Таким образом, найдено преобразование
позволяющее минимизировать инерцию класса
В качестве вектора меток количественной переменной
можно взять значение всякого преобразования, способствующего уменьшению этой инерции. Пусть
можно положить
13.4.6. Сходимость алгоритма
См. 13.3.6.
13.4.7. Связь между оцифровкой переменных и определением некоторых адаптивных расстояний
Используя формулу (27), можно критерий представить в следующем виде:
Поскольку
определены, положим:
— квадратичное расстояние между объектом х и центром тяжести класса
Таким образом,
где
семейство квадратичных расстояний, определенных на
Заключение. Итак, если определена матрица
имеет место связь (эквивалентность) между адаптивной оцифровкой и определением семейства адаптивных расстояний
минимизирующих критерий.