13.4.2.2. Мера сходства между объектом и представителем
Для того чтобы определить меру сходства между объектом и представителем, рассмотрим образ пространства при ортогональном преобразовании которое переводит расстояние, задаваемое симметричной, положительно определенной матрицей в расстояние, задаваемое диагональной матрицей составленной из собственных значений матрицы Мера сходства между объектом и представителем задается равенством
вектор перекодированных значений переменных на объекте х.
13.4.3. Оптимизируемый критерий
В качестве критерия мы будем использовать отображение причем, как и в 13.3.3, справедливы определение (3) и выражения для входящих в него параметров, кроме в данном случае где центр тяжести, расстояние Махаланобиса, ассоциированное с классом Формула (4) принимает вид
где вектор значений переменных для объекта диагональная, положительно определенная матрица, соответствующая
Таким образом, можно записать:
Определим матрицу
Тогда
Матрица К определяется в 13.3.3. Таким образом, критерий позволяет оценить, насколько адекватны разбиение и представительство
13.4.4. Задача оптимизации
Задача состоит в том, чтобы одновременно определить: разбиение на однородные классы (с минимальной суммой внутриклассовых инерций);
семейство квадратичных расстояний локально адаптируемых к структуре
числовые метки, которые были бы совместимы с начальными неоднородными данными.
По тем же причинам, что и в 13.3.4, векторы перекодированных значений переменных полагаются нормированными и центрированными в метрике Таким образом, решается следующая задача оптимизации:
где вектор-столбец из единиц.
13.4.5. Описание алгоритма
См. 13.3.5.
13.4.5.2.3. Оцифровка количественных данных
Первый подход. При использовании полиномиальной регрессии решение имеет вид
где
Второй подход. Если минимизировать невязку, то, как и в 13.3.5.2.3, получим
вектор, принадлежащий гиперплоскости удовлетворяющий
где является -ортогональным проектором на ортогональное дополнение
Третий подход. Здесь описывается оцифровка посредством прямого разложения квадратичного адаптивного расстояния. Для этого каждому классу поставим в соответствие матрицу Махаланобиса:
где ковариационная матрица класса (см. 7). является аналогом матрицы задающей в классе расстояние Матрица вещественна, симметрична и положительно определена, значит, можно найти матрицу такую, что Минимум инерции класса равен
Таким образом, найдено преобразование позволяющее минимизировать инерцию класса В качестве вектора меток количественной переменной можно взять значение всякого преобразования, способствующего уменьшению этой инерции. Пусть
можно положить
13.4.6. Сходимость алгоритма
См. 13.3.6.
13.4.7. Связь между оцифровкой переменных и определением некоторых адаптивных расстояний
Используя формулу (27), можно критерий представить в следующем виде:
Поскольку определены, положим:
— квадратичное расстояние между объектом х и центром тяжести класса Таким образом,
где семейство квадратичных расстояний, определенных на
Заключение. Итак, если определена матрица имеет место связь (эквивалентность) между адаптивной оцифровкой и определением семейства адаптивных расстояний минимизирующих критерий.