Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
10.2.2. Неитеративный алгоритм.Неитеративный вариапг алгоритма построения нелинейного преобразования получается следующим образом. Из конечного множества классифицированных объектов образуем скалярную функцию расстояния, которая связывает расстояния в исходном пространстве с расстояниями в преобразованном пространстве. Эта функция расстояния «в среднем» уменьшает расстояния внутри классов, сохраняя неизменными расстояния между классами. Построенная по небольшому числу «опорных точек», функция расстояния задает некоторое преобразование, которое можно применить для модификации еще не классифицированных объектов в реальном времени. При этом не требуется использовать итеративные вычислительные процедуры. Кроме того, не накладывается никаких ограничений ни на число классов, ни на число переменных [Кунтц, 1972а]. Начнем с того, что перепишем (10.39) в виде
где
где
и
Критерий (10.43) имеет тот же вид, что и критерий напряжений (10.30), и измеряет степень улучшения разделимости и сохранения структуры исходной конфигурации. Предположим, что в качестве можно взять любые положительные числа. В таком случае У (10.43) минимизируется, если
для каждой пары
Соотношения (10.47) показывают, что точки, характеризующие дискретную зависимость между расстояниями, лежат на одной из двух прямых линий, проходящих через начало координат, как показано на рис. 10.7. На рис. 10.7 большая часть малых расстояний — расстояния внутри классов, между тем как большие расстояния, — в основном, расстояния между классами. Этого может не быть в случае сложных конфигураций.
Рис. 10.7. Дискретная функция расстояния. Например, если один из классов имеет бимодальное распределение, расстояния внутри классов могут быть как малыми, так и очень большими, в то время как расстояния между классами могут принимать некоторые промежуточные значения. Мы будем предполагать, что дискретная функция расстояния (10.47) достаточно регулярна, так что связь между расстояниями
для всех пар
где
в определить оптимальные коэффициенты
Эта задача представляет собой стандартную задачу аппроксимации в смысле наименьших квадратов. Критерий
где
и
Следовательно, оптимальный выбор
Формула (10.57) достаточно проста с точки зрения объема вычислений. Матрица Обращение матрицы несложно, так как порядок полинома Построенная таким образом функция расстояния является ключом к построению алгоритма нелинейного преобразования. Имея любые две точки в пространстве X, можно определить расстояние между их образами в пространстве У.
Рис. 10.8. Полиномиальные функции расстояний, К сожалению, для данной конфигурации в пространстве X обычно не существует конфигурации в пространстве У, которая находилась бы в точном соответствии с функцией расстояния. Однако мы сейчас помажем, что иногда можно построить конфигурацию, которая почти точно соответствует этой функции. Пусть
где сокращаются, и мы получаем
Вводя обозначения
можно записать уравнение (10.59) в матричной форме
Если точки Опорные точки 1. Вычислить 2. Используя функцию расстояния, найти соответствующие расстояния между точками в пространстве У. 3. Найти дыдущем шаге. Это не представляет труда, так как размерность пространства лишь на единицу меньше числа точек. Таким образом, после того как по объектам обучающей последовательности определены опорные точки в пространствах X и Y, мы можем отобразить новый объект X в пространство У с помощью следующего алгоритма. 1. Вычислить расстояние
3. Решить (10.63), т. е.
Уравнение (10.65) определяет У как линейное преобразование вектора С, который является нелинейной функцией от Преобразование (10.65) можно упростить. Заметим, что линейный классификатор, определенный на У, может оказаться не лучшим, чем классификатор, определенный на С. Поэтому векторы С, так же, как и векторы У, можно использовать в качестве признаков. Использование С вместо У исключает необходимость нахождения При выводе (10.63) предполагалось, что точка У, расположенная на заданном расстоянии от каждой опорной точки, действительно существует. Однако, если эти расстояния заданы произвольно, наличие такой точки гарантировать нельзя. Тем на менее, решение уравнения (10.63) дает некоторую точку. Как интерпретировать У в этом случае? Можно обойти это затруднение, если без дополнительной аргументации задать линейное преобразование в виде (10.65). К сожалению, этим мы наносим ущерб ранее приведенным аргументам, касающимся улучшения разделимости. Однако геометрическая интерпретация может помочь объяснить, что происходит с У в этом случае. Каждое уравнение в (10.59) или (10.63) определяет гиперплоскость, связанную с гиперсферами с центрами в Понятие радикальной оси двух окружностей иллюстрируется рис. 10.9. Если две окружности пересекаются, радикальная ось является их общей хордой, проходящей через точки пересечения. Радикальная ось не существует, когда окружности являются концентрическими. Решением уравнения (10.63) является пересечение радикальных осей
Рис. 10.9. Положение радикальной оси двух окружностей. а) пересекающиеся окружности; б) непересекающиеся окружности. Решением уравнения (10.65) является, как показано на рисунке, пересечение радикальных осей. Это решение дает приемлемую компромиссную точку. Возможны, однако, задачи, в которых расстояния между основными точками малы по сравнению с Пример 10.4. Объекты, показанные на рис. 10.11, не являются линейно разделимыми из-за того, что распределение класса В бимодально. Однако, поскольку перекрытие невелико, нелинейное преобразование может, по-видимому, улучшить разделимость. Эти объекты генерировались в соответствии с нормальными распределениями следующим образом. Класс А: 100 объектов, порожденных нормальным распределением с математическим ожиданием и ковариационной матрицей
Класс В: 2 раза по 50 объектов, порожденных двумя нормальными распределениями с математическими ожиданиями и ковариационными матрицами
(кликните для просмотра скана) Для построения функции расстояния при данных значениях Рис. 10.12. (см. скан) График разброса отображенных объектов для Эффективность преобразования определялась путем применения преобразования Таблица 10.4 (см. скан) Ошибки классификации (в процентах) для различных значений порядка полинома Предпочтительнее, однако, чтобы преобразование было не слишком «вычурным». Поэтому выбор не самых крайних, а промежуточных значений для
|
1 |
Оглавление
|