Главная > Теория распознавания образов (статистические проблемы обучения)
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

§ 8. Двойственная задача

Точно так же как при нахождении обобщенного портрета, здесь оказывается удобным перейти к двойственной задаче. Воспользуемся условиями Куна – Таккера. Согласно теореме 14.4, для того чтобы величина , рассматриваемая как функция  и , достигала минимума при ограничениях (14.20) в точке  необходимо и достаточно, чтобы

а) точка  удовлетворяла (14.20) и

б) градиент функции в этой точке раскладывался с положительными коэффициентами по градиентам ограничений, которые достигаются в точке .

Иными словами, необходимо и достаточно, чтобы существовали такие числа  и , что

,                   (14.25)

и, кроме того,

,

причем

,

.      (14.26)

Рассмотрим теперь функцию

,

где положено

.

Будем искать максимум этой функции при ограничениях

, ,

.                       (14.27)

Согласно условиям Куна – Таккера, для того чтобы максимум функции  при ограничениях (14.27) достигался в точке , необходимо и достаточно, чтобы:

а) точка  удовлетворяла условиям (14.27) и

б) существовали числа ; такие, что

,

и , , где положено .

Ввиду произвольности положительных чисел ,  условие б) равносильно существованию числа  такого, что

,

                      (14.28)

и

,

.                   (14.29)

Сопоставляя условия Куна – Таккера для минимума функции  при ограничениях (14.20) и для максимума функции  при ограничениях (14.27), получаем следующую теорему.

Теорема 14.10. Точка , в которой достигается максимум функции  при ограничениях (14.27), и вектор , доставляющий минимум функции  при ограничениях (14.20), связаны соотношением

.                  (14.30)

Таким образом, для нахождения оптимальной разделяющей гиперплоскости достаточно найти максимум функции  при ограничениях (14.27), определить  из (14.30) и задать гиперплоскость уравнением

.

Отметим, что функция  имеет, вообще говоря, не единственный максимум. Но все точки , доставляющие максимум этой функции при ограничениях (14.27), соответствуют одному и тому же вектору .

Значение максимума функции  позволяет судить о расстоянии между выпуклыми оболочками множеств  и , которое равно

.

Действительно,

.

Напомним, что значения  и  отличны от нуля только для тех векторов , для которых

,          .

Поэтому с учетом (14.27)

.

Следовательно,

.

Наконец,

.

Последнее соотношение позволяет в ходе практического вычисления оптимальной разделяющей гиперплоскости оценивать зазор между разделяемыми множествами. А именно, если найдена точка , удовлетворяющая условиям (14.27), и значение функции  в этой точке равно , то «зазор» не превосходит .

Для множеств, не разделимых гиперплоскостью, т. е. таких, выпуклые оболочки которых пересекаются, функция  в области, определяемой соотношениями (14.27), возрастает неограниченно.

 

1
Оглавление
email@scask.ru