§ 8. Двойственная задача
Точно так же как при нахождении
обобщенного портрета, здесь оказывается удобным перейти к двойственной задаче.
Воспользуемся условиями Куна – Таккера. Согласно теореме 14.4, для того чтобы
величина
,
рассматриваемая как функция
и
, достигала минимума при ограничениях
(14.20) в точке
необходимо
и достаточно, чтобы
а)
точка
удовлетворяла
(14.20) и
б)
градиент функции в этой точке раскладывался с положительными коэффициентами по
градиентам ограничений, которые достигаются в точке
.
Иными словами, необходимо и
достаточно, чтобы существовали такие числа
и
, что
, (14.25)
и,
кроме того,
,
причем
,
. (14.26)
Рассмотрим теперь функцию
,
где
положено
.
Будем искать максимум этой
функции при ограничениях
,
,
. (14.27)
Согласно
условиям Куна – Таккера, для того чтобы максимум функции
при ограничениях (14.27)
достигался в точке
,
необходимо и достаточно, чтобы:
а) точка
удовлетворяла
условиям (14.27) и
б) существовали
числа
;
такие, что
,
и
,
, где положено
.
Ввиду произвольности
положительных чисел
,
условие б) равносильно существованию
числа
такого,
что
,
(14.28)
и
,
. (14.29)
Сопоставляя условия Куна –
Таккера для минимума функции
при ограничениях (14.20) и для
максимума функции
при
ограничениях (14.27), получаем следующую теорему.
Теорема 14.10. Точка
, в которой достигается
максимум функции
при
ограничениях (14.27), и вектор
, доставляющий минимум функции
при ограничениях
(14.20), связаны соотношением
. (14.30)
Таким образом, для нахождения
оптимальной разделяющей гиперплоскости достаточно найти максимум функции
при ограничениях
(14.27), определить
из (14.30) и задать гиперплоскость
уравнением
.
Отметим, что функция
имеет, вообще
говоря, не единственный максимум. Но все точки
, доставляющие максимум этой функции при
ограничениях (14.27), соответствуют одному и тому же вектору
.
Значение максимума функции
позволяет судить о
расстоянии между выпуклыми оболочками множеств
и
, которое равно
.
Действительно,
.
Напомним, что значения
и
отличны от нуля
только для тех векторов
, для которых
,
.
Поэтому
с учетом (14.27)
.
Следовательно,
.
Наконец,
.
Последнее соотношение позволяет в
ходе практического вычисления оптимальной разделяющей гиперплоскости оценивать
зазор между разделяемыми множествами. А именно, если найдена точка
, удовлетворяющая
условиям (14.27), и значение функции
в этой точке равно
, то «зазор» не превосходит
.
Для множеств, не разделимых
гиперплоскостью, т. е. таких, выпуклые оболочки которых пересекаются, функция
в области,
определяемой соотношениями (14.27), возрастает неограниченно.