§ 4. Двойственная задача
В этом параграфе будет
рассмотрена частная задача квадратичного программирования, решение которой
эквивалентно построению обобщенного портрета.
Введем пространство параметров
,
и рассмотрим в нем функцию
,
где
вектор
есть
.
Будем искать максимум этой
функции в положительном квадранте
,
.
Для построения разделяющих
гиперплоскостей существенным оказывается то, что точка максимума
,
функции
в положительном
квадранте определяет обобщенный портрет для заданного параметра
, а значение максимума
определяет
расстояние между проекциями векторов первого и второго классов на направление
обобщенного портрета.
Итак, рассмотрим точку максимума
,
функции
в положительном квадранте.
Необходимыми и достаточными
условиями максимума функции
в точке
,
являются условия:
Выпишем
эти условия, обозначив
,
получим
(14.13)
Условия (14.13) могут быть
переписаны в виде неравенств (14.3)
,
и
равенств (14.12)
,
.
Согласно
утверждению теоремы 14.6, эти условия однозначно определяют обобщенный портрет
.
Таким образом, связь между
обобщенным портретом и максимумом функции
в положительном квадранте устанавливает
следующая теорема.
Теорема 14.7. Для того чтобы функция
была ограничена
сверху в положительном квадранте, необходимо и достаточно, чтобы
имело допустимое
значение. При допустимом
точка
, в которой достигается условный максимум
в
положительном квадранте, задает обобщенный портрет соотношением
.
Существует также связь между
значением этого максимума
и модулем обобщенного портрета.
Теорема 14.8. При допустимом
максимум функции
в положительном
квадранте равен половине квадрата модуля обобщенного портрета
.
Доказательство. Действительно, по
теореме 14.7
,
поэтому
и,
вспоминая, что отличны от нуля лишь коэффициенты при крайних векторах
и
, имеем
.
Таким
образом,
.
Теорема
доказана.
Из теоремы 14.8 вытекает важное
для конструирования алгоритмов построения разделяющих гиперплоскостей
следствие.
Следствие. В случае, когда среди крайних
векторов обобщенного портрета
встречаются векторы обоих классов,
справедливо соотношение
(
,
), (14.14)
причем
равенство достигается при
,
.
Здесь
есть расстояние между
проекциями классов
и
на
направление обобщенного портрета. Действительно, в силу теоремы 14.8
.
Далее,
по условию
,
.
Поэтому
.
Отсюда,
учитывая, что
,
получаем
(14.14).
Это следствие используется для
конструирования критерия неделения. В самом деле, будем считать, что два
множества
и
не могут
быть разделены с допустимым «зазором» с помощью обобщенного портрета
,
, если соответствующая величина
меньше
заданной константы
.
Тогда существование такой точки
,
, что
, (14.15)
и
будет означать, что множества неразделимы с заданным зазором с помощью
обобщенного портрета
.
Итак, согласно теоремам 14.7 и
14.8, максимум
в
положительном квадранте определяет обобщенный портрет, а, согласно следствию,
тот факт, что при
максимум
еще не достигнут, означает, что множества неразделимы с зазором, большим, чем
.
Таким образом, проблема
построения обобщенного портрета свелась к поиску максимума функции
в положительном
квадранте или оценке снизу величины максимума этой функции.
Оказывается, что и другие методы
построения разделяющей гиперплоскости в определенном смысле реализуют различные
алгоритмы поиска максимума функции
в положительном квадранте. Это
обстоятельство дает возможность сравнивать их между собой: тот алгоритм
построения разделяющей гиперплоскости эффективнее, в основе которого лежит
более эффективная процедура максимизации функции
.