Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
§ 12. Некоторые статистические особенности метода обобщенного портретаВ главе VI были получены оценки качества алгоритмов, строящих разделяющие гиперплоскости методом минимизации эмпирического риска.
В частности, было показано, что
для детерминистского случая математическое ожидание вероятности ошибочной
классификации с помощью решающего правила, построенного по выборке длины
где
Были получены и верхние оценки качества. Верхние оценки были двух типов – зависящие от размерности пространства (эти оценки следует из общей теории равномерной сходимости) и оценки, зависящие от относительного расстояния (эти оценки следуют из обобщенной теоремы Новикова 6.2). В этом параграфе будут
исследованы оценки качества алгоритмов, реализующих метод обобщенного портрета.
Будет показано, что для этих алгоритмов справедливы одновременно оценки обоих
типов (тем самым выполняется лучшая из них). При этом существенно то, что
верхняя оценка, зависящая от размерности, значительно ближе к нижней Итак, пусть задача такова, что
для любой выборки длины Оказывается, что при этом
качество
где
Эта оценка может быть еще
усилена. В § 3 было показано, что обобщенный портрет
Это
разложение, вообще говоря, не единственно. Назовем крайний вектор информативным,
если он входит с ненулевым весом во все разложения вектора
Будет показано также, что всегда имеет место неравенство
В практических задачах часто
оказывается, что Для вывода оценок (14.36) и
(14.37) воспользуемся свойством несмещенности оценки скользящего контроля (см.
§ 7 главы VI). Несмещенность означает, что математическое ожидание частоты ошибок
на экзамене после обучения на последовательности длины Справедлива теорема Теорема 14.11. Число ошибок при скользящем
контроле не превосходит числа информативных векторов обобщенного портрета Доказательство. Достаточно показать, что при удалении неинформативного вектора из обучающей выборки в ходе скользящего контроля ошибки на этом векторе не произойдет. В самом деле, если вектор
в
которое вектор
или
а значит, удаленный вектор опознается правильно. Теорема доказана. Из теоремы, с учетом несмещенности оценки скользящего контроля, немедленно вытекает неравенство (14.37). Покажем еще, что число
информативных векторов никогда не превосходит размерность пространства Действительно, если в разложении
(14.38) входит более
причем
в это разложение входят только те векторы, которые входят в (14.38) с ненулевым
весом, и по крайней мере одно Тогда выражение
задает
семейство разложений обобщенного портрета по своим крайним векторам. Поскольку
все Для метода обобщенного портрета
при
где
Нетрудно убедиться, что число
Если, как и раньше, воспользоваться несмещенностью оценки скользящего контроля, то для вывода (14.40) достаточно доказать следующую теорему. Теорема 14.12. Число ошибок при скользящем
контроле для метода обобщенного портрета при Доказательство. Пусть дана
обучающая последовательность Соответственно
Обозначим
через
и одновременно
Поэтому
Далее,
Для
крайнего вектора
Будем
считать далее, что обобщенный портрет
Кроме
того, как было показано при доказательстве предыдущей теоремы, это возможно
только в том случае, когда Исследуем теперь левую часть
неравенства (14.41). Для этого рассмотрим один шаг максимизации функции
Отсюда
получаем оптимальное значение
Увеличение
Так
как
Объединяя (14.41), (14.42), (14.44), получим
откуда, учитывая (14.43)
Аналогично оценивается
Учитывая,
что
Пусть теперь при скользящем
контроле число неправильно опознаваемых векторов первого и второго классов
равно соответственно
где
Далее,
Окончательно
при
При
В
случае
Теорема доказана.
|
1 |
Оглавление
|