Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
5.8.4. ПРОЦЕДУРА ВИДРОУ — ХОФФАРанее было отмечено, что функцию псевдообращения: 1) не возникает трудностей в случае, когда матрица
Будет полезно убедиться, что если
где
Таким образом, алгоритм спуска всегда дает решение независимо от того, будет ли матрица Несмотря на то что матрица
На первый взгляд алгоритм спуска представляется таким же, как правило релаксаций. Однако главное их различие состоит в том, что правило релаксаций является правилом коррекции ошибок, так что 5.8.5. МЕТОДЫ СТОХАСТИЧЕСКОЙ АППРОКСИМАЦИИВсе итеративные процедуры спуска, рассмотренные ранее, были детерминированными: задавали некоторое множество выборок и образовывали вполне определенную последовательность весовых векторов. В данном пункте придется слегка отступить и рассмотреть процедуры решения по методу наименьшей квадратичной ошибки со случайно формируемыми выборками, что приводит к образованию случайной последовательности весовых векторов. Для полного анализа потребовалось бы использование теории стохастической аппроксимации, и мы бы с этим не справились. Однако основные идеи, которые можно дать без доказательства, просты. Предположим, что выборки взяты независимо путем выделения состояний природы с вероятностью Даже если метка z будет бинарной, это может быть истолковано как зашумленный вариант байесовской разделяющей функции
и
так что условное среднее для z задается выражением
Предположим, что требуется аппроксимировать
где известны как базисные функции
Для минимизации
Данное заключение также должно следовать из того факта, что z, по существу, является зашумленным вариантом
то можно получить решение в замкнутой форме
Таким образом, один из способов, основанный на использовании выборок, состоит в оценке
Рис. 5.11. Аппроксимация байесовской разделяющей функции. Допустим, что вместо действительного градиента подставлено выражение для зашумленного варианта
который, по существу, представляет собой правило Видроу — Хоффа. Можно показать, что если матрица
то
Причины наложения данных условий на Конечно, указанный алгоритм не единственный и не лучший алгоритм спуска для минимизации
то можно видеть, что алгоритм Ньютона для минимизации
Стохастическим аналогом данного алгоритма является
при
или, что эквивалентно
С помощью данного алгоритма также образуется последовательность весовых векторов, сходящихся к оптимальному решению в среднеквадратичном. В этом случае последовательность сходится быстрее, однако требуется выполнение большего количества вычислений за шаг. Указанные градиентные процедуры могут рассматриваться как методы минимизации функции критерия, или определения нуля ее градиента, в присутствии помех. В литературе по статистике такие функции, как условиям сходимости более общих процедур. К сожалению, представление данных методов в полном объеме завело бы нас довольно далеко, и в заключение мы можем лишь посоветовать интересующимся читателям обратиться к литературе.
|
1 |
Оглавление
|