Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
4.5. Добавление шума в обучающие выборкиПредставленные в предыдущих подразделах процедуры формирования сети позволяют улучшить ее способности к обобщению за счет воздействия на архитектуру сети. Это основной метод, обеспечивающий достижение требуемого уровня обобщения. Однако и после формирования стабильной и минимальной архитектуры сети возможно дальнейшее улучшение ее способностей за счет специальной подготовки множества обучающих выборок. Для хорошо натренированной сети становится актуальной задача выработки у выходных сигналов нечувствительности к вариациям входных величин при условии, что эти вариации находятся в определенных допустимых границах а сеть реализует монотонное отображение. Другими словами, аналогичные входные сигналы должны вызывать аналогичные реакции даже в случае, если они не входили в состав обучающего множества. Для математического обоснования такого требования рассмотрим многослойную сеть с большим количеством входови выходов. При обозначении вектора всех весов сети
либо сокращенно как Для последующих рассуждений введем различные обозначения обучающего и тестирующего входного вектора. Пусть
позволяет оптимизировать значения весов с учетом множества только обучающих, но не тестирующих выборок. Минимизация этой функции не может гарантировать правильную реакцию сети на возбуждение вектором
где
где обозначен якобиан векторной функции Для дальнейших рассуждений предположим, что вектор шума
отражающую степень изменения значений выходных нейронов (вектор А у к), вызванного наличием шума (вектор
С учетом принятых допущений относительно величин математического ожидания и среднеквадратичного отклонения шума [97] упростим выражение (4.23) и приведем его к виду
где Очевидно, что чем меньше чувствительность
где
Вместо минимизации модифицированной целевой функции
Выражение, которым определяется модифицированная целевая функция, имеет форму, идентичную стандартному представлению (4.19), с той разницей, что вместо входного вектора х используется зашумленный вектор при минимизации этой функции учитывается не только слагаемое (4.19), но также и фактор чувствительности Подбор среднеквадратичного отклонения шума, при котором действительно можно повысить качество обобщения, представляет собой самостоятельную задачу. Ее теоретическое решение весьма сложно, однако относительно просто получить экспериментальную оценку. По результатам многочисленных тестов можно утверждать, что среднеквадратичное отклонение шума должно коррелировать с фактическим распределением разности между обучающими (незашумленными) выборками и тестовыми данными и составлять небольшой процент от нее.
|
1 |
Оглавление
|