Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
Глава 10. НЕЛИНЕЙНОЕ ПРЕОБРАЗОВАНИЕ ИСХОДНОГО ПРОСТРАНСТВАДо сих пор при обсуждении вопроса о нахождении оптимальных признаков данного множества исходных данных рассматривались только линейные преобразования исходного пространства. К сожалению, линейное преобразование, как правило, не позволяет выделить минимальное число эффективных признаков. Несмотря на это, математические вопросы нелинейных отображений остаются неисследованными вследствие их сложности, и на практике эффективные признаки находят, в основном, за счет интуиции исследователя. Трудности решения нелнпейных задач являются общими для всех технических дисциплин. Однако в задачах распознавания образов из-за большого числа переменных эти трудности особенно велики. В этой главе будут рассмотрены некоторые методы нелинейного преобразования исходного пространства, связанные с нахождением истинной размерности множества исходных данных, улучшением разделимости классов и двумерным отображением исходных данных без потери разделимости. § 10.1. Истинная размерность исходных данных10.1.1. Локальные свойства распределения.Всякий раз, когда мы имеем дело с большими множествами многомерных дапных, задача их обработки упрощается, если удается обнаружить или павязать этим данным некоторую структуру. Поэтому можно предположить, что исходные данные подчиняются закону, который характеризуется определенным числом основных параметров. Минимальное число параметров данных лежит в топологическом подпространстве (на гиперповерхности) размерности Как говорилось в предыдущих главах, методы линейного преобразования направлены на нахождение главных осей многомерного распределения и исключение тех осей, вдоль которых дисперсия исходных данных незначительна. Эффективность этих методов ограничена тем, что они допускают лишь линейные преобразования исходного пространства. Рассмотрим, например, одномерное распределение, показанное сплошной линией на рис. 10.1. Главные оси этого распределения Рассмотрим два случайных процесса:
где
Рис. 10.1. Истинная размерность и линейное преобразование.
Рис. 10.2. Локальные подмножества данных. Случайный процесс Однако анализ этих процессов с помощью разложения Карунена — Лоева и в этом примере дает более высокие значения размерности. Как можно видеть из рис. 10.1, истинная размерность является, по существу, локальной характеристикой распределения. Обращаясь к рис. 10.2, мы видим, что если взять небольшие области с центрами в точках кроме того, дают базисные векторы для локальных распределений. Этот метод аналогичен методу локальной линеаризации нелинейных функций. Универсальное средство исследования локальных свойств — разложение в ряд Тейлора является общим средством. Для того чтобы применить это разложение, введем истинные случайные величины
где по — истинная размерность. Тогда наблюдаемый случайный вектор X, размерпость которого
В случае случайного процесса эта зависимость записывается в виде
Например, для
где
и
Таким образом, 1. Так как разложение (10.6) является приближенным, фактическая ковариационная матрица наблюдаемых данных 2. К сожалению, базисные векторы
где
Так как 3. Вообще говоря, нет гарантии, что в ряде Тейлора (10.6) доминируют члены первого порядка. Если минимальный размер локальной области ограничен по каким-либо техническим соображениям, доминирующими могут оказаться некоторые члены более высокого порядка или, другими словами, некоторые члены более низкого порядка могут быть малозначимыми. Поэтому упомянутая выше процедура эквивалентна подсчету числа значимых членов в ряде Тейлора, которое, как мы надеемся, близко к 4. На всех реальных ситуациях исходные данные искажены шумом. Поучительно рассмотреть влияние аддитивного белого шума. Так как белый шум имеет нулевое среднее значение, некоррелирован с сигналом
Буквой
Следовательно, если свободные от шума исходные данные имеют по доминирующих собственных значений и являются доминирующими, означает, что эта разность значительна, и может быть использовано для выбора
|
1 |
Оглавление
|