Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
6.4. ПРИЛОЖЕНИЕ К СЛУЧАЮ НОРМАЛЬНЫХ СМЕСЕЙПосмотрим, как эти общие результаты применяются в случае, когда плотности компонент нормально распределены,
Случай 1 самый простой, и мы его рассмотрим подробно из педагогических соображений. Случай 2 более реальный, хотя несколько более сложный. Случай 3 представляет собой задачу, которая возникает, когда мы сталкиваемся с полностью неизвестным множеством данных. К сожалению, он не может быть решен методами максимума правдоподобия. Мы отложим на конец главы обсуждение того, что можно сделать, когда число классов неизвестно. 6.4.1. СЛУЧАЙ 1. НЕИЗВЕСТНЫ СРЕДНИЕ ВЕКТОРЫЕсли единственными неизвестными величинами являются векторы средних значений
то
Таким образом, из условия (6) для оценки по максимуму правдоподобия
После умножения на и перестановки членов получаем формулу
которая интуитивно оправданна. Она показывает, что оценка для К сожалению, соотношение (12) не определяет
Если у нас есть какой-то способ получения достаточно хороших начальных оценок
Это — градиентный метод подъема или процедура восхождения на вершину для максимизации логарифма функции правдоподобия. Если перекрытие между плотностями компонент невелико, то связь между классами будет малой и сходимость будет быстрой. Однако, когда вычисление закончено, нам достаточно убедиться, что градиент равен 0. Как и все процедуры восхождения на вершину, эта тоже не гарантирует, что найденный максимум — глобальный. 6.4.2. ПРИМЕРЧтобы продемонстрировать, с какими конкретными вопросами можно встретиться, рассмотрим простую одномерную двухкомпонентную смесь, имеющую нормальную плотность:
25 выборок, показанных в табл. 6. 1, были отобраны из этой смеси Таблица 6.1. 25 выборок из смеси с нормальным распределением
Используем эти выборки для вычисления логарифма функции правдоподобия
для различных значений
Рис. 6.1. Контуры функции логарифма правдоподобия. Однако I достигает другого максимума, сравнимого с первым, при решение по максимуму правдоподобия не является единственным. Можно дополнительно взглянуть на природу этих множественных решений, изучая результирующие оценки плотностей смеси. Рис. 6. 2 показывает истинную плотность смеси и оценки, полученные с использованием оценок по максимуму правдоподобия, как если бы они были истинными значениями параметров. 25 значений выборок показаны в виде точек вдоль оси абсцисс. Отметим, что максимумы как действительной плотности смеси, так и решения по максимуму правдоподобия размещены там же, где расположены две основные группы точек.
Рис. 6.2. Оценка плотности смеси. Оценка, соответствующая меньшему локальному максимуму логарифма функции правдоподобия, представляет собой зеркальное отображение, но ее максимумы также соответствуют группам точек. На первый взгляд ни одно из решений не является явно лучшим, и оба представляют интерес. Если соотношение (13) используется для итерационного решения уравнения (12), результаты зависят от начальных значений
Рис. 6.3. Траектории для итерационной процедуры. 6.4.3. СЛУЧАЙ 2. ВСЕ ПАРАМЕТРЫ НЕИЗВЕСТНЫЕсли
Функция правдоподобия для
Ясно, что для остальных выборок
так что
Таким образом, устремляя о к нулю, мы можем получить произвольно большое правдоподобие, и решение по максимуму правдоподобия будет вырожденным. Обычно вырожденное решение не представляет интереса, и мы вынуждены заключить, что принцип максимума правдоподобия не работает для этого класса нормальных смесей. Однако эмпирически установлено, что имеющие смысл решения можно все-таки получить, если мы сосредоточим наше внимание на наибольшем из конечных локальных максимумов функции правдоподобия. Предполагая, что функция правдоподобия хорошо себя ведет на таких максимумах, мы можем использовать соотношения (9)-(11), чтобы получить оценки для
по элементам
где
где
Хотя обозначения внешне весьма усложняют эти уравнения, их интерпретация относительно проста. В экстремальном случае при Проблемы, связанные с решением этих неявных уравнений, сходны с проблемами, рассмотренными в п. 6.4.1. Дополнительная сложность состоит в необходимости избегать вырожденных решений. Из различных способов, которые можно применить для получения решения, самый простой состоит в том, чтобы, используя начальные оценки в (17), получить Значительного упрощения можно достичь, если предположить, что матрицы ковариаций диагональны. Это дает возможность уменьшить число неизвестных параметров, что очень важно, когда число выборок невелико. Если это предположение слишком сильно, то еще возможно получить некоторое упрощение, предполагая, что с матриц ковариаций равны, что тоже снимает проблему вырожденных решений. Вывод соответствующих уравнений для оценки по максимуму правдоподобия для этого случая рассматривается в задачах 5 и 6. 6.4.4. ПРОСТАЯ ПРИБЛИЖЕННАЯ ПРОЦЕДУРАИз различных способов, которые используются для упрощения вычисления и ускорения сходимости, мы кратко рассмотрим один элементарный приближенный метод. Из соотношения (17) ясно, что вероятность
Тогда итеративное применение формулы (15) приводит к следующей процедуре нахождения Процедура-. Базовые Изоданные 1. Выбираем некоторые начальные значения для средних Цикл: 2. Классифицируем 3. Вновь вычисляем средние как средние значения выборок в своем классе. 4. Если какое-нибудь среднее изменило значение, переходим к Циклу; иначе останов. Это типичные для некоторого класса процедуры, известные как процедуры группировки (кластер-процедуры). Позже мы поместим ее в класс итерационных оптимизационных процедур, поскольку средние имеют тенденцию изменяться так, чтобы минимизировать функцию критерия квадратичной ошибки. В настоящий момент мы рассматриваем это просто как приближенный способ получения оценки по максимуму правдоподобия для средних. Полученные значения можно принять за ответ или использовать как начальные точки для более точных вычислений. Интересно посмотреть, как эта процедура ведет себя на примере данных из табл. 6.1. Рис. 6.4 показывает последовательность значений для
Рис. 6.4. Траектории для процедуры. Базовые изоданные. Это близко к решению, найденному методом максимума правдоподобия
|
1 |
Оглавление
|