Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
6.4.3. Другие методы оценивания параметров смеси распределений.Практически каждую из существующих процедур статистического оценивания параметров смеси распределений можно отнести к одному из двух подходов. В первом из них (подход «от оценивания к классификации») - исследователь начинает с решения задачи оценивания параметров смеси К этому подходу можно отнести, в частности, описанный ниже алгоритм адаптивного вероятностного обучения (или «алгоритм SEM: Stochastique—Estimation—Maximisation» Алгоритм адаптивного вероятностного обучения (алгоритм SEM). Впервые предложен и проанализирован в [2021. По существу, авторы используют описанную в п. 6.4.1 схему ЕМ-алгоритмов, дополняя ее байесовской идеологией и этапом вероятностного обучения, которое реализуется в виде специальной процедуры генерирования на ЭВМ случайных последовательностей. Прием вероятностного обучения с введением априорного распределения оцениваемых параметров использовался и ранее в задачах статистического оценивания, см., например, [314, 172, 310]. Использование алгоритма SEM позволяет в определенном (достаточно широком) классе идентифицируемых смесей решать (в рамках основной процедуры) задачу оценивания неизвестного числа k компонентов смеси (6.6") и добиваться существенного снижения эффекта зависимости получаемого решения от исходной позиции начального приближения параметров алгоритма. На исходной позиции алгоритма SEM фиксируются: начальное значение. Для неизвестного числа компонентов смеси k (оно должно «с запасом» мажорировать истинное число классов k); некоторое пороговое значение с Далее в следующей хронологической последовательности итерационного взаимодействия реализуются составляющие алгоритм SEM этапы «Stochastique» (статистическое моделирование), «Maximisation» (максимизация функционала метода максинсигьного правдоподобия) и «Estimation» (оценивание параметров смеси). Статистическое моделирование
полиномиально распределенных (с параметрами Полученные реализации
определяют разбиение
причем если в какой-либо класс попало в соответствии с этим правилом наблюдений меньше, чем
где Максимизация ( На этом этапе (в рамках
Оценки
(некоторые вспомогательные приемы в случае, когда урав-; пения метода максимального правдоподобия не дают рещення, рассмотрены в [302, 2121). Отметим, что если математические ожидания
Оценивание (
определяем значения оценок апостериорных вероятностей
после чего переходим к следующей Свойства алгоритма SEM исследованы в [202] аналитически в простейшем (представляющем лишь методический интерес) случае смеси, состоящей из двух полностью известных распределений Правда, с помощью метода статистического моделирования авторы [202] рассмотрели большое число модельных примеров смеси 1 и пришли к выводу, что алгоритм SEM расщепления смеси распределений типа (6.6”) обладает следующими преимуществами в сравнении с другими алгоритмами: а) он работает относительно быстро и его результаты практически не зависят от «исходной точки»; б) позволяет избегать выхода на неустойчивые локальные максимумы анализируемой функции правдоподобия и, более того, дает, как правило, глобальный экстремум этой функции; в) получаемые при этом оценки параметров смеси являются асимптотически несмещенными; г) позволяет оценивать (в рамках самой процедуры) неизвестное число классов (компонентов смеси). Пример 6.7. Расщепление смеси пятимерных нормальных распределений с помощью алгоритма
и с ковариационными матрицами
Генерируем на ЭВМ с помощью метода статистического моделирования [11, п. 6.3.3] выборку
где Заметим, что оценка векторов средних
Применение к «перемешанной» (сгенерированной на ЭВМ) выборке объема
Наконец, классификация анализируемых 400 наблюдений, произведенная на последней итерации этапа «Статистическое моделирование» (доставляющей, кстати, наибольшее значение исследуемой функции правдоподобия), дает следующую картину «перекрестной» классификации в сравнении с исходным (правильным) отнесением сгенерированных наблюдений по составляющим генеральным совокупностям (табл. 6.2): Таблица 6.2
Таким образом, в данном примере доля неправильно расклассифицированных с помощью алгоритма SEM наблюдений составила 6,75% (27 наблюдений из 400). Этот результат так же, как и точность оценивания параметров смеси, можно признать вполне удовлетворительным.
|
1 |
Оглавление
|