Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
Глава 6. КЛАССИФИКАЦИЯ БЕЗ ОБУЧЕНИЯ (ПАРАМЕТРИЧЕСКИЙ СЛУЧАЙ). РАСЩЕПЛЕНИЕ СМЕСЕЙ ВЕРОЯТНОСТНЫХ РАСПРЕДЕЛЕНИИ6.1. Понятие смеси вероятностных распределений6.1.1. Примеры. Начнем пояснение понятия смеси распределений с рассмотрения ряда конкретных примеров.Пример 6.1. Контроль (по количественному признаку) изделий (полуфабрикатов) совокупности, составленной из продукции двух разных станков. В отдел технического контроля (ОТК) поступают партии изделий, составленные с помощью случайного извлечения из объединенной продукции двух станков (станка А и станка В). Изделия контролируются по некоторому количественному параметру (линейному размеру) Известно также, что распределение размеров изделий, произведенных на каком-то определенном станке, описывается нормальным законом с параметрами Очевидно, анализируемая в ОТК по наблюдениям
а другая — продукцию станка В и описывается плотностью
Обозначая
Учитывая, что в объединенной генеральной совокупности продукции станка А в 1,5 раза больше, чем продукции станка В (поскольку производительность станка А в
Правыми частями уравнений (6.1) и На рис. 6.1 представлены графики функций плотности В соотношениях (6.1) и Если сотрудники ОТК или потребители изделий-полуфабрикатов захотят по наблюдениям
Рис. 6.1. Графики функции плотности отдельных компонентов и самой смеси из примера 6.1 Пример 6.2. Выявление и анализ типов потребительского поведения по данным обследований семейных бюджетов [154, с. 47—48, 68—69]. Здесь представлен один из фрагментов исследования, проведенного с целью изучения (на базе семейных бюджетов) дифференциации потребностей, выявления основных типов потребительского поведения и определения главных типообразующих признаков (социально-демографической, региональной, экономической природы). Исследуемым многомерным признаком является вектор У показателей
где В соответствии с одним из принятых в исследовании базовых исходных допущений постулируется существование в анализируемом пространстве
и с ковариационной матрицей
(см. сведения о многомерном нормальном законе в [11, п. 6.1.5]). Однако в начале исследования нет сведений об упомянутых гипотетических типах потребительского поведения: неизвестно ни их число k, ни значения определяющих эти типы многомерных параметров
как выборку из генеральной совокупности, являющейся смесью многомерных нормальных законов распределения. Другими словами, функция плотности
где
многомерная нормальная плотность, описывающая закон распределения исследуемого признака Далее необходимо по выборке (6.2) оценить неизвестные значения параметров к, 6.1.2. Общая математическая модель смеси распределений.Рассмотренные в примерах смеси (6.1) и (6.3) представляют собой частные случаи общей модели смеси, определение которой дадим здесь. Обобщение рассмотренных в примерах смесей может быть произведено в направлении: 1) отказа от конечности и даже дискретности компонентов, составляющих смесь, распространения понятия смеси на непрерывную смешивающую функцию; 2) отказа от однотипности участвующих в смеси компонентов (под однотипностью компонентов-распределений понимается их принадлежность к общему параметрическому семейству распределений, например к нормальному). Итак, пусть имеется двухпараметрическое семейство
где одномерный (целочисленный или непрерывный) параметр И пусть
— семейство смешивающих функций распределения. Функция плотности (полигон вероятностей) распределения
называется Р-смесыо (или просто смесью) распределений семейства F (интеграл в (6.6) понимается в смысле Лебега— Стильтьеса; см., например, [86]). Нас интересует использование моделей смесей в теории и практике автоматической классификации, поэтому сузим данное выше определение смеси и будем рассматривать в дальнейшем лишь случай конечного числа k возможных значений параметра
Если же дополнительно постулировать однотипность компонентов-распределений
Интерпретация в задачах автоматической классификации 6.1.3. Задача расщепления смеси распределений.Решить эту задачу в выборочном варианте — значит по выборке классифицируемых наблюдений
извлеченной из генеральной совокупности, являющейся смесью (6.6) генеральных совокупностей типа (6.4) (при заданном общем виде составляющих смесь функций Однако не следует ставить знак тождества между задачей расщепления смеси и задачей статистического оценивания параметров в модели (6.6) по выборке (6.7), поскольку задача расщепления сохраняет смысл и применительно к генеральным совокупностям, т. е. в теоретическом варианте. В этом случае она заключается в восстановлении компонентов
|
1 |
Оглавление
|