Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
6.2.2. МНОГОМЕРНЫЙ ДИСТАНТ, ДИСКРИМИНАНТНАЯ ФУНКЦИЯ. ДИСКРИМИНАНТНЫЙ АНАЛИЗ (КЛАССИФИКАЦИЯ)Величина
Эта величина показывает, насколько две данные выборки противоречат гипотезе
Преимущество этой величины по сравнению с (6.22) заключается в том, что она основана только на несмещенных и состоятельных оценках Рассмотрим некоторую линейную комбинацию исходных
где вектор
В (6.23) величины
есть новый признак.
внутригрупповая дисперсия признака
Многомерный дистант для признака
Сравнивая (6.29) с (6.22), убеждаемся, что признак Среди всех линейных комбинаций, которые могут быть образованы из Линейная комбинация признаков Путем классификации (идентификации) решается вопрос о принадлежности каждого индивида к группам 1 или 2. При этом предполагаются известными характеристики Для практического применения отдельными авторами был предложен ряд различных правил классификации. Одна из трудностей заключается в том, что классификация опирается не на точные значения параметров распределений
где Индивид считается принадлежащим к совокупности
При этом следует выбрать какой-либо определенный уровень значимости а, например Чтобы в любом случае иметь однозначную классификацию, можно для данного индивида остановиться на наиболее вероятном решении, а именно выбрать для него группу с наименьшим Если при идентификации учитываются так называемые априорные вероятности
Индивида относят к группе с наименьшим
соответственно
Последними формулами можно воспользоваться при достаточно больших Пример. Продолжим рассмотрение примера, приведенного в разделе 6.2.1. Получаем значение многомерного дистанта
Дискриминантная функция имеет вид
Средние значения признака
т. е. для детей, заболевших желтухой, значения признака исходных признаков), проведем классификацию каждого из 31 указанных индивидов по правилам (6.30)-(6.33) (как без учета априорных вероятностей, так и с их учетом). Полученные результаты отражены в табл. 2 и 3. Априорные вероятности были выбраны пропорциональными объемам выборок:
Таблица 2. (см. скан) Данные по недоношенным детям, отнесенным к двум группам в результате дискриминантного анализа (с учетом и без учета априорной вероятности): а) по всем четырем признакам, б) только по продолжительности беременности матери. При классификации без априорной вероятности первым указано наиболее вероятное решение; вторым — Другая идентификация, если она считается возможной по Таблица 3. (см. скан) Частоты решений при идентификации 31 недоношенного ребенка (приведены результаты, полученные по правилу наиболее вероятного решения) Идентификация прошла довольно удачно. При разделении по наибольшей вероятности был ошибочно классифицирован всего один ребенок. Различие априорных вероятностей не оказало влияния на результаты классификации. Для сравнения в табл. 2 и 3 приведены также результаты идентификации, в основу которой была положена одна лишь продолжительность беременности матери (признак с наибольшим разделительным свойством). Видно, что в каждую группу ошибочно попадают по три индивида (как с учетом априорной вероятности, так и без ее учета). Итак, очевидно, что одномерная идентификация во многом уступает многомерной.
|
1 |
Оглавление
|