Главная > Факторный, дискриминантный и кластерный анализ
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

МИНИМАЛЬНЫЕ УСЛОВИЯ ПРОВЕДЕНИЯ ОТБОРА

Большинство программ последовательного отбора требует, чтобы любая переменная удовлетворяла определенному минимуму условий, прежде чем она будет подвергнута проверке в соответствии с критерием отбора. Так, проверка толерантности позволяет обеспечить необходимую точность вычислений, а воспользовавшись частной -статистикой, мы можем установить, что возросшее различение превосходит уровень, заданный пользователем. С помощью некоторых программ также просматривается список уже отобранных переменных, чтобы проверить, не надо ли какие-либо из них отбросить.

Толерантность

Тест толерантности может обеспечить точность вычислений. Толерантность еще не отобранной переменной равна единице минус квадрат множественной корреляции между этой переменной и всеми уже отобранными переменными, когда корреляции определяются по внутригрупповой корреляционной матрице. Если проверяемая переменная является линейной комбинацией (или приблизительно равна линейной комбинации) одной или нескольких отобранных переменных, то ее толерантность равна нулю (или близка к нулю). Переменная с малой толерантностью (скажем, меньше 0,001) может привести к ошибке при вычислении матрицы, обратной W, ввиду быстрого накопления ошибок округления. Помимо вычислительных проблем, нежелательно использовать переменную, которая является линейной комбинацией отобранных переменных, потому что она не дает никакой новой информации.

Статистика F-включения

Статистика F-включения представляет собой частную -статистику, оценивающую улучшение различения от использования рассматриваемой переменной по сравнению с различением, достигнутым с помощью других уже отобранных переменных (Dixon, 1973; 241).

Если величина статистики -включения мала, мы вряд ли отберем такую переменную, потому что она не дает достаточно большого вклада в различение. Эта частная -статистика с числом степеней свободы, равным в качестве теста значимости, чтобы убедиться в статистической значимости улучшения различения. Переменная должна пройти проверку толерантности и -включения, прежде чем она будет рассмотрена в соответствии с критерием отбора.

Статистика F-удаления

Статистика -удаления также является частной -статистикой с числом степеней свободы, равным Однако она оценивает значимость ухудшения различения после удаления переменной из списка уже отобранных переменных. Эта процедура проводится в начале каждого шага, чтобы проверить, имеется ли какая-нибудь переменная, уже не вносящая достаточно большого вклада в различение, поскольку отобранные позже переменные дублируют ее вклад.

На заключительном шаге статистика -удаления может быть использована для ранжирования дискриминантных возможностей отобранных переменных. Переменная с наибольшим значением статистики -удаления дает наибольший вклад в различение, достигнутое благодаря другим переменным. Переменная, имеющая вторую по величине статистику -удаления, является второй по значимости и т. д. Это ранжирование не обязательно совпадает с тем, которое можно было бы получить с помощью одномерной -статистики, потому что она измеряет полную дискриминантную способность переменной без учета дублирования ее другими переменными.

1
Оглавление
email@scask.ru