Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
МНОЖЕСТВА ДАННЫХ, ИСПОЛЬЗУЕМЫХ В ПРИМЕРАХМы воспользуемся только одним набором данных, чтобы показать, как применяют кластерные методы. Еще один набор приводится в приложении для того, чтобы заинтересованный читатель мог поэкспериментировать с процедурами, которые мы описываем; наши результаты могут служить ориентирами для сравнения. Первое множество данных, используемое в качестве примера, представляет собой гипотетические данные об археологических раскопках древних захоронений. Эти данные могут содержать важную для археологов информацию о социальном статусе или положении, занимаемом в обществе индивидами, найденными в могилах. Тщательно анализируя содержимое захоронений, археологи могут сделать выводы о различиях в общественном положении индивидов, что в свою очередь может помочь определить природу социального расслоения и уровень развития общества, к которому они принадлежали. Данные изменяются в зависимости от трех измерений: возраста, пола и статуса. На участке наших археологических раскопок были «захоронены» 25 человек, которые были разделены на три возрастные группы: дети, подростки и взрослые. Представлены два статуса: элитарный и неэлитарный. Во всех захоронениях содержится до восьми различных видов объектов, найденных в них: местная керамика, наконечники стрел, обломки браслетов, обработанные камни, костяные иглы, костяные шилья, привозная керамика и металлические изделия. Каждый из этих видов объектов соответствует определенному статусу и полу; возрастные различия объектов не были включены в данные, чтобы структура набора данных оставалась относительно простой. Данные были закодированы в двоичной форме с помощью регистрации наличия или отсутствия объекта. Второй набор данных, также искусственного происхождения, был специально создан в качестве модели классификационной задачи, с которой часто сталкиваются в психопатологии. Основное множество данных содержит информацию о 90 гипотетических больных с тремя типами психических расстройств: психозы (П) неврозы (Н) и расстройства личности (РЛ). В каждую общую группу входило по тридцать больных. Более подробно о процессе генерации данных можно прочесть у Блэшфилда и Мори (1980). Характер заболевания больных определялся по 13 стандартным шкалам, взятым из психологического теста MMPI, описанного ранее в работе Голдстейна и Линдена (1969). Эти шкалы имеют следующие названия и аббревиатуры: - Шкалы достоверности данных: — шкала лжи; — шкала фальсификаций; — шкала поправок. Клинические шкалы: — ипохондрия; — депрессия; — истерия; — психопатические отклонения; — шкала пола (мужской/женский); — паранойя; — психастения; — шизофрения; — гипомания; — социальная интроверсия.
Рис. 1. Пример профиля данных -теста Тест MMPI состоит из 566 вопросов типа да/нет, ответы на которые даются от первого лица (например, «Я люблю читать технические журналы»). Эмпирическим путем эти 566 вопросов были сгруппированы в шкалы MMPI-теста. В ходе разработки данный тест предлагался как здоровым пациентам, так и больным с психическими заболеваниями. Вопрос относился к той или иной шкале, если он позволял отделить группу больных от здоровых. Все десять «клинических» шкал были сформированы именно таким образом, а имена шкал представляют собой клинические названия групп больных, для диагностирования которых эти шкалы предназначались. Три другие стандартные шкалы являются шкалами достоверности ответов, т. е. определяют, в какой степени пациент может фальсифицировать свои симптомы. Результаты MMPI-теста интерпретировались с помощью профилей данных о больных. На рис. 1 приведены результаты MMPI-теста для одного из 90 больных, представленных множеством данных. Значения признака изображены на профиле для каждой шкалы, при этом число 50 — нормальное значение признака, а число 70 указывает на значимое отличие от нормы. Прифили различаются в первую очередь по «пикам» или шкалам, которые имеют наивысшие значения. Для рассматриваемого пациента каивысшие значения расположены в следующем порядке Ра, Sc, F, Pt, Si и Ма. Этот профиль довольно типичен для больного с диагнозом параноидальная шизофрения.
|
1 |
Оглавление
|