Главная > Искусственные нейронные сети. Теория и практика
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

6.2. Анализ данных социологического опроса

Постановка задачи. Исходные данные представляют собой материалы социологического опроса, проведенного в 1999 г. анкетированием 1500 респондентов одного из регионов России по 14 вопросам (признакам), отражающим социальный статус опрашиваемого:

- возраст, лет;

- пол;

- образование;

- базовая профессия;

- национальность,

- самооценка социального слоя;

- отношение к религии,

- род занятий;

- основное место работы;

- сфера деятельности;

- средний доход члена семьи,

- самооценка уровня доходов;

- тип населенного пункта, где проживает опрашиваемый;

- политическая ориентация

Среди перечисленных только два признака имеют количественный характер, три признака чисто качественный, остальные - качественный, выраженный в псевдоколиче-ственной форме.

Заметим, что признак (политическая ориентация) представляется здесь «выходной» или «основной» следственной переменной, определяемой или формируемой другими (причинными) переменными Действительно, можно предположить, что уровень доходов в семье формирует политическую ориентацию, обратное вряд ли имеет место, хотя и может иметь место; аналогичные соображения можно провести и по другим признакам.

В связи с этим, сформулируем следующую задачу исследований: выявить причинно-следственные связи между политической ориентацией субъекта и признаками, характеризующими его социальное положение

Методы исследований. При выборе метода исследований необходимо учесть тот факт, что большинство из признаков - качественные, и поэтому имеющиеся данные требуют применения специальных приемов исследования. Между тем, современные инструментальные средства обработки статистической информации, например, пакет Statistica, возможностями такого рода практически не обладают (кроме использования дисперсионного анализа). При анализе же псевдоколичественных данных необходимо принимать во внимание невозможность в большинстве случаев установления между ними отношений эквивалентности и предпочтения, что влечет трудности в определении мер сходства и т. п. Это, в свою очередь, при применении к ним приемов и формул обработки, разработанных для количественных переменных (например, регрессионного, корреляционного или дискриминантного анализов) приводит к крайне низкой достоверности получаемых результатов.

Поэтому выберем в качестве методов исследования менее чувствительные к выполнению вероятностных предпосылок нейро-сетевые методы, а в качестве инструментов исследования возьмем нейропакеты НейроПро и Excel Neural Package. Такой подбор инструментальных средств обеспечит перекрестную проверку получаемых результатов.

Этапы исследований.

1) Определение признаков, наиболее существенно влияющих на выбранную выходную переменную (отклик).

2) Построение модели, отражающей причинно-следственные связи между откликом и входными признаками.

3) Интерпретация модели.

Полученные результаты.

1) Результаты первого этапа, характеризующие степень влияния факторов на отклик (качественные признаки исключены из рассмотрения), представлены на рис. 6.2 (пакет НейроПро) и рис. 6.3 (пакет Excel Neural Package).

Рис. 6.2. Оценка значимости факторов (пакет НейроПро)

Рис. 6.3 Оценка значимости факторов (пакет Excel Neural Package)

Из рис. 6.2 следует, что наиболее значимыми факторами являются а из рис. 6.3 - (седьмой по счету),

Обобщая результаты, получим следующую упорядоченную по степени влияния на последовательность признаков: (возраст), (доход), (сфера деятельности), (самооценка социального слоя), (тип населенного пункта проживания).

2) Результаты второго этапа исследований, характеризующие проверку возможностей использования различных моделей для описания имеющихся данных социологического опроса с учетом полученной значимости признаков, показали, что в качестве таких моделей не подходят модели количественного характера типа регрессионных или классических нейросетевых. Наиболее подходящей представляется модель в виде совокупности кластеров. Такие кластеры, соответствующая информация о которых представлена в табл. 6.5, выявлены с помощью пакета Excel Neural Package при использовании самоорганизующейся карты Кохонена.

Таблица 6.5 (см. скан) Информация о выявленных кластерах

С учетом выявленных кластеров и значимости факторов полученным результатам можно дать следующую интерпретацию.

Во-первых, по социальной ориентации (т.е. по усредненной величине показателя все опрашиваемые лица могут быть разделены на три группы:

• разделяющие социалистические и коммунистические идеи и взгляды;

• капиталистической ориентации;

• национально-патриотической ориентации, полагающие, что Россия должна развиваться своим особенным путем.

Во-вторых, первая группа, в свою очередь, включает в себя две подгруппы, соответствующие кластерам 4 и 5.

Кластер 5 - это пенсионеры (среднее значение лет), как мужчины, так и женщины, со средним или специальным средним образованием, имеющие невысокую пенсию проживающие, в основном, в небольших городах и поселках городского типа.

Кластер 4 образован лицами, наиболее активно поддерживающими коммунистические взгляды. Особенность его состава: средний возраст лет, мужчин и женщин - поровну, образовательный ценз - низкий, профессии - рабочие, заработки очень низкие проживающие в поселках городского типа.

Кластеры 4 и 5 объединяют примерно 40% опрошенных лиц.

В-третьих, вторая группа включает в себя кластеры 1 и 3.

Кластер средний возраст около 40 лет, поровну мужчин и женщин, образование высшее или незаконченное высшее, специалисты или руководители, работающие на предприятиях, принадлежащих государству или городу, высокий средний доход проживание в городах.

Кластер 3: средний возраст около 30 лет, поровну мужчин и женщин, образование среднее специальное и/или высшее, работники сферы обслуживания и рабочие, средний доход - проживание - в городах Лица данной подгруппы настроены наиболее «прокапиталистически».

Кластеры 1 и 3 объединяют чуть менее 40% опрошенных.

В-четвертых, третья группа образована лицами, отнесенными к кластеру 2. Его характеристики: средний возраст около 40 лет, в основном женщины с высшим и незаконченным высшим образованием, специалисты, с невысоким доходом проживание - в городах и поселках городского типа.

В данный кластер входят несколько более 20% опрошенных.

Итак, к коммунистическому (социалистическому) электорату относятся, в основном, пенсионеры или люди среднего возраста с низкими доходами. В рассматриваемом регионе общее количество лиц данных категорий - около 40%.

Факторами, определяющими «прокапиталистические» взгляды, является высокий уровень образования и доходов.

Выводы.

Использование чисто статистических подходов для анализа социологических процессов представляется не вполне надежным.

Предсказание социальной ориентации отдельной персоны по косвенным показателям с удовлетворительной точностью сделать, по-видимому, невозможно. Гораздо легче прогнозировать поведение группы лиц.

Наиболее подходящей моделью для рассматриваемого типа задач является модель в виде совокупности кластеров.

Выявление наиболее влияющих на социальную ориентацию признаков и кластеров по группам лиц может быть использовано для прогнозирования их социального поведения.

<< Предыдущий параграф Следующий параграф >>
Оглавление