Главная > Прикладные методы анализа данных и знаний
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

§ 3. Принятие решений по прецедентам и моделям

В последнее время обозначилось еще большее отдаление методов анализа данных от традиционных методов вычислительной математики. Упоминаемые выше модели изучаемых систем строятся не всегда. Все чаще стали использоваться такие алгоритмы анализа данных, которые опираются не на общие модели «черного ящика», а на конкретные факты его поведения, зафиксированные в протоколах «вход-выход», или на «прецеденты». При этом используется простая, но фундаментальная гипотеза о монотонности пространства решений, которую можно выразить так: «Похожие входные ситуации приводят к похожим выходным реакциям системы». Для каждой новой ситуации достаточно найти в протоколе одну или несколько самых близких, похожих на нее ситуаций и принимать решение, опираясь на эти прецеденты. Кстати, задолго до возникновения анализа данных это правило принятия решений по прецедентам было положено в основу древнегреческой медицины, а также британского судопроизводства.

При таком подходе мы не пытаемся познать систему так глубоко, чтобы уметь предсказывать ее реакцию на любые возможные внешние воздействия. Мы знаем лишь одно ее фундаментальное свойство: монотонность поведения в окрестностях имеющихся прецедентов. И этого обычно оказывается достаточно для получения практически приемлемых решений в каждом конкретном случае. Данный факт приводит некоторых авторов к заключению о возможности и даже целесообразности отказа от построения модели изучаемой системы вообще.

Однако необходимо отличать друг от друга модели разного уровня в иерархии древа познания. По мере углубления понимания изучаемой системы мы имеем дело с моделями, одни из которых отвечают на вопрос «Что происходит?», другие — на вопрос «Как это происходит?», а третьи — «Почему именно так, а не иначе?» [91]. В анализе данных чаще всего под моделью понимают аналитическое описание наблюдаемых экспериментальных значений в виде некоторого закона распределения. Такие феноменологические модели отражают то, что происходит, но ничего не говорят ни о механизме, ни о причинах происходящего. Ситуация принципиально меняется, если удается построить модель, объясняющую (имитирующую) механизм функционирования системы. Еще лучше, если модель объясняет метамеханизм, т. е. причины именно такого функционирования, а не другого. Такие модели могут помочь избежать принятия ошибочных решений.

Проиллюстрируем это на одном живом примере. Лет 20 назад в узких кругах заинтересованных специалистов появилась сенсационная информация о том, что удалось построить распознающее устройство, безошибочно отличающее атомные подводные лодки от дизельных по некоторым особенностям излучаемых ими гидроакустических сигналов. Протоколы реальных наблюдений были тщательно обработаны, были построены распределения сигналов в пространстве наблюдаемых характеристик и оптимальные для этих распределений решающие правила. В присутствии очень авторитетной комиссии надежность распознавания на контрольной выборке оказалась равной 100%! Однако такой большой успех вызвал сомнения не только у наблюдателей, но и у самих разработчиков системы. Они начали искать физическое объяснение информативным особенностям сигналов и в итоге обнаружили, что сигналы от дизельных лодок писались на одном магнитофоне, а от атомных —  в другой экспедиции и на другом магнитофоне. И тонвал одного из магнитофонов имел биения, которые вносили искажения в сигнал. Эти искажения и улавливались распознающим устройством.

Если иметь в виду только «Что?»-модели, то методы принятия решений с опорой на отдельные прецеденты или на их обобщенное (модельное) описание имеют приблизительно равные методологические права. Более того, при построении модели, как и при всяком обобщении, теряются некоторые особенности поведения системы в каждой конкретной точке пространства решений. При опоре же на прецедент, как показывает опыт, удается учесть эти локальные особенности, что часто позволяет получать более точные решения. Наличие в протоколах наблюдений систематических погрешностей, искажение реальной картины случайной непредставительной выборкой и другие несовершенства имеющихся данных могут приводить к недоразумениям и никакими моделями первого уровня исправить эту ситуацию нельзя. Всегда, если есть возможность, нужно пытаться проникнуть в суть изучаемого явления и найти разумное объяснение получаемым результатам. Т. е. нужно выдвигать гипотезы и строить модели, отвечающие на вопросы «Как?» и «Почему?».

 

1
Оглавление
email@scask.ru