Главная > Энциклопедия кибернетики. Т.1
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

ИНДЕКСИРОВАНИЕ

— присвоение документу набора ключевых слов или кодов, служащих указателем содержания документа и используемых для его поиска (в основном, для документов с научно-тех. информацией). Возможны два способа И. — свободное (когда непосредственно из текста документа извлекают ключевые слова без учета всех видоизменений их форм и отношений между ними) и контролируемое (когда в поисковый образ документа включаются только те слова, которые зафиксированы в словаре ключевых слов, где указаны их синонимические, родовидовые и ассоциативные отношения). Обычно И. осуществляют опытные библиотекари или специалисты данной отрасли науки. Для уменьшения затрат времени и средств разрабатываются методы автоматического статистические, пермутационные, библиографические и ассоциативные методы индексирования.

Статистические методы И. основаны на гипотезе о том, что частота употребления слова связана с его значимостью для смысла документа. Обычно эта связь понимается слишком упрощенно — как возрастание информационной значимости слов с ростом их частоты. Другие, напротив, полагают, что информационная ценность редких слов выше, чем информационная ценность частых слов. Это учитывается при использовании метода статистических отклонений, когда измеряются отклонения частоты слов в индексируемом документе от теоретически ожидаемой частоты этих слов.

Пермутац ионное И. И. словами из заголовка документа путем помещения заголовка в алфавитный словарь столько раз, сколько разных слов имеется в нем; при этом каждое ключевое слово помещают на свое место алфавита и сопровождают всем контекстом

заголовка. Пермутационное И. широко применяют в информационных службах.

Библиографическое и ассоциативное И. используют в более широких целях: библиографическое — для И. документа ссылками на др. документы и публикации, содержащиеся в нем (указатель цитированной литературы позволяет производить поиск информации и изучать закономерности развития науки); ассоциативное — для И. с использованием карт ассоциативных связей между ключевыми словами, полученных с помощью анализа частоты повторения сочетаний ключевых слов в текстах. В зависимости от интервала текста, в котором регистрируется эта частота, получают различные карты ассоциативных связей. См. также А ннотирование автоматическое, Информационно-поисковая система документальная, Поиск информации автоматический.

Лит.: Михайлов А. И., Черный А. И., Гиляревский Р. С. Основы информатики. М., 1968 [библиогр. с. 728—735]; Москович В. А. Статистика и семантика. М., 1969 [библиогр. с. 294— 301]. В. А. Москович.

1
Оглавление
email@scask.ru