ТЕЗАУРУС
— словарь, отражающий семантические связи между словами или другими смысловыми элементами данного языка. Традиционный Т. состоит из двух частей: списка слов и устойчивых словосочетаний, сгруппированных по смысловым (или тематич.) рубрикам, и «ключа» — алфавитного словаря, где для каждого слова указаны соответствующие рубрики. Тем самым определены семантические отношения «слово X входит в общую рубрику со словом У» и «слово X входит в рубрику Y».
В информационно-поисковых Т. указывается более широкий класс семантических отношений: родовидовые, часть — целое, синонимия, антонимия, цель — средство, часть — целое и т. д. Под семантическими отношениями подразумеваются релевантные для данного языка отношения, не имеющие (в отличие от грамматических) регулярного формального выражения в этом языке. В Т. могут выражаться различные типы семантических отношений с различной степенью дифференцированности. Во многих Т. отношения вид — род, часть — целое и т. п. объединяются в одно отношение подчинения. Положение слова в Т. характеризует его смысл в языке. Напр., знание смысловых рубрик, в которые входит данное слово в традиционном общеязыковом Т., позволяет судить о смысле этого слова. Т. применяются для установления семантического
соответствия запроса и документов при автоматизированном информационном поиске и при решении др. проблем, связанных с семантическим анализом текстов. В этом случае Т. можно интерпретировать не только как систему сведений о семантических отношениях в самом языке, но и как систему представлений о внеязыковых объектах.
При более широкой трактовке Т. как приемника семантической информации в него включаются сложные высказывания и их семантические связи. Более развитый Т. способен воспринимать более сложную информацию. Объем информации, полученной Т. из данного сообщения, характеризуется степенью изменения Т. под действием данного сообщения. Эта величина характеризует как новизну поступившей информации, так и способность Т. к ее «пониманию».
Можно говорить о Т. коллектива, характеризующем информационную общность (уровень взаимопонимания) данного коллектива; о Т., характеризующем уровень описания системы знаний некоторой науки и т. д. Тип Т. определяется запасом и сложностью структуры смысловых единиц и смысловых отношений. Традиционные общеязыковые Т. существуют для англ., франц., исп. языков. Имеется ряд Т., составленных специально для информационно-поисковых систем. К Т. весьма близки одноязычные словари, задающие выражения основных семантических параметров каждого слова.
Лит.: Арапов М. В. Некоторые принципы построения словаря типа «тезаурус». «Научно-техническая информация», 1964, № 4; Шрейдер Ю. А. Об одной модели семантической теории информации. «Проблемы кибернетики», 1965, в. 13; Михайлов А. И., Черный А. И., Гиляревский Р. С. Основы информатики. М., 1968 [библиогр. с. 728—735]; Апресян Ю. Д., Жолковский А. К., Мельчук И.А. О системе семантического синтеза. «Научно-техническая информация. Серия 2», 1968, Mi 11; Добров Г. М. Прогнозирование науки и техники.М., 1969 [библиогр. с. 198—206]; Варга Д. Методика подготовки информационных тезаурусов. В кн.: Сборник переводов по вопросам информационной теории и практики, № 17. М., 1970 [библиогр. с. 101—104].
Ю. А. Шрейдер.