Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
8.3.3. Проект SHOE — спецификация онтологий и инструментарийОбщая характеристика проектаПроект SHOE (Simple HTML Ontology Extensions) ориентирован на решение проблемы добавления к Web-страницам семантической информации и соотнесения ее с онтологиями соответствующих предметных областей. Предполагается, что, используя эту информацию, поисковые системы смогут обеспечивать более релевантные ответы на запросы, чем это возможно сейчас на базе использования машин поиска, функционирующих в Интернете. Для поддержки процессов аннотирования в рамках проекта SHOE разрабатывается специальный набор инструментальных средств (suite of tools), а основой их является язык Интернет-совместимого представления знаний, который, собственно, и дал название всему проекту. В настоящее время в проекте SHOE выделены следующие главные направления исследований: • Разработка множества повторно используемых онтологий (reusable ontologies) для концептов, которые наиболее частотны для Web-pecypcoв. • Создание средств проектирования онтологий — аннотаторов знаний Knowledge Annotator), которые бы упростили этот процесс. Предполагается также, что в SHOE-инструментарий будет включена «несложная» обработка естественного языка (lightweight natural language processing techniques), которая обеспечит представление пользователям аннотаций документов. Спецификации онтологий и инструментарий SHOEВ данном подразделе мы сосредоточимся не столько на самих онтологиях, разрабатываемых в рамках проекта SHOE [Luke et al., 1996], сколько на языке представления онтологических знаний и средствах поддержки процессов проектирования онтологий. Формализм представления и машина выводаСледует сразу отметить, что SHOE по своей идее близок к уже обсуждавшейся выше инициативе используется часть из уже перечисленных тегов и, кроме того, вводятся новые, например INSYANCE. И наконец, в SHOE вводится метатег вида Для определенности в рамках спецификации языка SHOE предполагается, что онтология представляется в виде is_a иерархии классов/категорий, множества атомарных отношений между категориями и множества правил вывода В форме простых клауз Хорна. Термами языка являются термы HTML и дополнительно к этому понятия Category (Class), Data (причем с типами STRING, NUMBER, DATE, TRUTH),Element, Instance, Instance Key, Name, Ontology, Relation (Relationship), Rule и некоторые другие. Декларации онтологий задаются внутри тела HTML-документа и не могут перекрываться с другими тегами HTML. В одном документе может быть определено несколько онтологий, но такие определения тоже не может перекрываться или быть вложенными. Общая схема определения онтологии следующая:
Для указания того, что данная онтология расширяет другую, уже существующую, используется специальный тег:
Внутри определения онтологии могут специфицироваться новые категории, для чего используется специальный тег вида:
Аналогичный подход применяется и для определения отношений:
Возможно определение тех же понятий и с помощью тега ONTDEF с параметрами. Одним из важнейших компонентов определения онтологии являются правила вывода. В SHOE такие правила «похожи» на Хорновские клаузы по сути, но отличаются от них по форме:
Для примера, ниже обсуждается фрагмент определения онтологии в формализме SHOE, коррелирующий с уже обсуждавшимся фрагментом определения-аналогичной онтологии в формализме Ontobroker. Пусть нас интересуют исследователи, имеющие в Интернете свои домашние страницы. Для работы с такими страницами можно воспользоваться уже существующей в рамках SHOE онтологией общих понятий (organization-ontology version 2.1) по адресу http://www.ont.org/orgont.html. Однако предположим для определенности, что существующую онтологию необходимо расширить понятиями Person и Organization. Тогда спецификация фрагмента новой онтологии (Но-mePageOntology) может быть представлена в формализме SHOE следующим образом:
Аннотация Web-документов на базе онтологий Аннотация HTML-документов в SHOE осуществляется также с использованием тегов. В частности, для этого служат теги USE-ONTOLOGY, INSTANCE, CATEGORY, RELATION. Последние три тега имеют следующие форматы:
Для поиска и обработки домашних страниц с помощью специфицированной выше онтологии необходимо, чтобы авторы Web-публикаций сами (или на основе инструментария SHOE) проаннотировали свои документы. Так, например, фрагмент аннотации персональной страницы исследователя Иванова в формализме SHOE выглядит следующим образом:
Анализ приведенного HTML-текста показывает, что даже в таком, казалось бы, простом случае задача аннотации Web-документа достаточно сложна. Ситуация становится еще более сложной при аннотировании реальных HTML-документов. Во-первых, уже выбор объектов текста, подлежащих аннотированию, не тривиален, особенно если Web-документ представляет объекты реального мира. Во-вторых, гиперссылки часто фиксируют лишь наличие определенных отношений между объектами, но не их семантику. И наконец можно, конечно, аннотировать каждую именную группу в естественно-языковом представлении HTML-страницы, но для реальных документов это слишком трудоемкая задача, которая к тому же чревата большим количеством ошибок. Поэтому в рамках проекта SHOE для автоматизации процессов аннотирования Web-доку ментов разработана специальная система Knowledge Annotator [КА, 1999], одна из экранных форм которой представлена на рис. 8.12. Рис. 8.12. (см. скан) Экранная форма системы Knowledge Annotator Основными информационными блоками в приведенной выше экранной форме являются экземпляры (instances), онтологии (ontologies) и утверждения (claims). Пользователь может добавлять, редактировать и/или удалять любой из элементов этих блоков. При создании новых объектов пользователю выдаются соответствующие подсказки в виде, например, списка доступных онтологий, описанных в них категорий, отношений и т. п. Для визуализации знаний, содержащихся в обрабатываемом документе, Knowledge Annotator использует различные методы, начиная с аннотированного HTML-текста и заканчивая описаниями утверждений на естественном (английском) языке. Кроме того, система осуществляет проверку корректности действий пользователя и транслирует его выборы в синтаксически правильные конструкции SHOE. Формализм запросовВ настоящее время существуют различные примеры языков запросов к документам, проаннотированным на основе формализмов SHOE, рассмотренных выше. Так, в университете Мэрилэнд (University of Maryland at College Park) разработан робот Пример PARKA-запроса для поиска домашних страниц может быть специфицирован следующим образом:
По существу, это достаточно простой SQL-запрос, расширенный за счет использования понятий онтологии, переменных и ограниченных по мощности образцов. Оценивая формализм представления онтологических знаний SHOE и поддержку процессов аннотирования Web-pecypcoв в этом проекте в целом, можно констатировать, что это достаточно мощная система методов и средств, которая вместе с тем сложнее для пользователя, чем Ontobroker.
|
1 |
Оглавление
|