Цель работы: разработка и реализация модуля полуавтоматического семантического аннотирования текстовых документов на естественном русском языке для семантических систем управления знаниями.
Результаты работы: разработан программный комплекс, позволяющий формировать семантическое метаописание текстового документа на естественном русском языке в терминах онтологической модели некоторой предметной области в форме набора RDF-триплетов. Разработана и реализована мера оценки релевантности метаданных документа, основанная на мере TF-IDF и данных о семантической связи элементов метаданных, упомянутой в тексте. Разработаны схемы хранения метаданных: с применением реляционной базы данных либо онтологии.
Область применения: использование в качестве компонента для формирования семантических метаописаний текстовых документов в системах управления знаниями, использующих онтологические базы знаний.
Прогноз о развитии исследования: система нуждается в разработке средств эффективной обработки синонимических групп, а также кореферентных (ссылочных) сущностей, встречающихся в тексте.
Текст PDF
Объем 6293 Кбайт
