Andrew Krizhanovsky » Публикация

Поделиться публикацией:
Опубликовать в блог:
Опубликовано 2008-09-16 Опубликовано на SciPeople2009-04-23 00:04:03


Математическое и программное обеспечение построения списков семантически близких слов на основе рейтинга вики-текстов
Крижановский А. А. / Andrew Krizhanovsky
Автореф. ... канд. техн. наук: 05.13.11. — Санкт-Петербург, 2008. — 18 с
Аннотация Предложен подход к поиску семантически близких слов на основе рейтинга вики-текстов и учёта метаинформации (ключевые слова; категории, классифицирующие документы по их тематической принадлежности; гиперссылки) в проблемно-ориентированном корпусе текстовых документов с двумя типа отношений: иерархические отношения (родо-видовые и часть – целое) и гиперссылки. В основу подхода положен новый способ построения корневого набора документов, заключающийся в указании исходного документа пользователем и формировании списка «смежных документов» (документов, связанных ссылками с исходным документом), и механизм иерархической кластеризации, позволяющий объединять слова в смысловые группы. Разработан программный комплекс для поиска семантически близких слов с возможностью их оценки на основе тезаурусов (WordNet, Moby) и динамической визуализации результатов поиска. Данный комплекс апробирован на английской и русской версиях энциклопедии Википедия, что позволяет находить энциклопедические статьи, близкие по тематике к заданным, для более углублённого изучения некоторого понятия; а также устанавливать недостающие ссылки между связанными по смыслу статьями.

Комментарии

Вам необходимо зайти или зарегистрироваться для комментирования
Этот комментарий был удален
Этот комментарий был удален