Andrew Krizhanovsky » Публикация

Поделиться публикацией:
Опубликовать в блог:
Опубликовано 2010-03-20 Опубликовано на SciPeople2010-03-26 12:51:22 Журнал(презентация в pdf)


Построение машинно-читаемого словаря на основе Русского Викисловаря
Крижановский Андрей / Andrew Krizhanovsky
Аннотация Для хранения лексикографической информации Русского Викисловаря разработаны (1) правила (на основе регулярных выражений) извлечения текстовых данных, (2) структура базы данных для хранения данных, (3) программный интерфейс к этой базе данных. Созданный машинно-читаемый словарь был использован в эксперименте для сравнения алгоритмов, вычисляющих семантическое расстояние на основе данных Русского Викисловаря и WordNet. Алгоритмы и метрики оценивались с помощью тестовой коллекции (из 353 пар английских слов), включающей оценку экспертов. Эксперимент показал, что предложенный метод позволяет вычислить семантическое расстояние между парой слов, в принципе, на любом из языков, представленных в Русском Викисловаре.
Ключевые слова публикации:
         

Комментарии

Вам необходимо зайти или зарегистрироваться для комментирования
Этот комментарий был удален
Этот комментарий был удален