R
Автоматическое извлечение лексико-семантических отношений из русскоязычных текстов
»
Обсуждения
Описание проекта
сен 29, 2013 | 16:09
Основная цель проекта — создание инструмента, позволяющего автоматически извлекать семантические отношения из русскоязычных текстов.
Для работы используется программа Unitex, в которой создаются графы, где прописываются паттерны для извлечения. На данном этапе работы написанные графы были проверены на корпусе тектов DBPedia (1,325,858 sentences, ~47,000,000 tokens). В результате мы получаем извлеченные бинарные отношения.
Подробное описание проекта и результаты исследования.