О группе

Основная задача - создание инструмента, который бы позволял автоматически извлекать лексико-семантические отношения из русскоязычных текстов. В программе Unitex (http://igm.univ-mlv.fr/~unitex/index.php?page=3&html=beta.html#)мы создаем паттерны, определяющие лексико-семантические отношения, которые в последующем запускаются на корпусе текстов. В результате мы получаем извлеченные бинарные отношения.

Организация

Южно-Уральский государственный университет
Факультет: Лингвистики

Научная область

Лингвистика
– Компьютерная лингвистика

Обсуждения

Описание проекта

Основная цель проекта — создание инструмента, позволяющего автоматически извлекать семантические отношения из русскоязычных текстов. Для работы используется программа Unitex, в которой создаются графы, где прописываются паттерны для извлечения. На данном этапе работы написанные графы были проверены на корпусе тектов DBPedia (1,325,858 sentences, ~47,000,000 tokens). В результате мы получаем извлеченные бинарные отношения. Подробное описание...

0 комментариев

добавлено Кристина Сабирова сен 29, 2013

Текущие результаты проекта

Краткое описание паттернов и сводку результатов можно посмотреть здесь .
С текущими результатами проекта вы можете ознакомиться здесь .
Перед Вами откроются извлеченные гипо-гиперонимические отношения по результатам запуска паттернов на тексте DBPedia (1,325,858 sentences, ~47,000,000 tokens). Числа — ссылки на полный текст из корпуса (на них можно не обращать внимание). Вквадратных скобках стоят размеченные слова, справа от них —...

0 комментариев

добавлено Кристина Сабирова сен 29, 2013

« Previous
1
Next »