R
Автоматическое извлечение лексико-семантических отношений из русскоязычных текстов
»
Обсуждения
Текущие результаты проекта
Краткое описание паттернов и сводку результатов можно посмотреть здесь.
С текущими результатами проекта вы можете ознакомиться здесь.
Перед Вами откроются извлеченные гипо-гиперонимические отношения по результатам запуска паттернов на тексте DBPedia (1,325,858 sentences, ~47,000,000 tokens).
Числа — ссылки на полный текст из корпуса (на них можно не обращать внимание). Вквадратных скобках стоят размеченные слова, справа от них — категория (в данном случае гипоним или гипероним), в фигурные скобки включается более широкий контекст. В конце указывается по какому шаблону была произведена разметка.Пример из последней версии разметки:
{этнический[ язык]=HYPER}:{[ бейсик-инглиш]=HYPO},{[ латино]=HYPO}[PATTERN=3]
Т.е. можно выделить более общий гипероним «язык», ниже «этнический язык», еще ниже 2 когипонима «бейсик-инглиш» и «латино»