Интеграция тезаурусов RussNet и YARN
Аннотация
На сегодняшний день отсутствует большой открытый тезаурус русского языка под свободной лицензией. Предлагается проект интеграции двух электронных тезаурусов русского языка. Специфика конкретных ресурсов и особенности русского языка определяют оригинальность и научную новизну методов, используемых для объединения. Результатом проекта будет полноценный русскоязычный тезаурус, интегрирующий данные RussNet (40 тыс. слов и словосочетаний, 30 тыс. синсетов, 45 тыс. семантических связей) и YARN (120 тыс. словарных единиц, 46 тыс. синсетов, 30 тыс. иерархических отношений) с дополненными и отредактированными данными. Важным аспектом проекта является сочетание подходов на основе краудсорсинга и работы экспертов.
Ключевые слова
лексическая статистика; тезаурус; лингвистическая онтология; WordNet; интеграция словарных данных
Полный текст:
PDFСсылки
- На текущий момент ссылки отсутствуют.