Интеграция тезаурусов RussNet и YARN

Ирина Владимировна Азарова, Павел Исаакович Браславский, Виктор Павлович Захаров, Юрий Алексеевич Киселев, Д . А . Усталов, М. В. Хохлова

Аннотация


На сегодняшний день отсутствует большой открытый тезаурус русского языка под свободной лицензией. Предлагается проект интеграции двух электронных тезаурусов русского языка. Специфика конкретных ресурсов и особенности русского языка определяют оригинальность и научную новизну методов, используемых для объединения. Результатом проекта будет полноценный русскоязычный тезаурус, интегрирующий данные RussNet (40 тыс. слов и словосочетаний, 30 тыс. синсетов, 45 тыс. семантических связей) и YARN (120 тыс. словарных единиц, 46 тыс. синсетов, 30 тыс. иерархических отношений) с дополненными и отредактированными данными. Важным аспектом проекта является сочетание подходов на основе краудсорсинга и работы экспертов.

Ключевые слова


лексическая статистика; тезаурус; лингвистическая онтология; WordNet; интеграция словарных данных

Полный текст:

PDF

Ссылки

  • На текущий момент ссылки отсутствуют.