Оценка эффективности гибридного морфологического анализатора NLTK4RUSSIAN в работе с текстами социальных сетей и художественных произведений

Кириллова, Мельник, Плетнева, Еникеева, Митрофанова

Аннотация


В статье описан эксперимент по тестированию гибридного морфоанализатора NLTK4RUSSIAN на материалах соревнований «Dialogue Evaluation» 2017 г. Эксперименты с обучением морфоанализатора выполнены на основе подкорпусов НКРЯ и OpenCorpora. Для тестирования использовались выборки из художественных текстов и текстов социальных сетей. В ходе исследования решен ряд задач, в том числе задача конвертации морфологической разметки из формата Universal Dependencies в формат P yM orphy2, используемый в OpenCorpora. Результаты тестирования гибридного морфоанализатора NLTK4RUSSIAN соответствуют «золотому стандарту» для русского языка.

Ключевые слова


морфологический анализ; разрешение морфологической неоднозначности; NLTK4RUSSIAN; корпусы русскоязычных текстов

Полный текст:

PDF

Ссылки

  • На текущий момент ссылки отсутствуют.