Оценка эффективности гибридного морфологического анализатора NLTK4RUSSIAN в работе с текстами социальных сетей и художественных произведений

Кириллова, Мельник, Плетнева, Еникеева, Митрофанова

Аннотация


В статье описан эксперимент по тестированию гибридного морфоанализатора NLTK4RUSSIAN на материалах соревнований «Dialogue Evaluation» 2017 г. Эксперименты с обучением морфоанализатора выполнены на основе подкорпусов НКРЯ и OpenCorpora. Для тестирования использовались выборки из художественных текстов и текстов социальных сетей. В ходе исследования решен ряд задач, в том числе задача конвертации морфологической разметки из формата Universal Dependencies в формат P yM orphy2, используемый в OpenCorpora. Результаты тестирования гибридного морфоанализатора NLTK4RUSSIAN соответствуют «золотому стандарту» для русского языка.

Ключевые слова


морфологический анализ; разрешение морфологической неоднозначности; NLTK4RUSSIAN; корпусы русскоязычных текстов

Полный текст:

PDF


DOI: https://doi.org/10.17586/2541-9781-2018-2-37-43

Ссылки

  • На текущий момент ссылки отсутствуют.


Лицензия Creative Commons
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.