Устойчивые словосочетания в роли предлогов

Кирилл Кириллович Боярский, Евгений Александрович Каневский, Евгения Николаевна Клименко

Аннотация


В работе рассматриваются особенности обработки неоднословных оборотов (фразем), способных выполнять функции предлогов, при автоматическом анализе русскоязычных текстов. Сложность анализа таких оборотов заключается в достаточно высокой омонимичности, что снижает точность автоматического разбора предложений и, тем более, определение семантики. На основе возможных типов омонимии проведена классификация более 320 фразем.
К первой группе относятся фраземы, которые однозначно являются предлогами, но могут иметь семантическую неоднозначность. Для второй группы характерна частеречная омонимия предлог/наречие. К третьей группе отнесены фраземы, имеющие два/три варианта разбора: один/два оборота, соответствующие разным частям речи и простое сочетание предлога с существительным.
Для каждой группы приводятся списки наиболее частотных фразем (по НКРЯ). Указываются основы построения правил, позволяющих осуществлять эффективное снятие омонимии (применительно к парсеру SemSin). Приводятся примеры, показывающие, что анализ непосредственного окружения фраземы может быть недостаточен для снятия омонимии, так что необходимо рассмотрение удаленного контекста.

Ключевые слова


автоматический анализ текста; омонимия; словосочетания; лексические обороты; предложные группы

Полный текст:

PDF


DOI: https://doi.org/10.17586/2541-9781-2021-5-17-28

Ссылки

  • На текущий момент ссылки отсутствуют.


Лицензия Creative Commons
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.