Устойчивые словосочетания в роли предлогов
Аннотация
В работе рассматриваются особенности обработки неоднословных оборотов (фразем), способных выполнять функции предлогов, при автоматическом анализе русскоязычных текстов. Сложность анализа таких оборотов заключается в достаточно высокой омонимичности, что снижает точность автоматического разбора предложений и, тем более, определение семантики. На основе возможных типов омонимии проведена классификация более 320 фразем.
К первой группе относятся фраземы, которые однозначно являются предлогами, но могут иметь семантическую неоднозначность. Для второй группы характерна частеречная омонимия предлог/наречие. К третьей группе отнесены фраземы, имеющие два/три варианта разбора: один/два оборота, соответствующие разным частям речи и простое сочетание предлога с существительным.
Для каждой группы приводятся списки наиболее частотных фразем (по НКРЯ). Указываются основы построения правил, позволяющих осуществлять эффективное снятие омонимии (применительно к парсеру SemSin). Приводятся примеры, показывающие, что анализ непосредственного окружения фраземы может быть недостаточен для снятия омонимии, так что необходимо рассмотрение удаленного контекста.
К первой группе относятся фраземы, которые однозначно являются предлогами, но могут иметь семантическую неоднозначность. Для второй группы характерна частеречная омонимия предлог/наречие. К третьей группе отнесены фраземы, имеющие два/три варианта разбора: один/два оборота, соответствующие разным частям речи и простое сочетание предлога с существительным.
Для каждой группы приводятся списки наиболее частотных фразем (по НКРЯ). Указываются основы построения правил, позволяющих осуществлять эффективное снятие омонимии (применительно к парсеру SemSin). Приводятся примеры, показывающие, что анализ непосредственного окружения фраземы может быть недостаточен для снятия омонимии, так что необходимо рассмотрение удаленного контекста.
Ключевые слова
автоматический анализ текста; омонимия; словосочетания; лексические обороты; предложные группы
Полный текст:
PDFDOI: https://doi.org/10.17586/2541-9781-2021-5-17-28
Ссылки
- На текущий момент ссылки отсутствуют.
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.