Разработка базы данных по семантике русских предлогов

Анна Денисовна Москвина, Екатерина Владимировна Еникеева, Виктор Павлович Захаров

Аннотация


В данной статье рассматривается разработка базы данных, содержащей информацию о предложных конструкциях русского языка. Работа проводится в рамках проекта по созданию квантитативной грамматики русских предложных конструкций. Исходной информацией является материал из нескольких корпусов (Araneum Russicum Minus, подкорпуса НКРЯ) и результаты его семантической обработки. На данный момент размечено 4200 употреблений двадцати пяти первообразных предлогов, на выборке из этих данных построена экспериментальная база данных. Представление накопленного материала в виде базы данных позволяет оптимизировать процесс получения статистической информации об употреблении предлогов, а также упростит изучение связей между семантическими и структурными свойствами конструкций. Так, для каждой конструкции пользователь сможет извлечь информацию о ее частоте, реализованных значениях предлога, получить расширенный контекст, сравнить статистику по корпусам разных жанров. В статье рассматриваются особенности материала, обосновывается структура разрабатываемой базы данных, приводятся примеры запросов. Предварительные результаты говорят о целесообразности дальнейшей разработки.

Ключевые слова


русские предлоги; предложные конструкции; значения предлогов; корпусная лингвистика; база данных

Полный текст:

PDF


DOI: https://doi.org/10.17586/2541-9781-2019-3-106-115

Ссылки

  • На текущий момент ссылки отсутствуют.


Лицензия Creative Commons
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.