Корпус русских локальных документов и актов CorRIDA: цели формирования, состав, структура
Аннотация
В статье описывается начальный этап создания лингвистически размеченного корпуса русских локальных документов и актов CorRIDA . В повседневной жизни носители русского языка всё чаще сталкиваются с необходимостью читать и подписывать различные официальные документы. Обычно это так называемые локальные документы, например, Договоры на оказание платных услуг или Информированные согласия. Однако язык локальных документов исследован недостаточно и практически не рассматривался с применением корпусных методов. Существующие корпусы русского языка пока не предоставляют возможностей для систематического анализа языка документа. Это связано в том числе с проблемами жанровой классификации и разметки нехудожественных текстов. Поэтому формирование корпуса локальных документов является актуальной задачей. CorRIDA насчитывает 1,5 млн слов, охватывает тексты, принадлежащие трём социально значимым доменам (здравоохранение, образование, культура) и содержит жанровую разметку, основанную на шестичленной жанровой таксономии. Целью формирования корпуса является, во-первых, описание локальных документов разных жанров через выделение и сравнение их языковых черт, во-вторых, оценка официально-деловых текстов с точки зрения их языковой сложности, удобства для восприятия и понимания «простым носителем» русского языка.
Ключевые слова
корпус русских локальных документов; официально-деловые тексты; жанры; социально-значимые домены (здравоохранение; образование; культура)
Полный текст:
PDFDOI: https://doi.org/10.17586/2541-9781-2018-2-112-120
Ссылки
- На текущий момент ссылки отсутствуют.
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.