Корпус русских локальных документов и актов CorRIDA: цели формирования, состав, структура

Сергей Александрович Белов, Ольга Владимировна Блинова, Виктория Борисовна Гулида

Аннотация


В статье описывается начальный этап создания лингвистически размеченного корпуса русских локальных документов и актов CorRIDA . В повседневной жизни носители русского языка всё чаще сталкиваются с необходимостью читать и подписывать различные официальные документы. Обычно это так называемые локальные документы, например, Договоры на оказание платных услуг или Информированные согласия. Однако язык локальных документов исследован недостаточно и практически не рассматривался с применением корпусных методов. Существующие корпусы русского языка пока не предоставляют возможностей для систематического анализа языка документа. Это связано в том числе с проблемами жанровой классификации и разметки нехудожественных текстов. Поэтому формирование корпуса локальных документов является актуальной задачей. CorRIDA насчитывает 1,5 млн слов, охватывает тексты, принадлежащие трём социально значимым доменам (здравоохранение, образование, культура) и содержит жанровую разметку, основанную на шестичленной жанровой таксономии. Целью формирования корпуса является, во-первых, описание локальных документов разных жанров через выделение и сравнение их языковых черт, во-вторых, оценка официально-деловых текстов с точки зрения их языковой сложности, удобства для восприятия и понимания «простым носителем» русского языка.

Ключевые слова


корпус русских локальных документов; официально-деловые тексты; жанры; социально-значимые домены (здравоохранение; образование; культура)

Полный текст:

PDF

Ссылки

  • На текущий момент ссылки отсутствуют.