Выявление терминов-кандидатов для многоязычного терминологического словаря

Светлана Сергеевна Пивоварова

Аннотация


Целью исследования является разработка методики выделения кандидатов в термины для многоязычного (англо-франко-русского) терминологического словаря на базе параллельного корпуса текстов. Используется алгоритм extract-then-align («выделение–выравнивание»), включающий в себя два этапа: выделение кандидатов в термины (на основе морфосинтаксических шаблонов и мер ассоциации) и установление между ними переводных соответствий. Проверка алгоритма осуществляется на базе англо-франко-русского параллельного корпуса международных юридических текстов. Представлен анализ разработанной методики и оценка выделенных терминов-кандидатов.

Ключевые слова


переводная терминология; параллельные корпусы текстов; термины-кандидаты; переводной терминологический словарь; морфосинтаксические шаблоны; автоматическое выделение терминов

Полный текст:

PDF

Ссылки

  • На текущий момент ссылки отсутствуют.