Выявление терминов-кандидатов для многоязычного терминологического словаря
Аннотация
Целью исследования является разработка методики выделения кандидатов в термины для многоязычного (англо-франко-русского) терминологического словаря на базе параллельного корпуса текстов. Используется алгоритм extract-then-align («выделение–выравнивание»), включающий в себя два этапа: выделение кандидатов в термины (на основе морфосинтаксических шаблонов и мер ассоциации) и установление между ними переводных соответствий. Проверка алгоритма осуществляется на базе англо-франко-русского параллельного корпуса международных юридических текстов. Представлен анализ разработанной методики и оценка выделенных терминов-кандидатов.
Ключевые слова
переводная терминология; параллельные корпусы текстов; термины-кандидаты; переводной терминологический словарь; морфосинтаксические шаблоны; автоматическое выделение терминов
Полный текст:
PDFСсылки
- На текущий момент ссылки отсутствуют.