Выделение терминологических словосочетаний из специальных текстов на основе различных мер ассоциации

В. П. Захаров, М. В. Хохлова

Аннотация


Статья представляет результаты исследования по выделению терминологических словосочетаний на основе различных статистических мер: t-score, MI, MI3, min. sensitivity, log-likelihood, logDice, и MI.log_f. Приводятся результаты экспериментов с помощью системы Sketch Engine.



Ключевые слова


выделение терминологии; корпусы текстов; терминологические словосочетания; коллокации; коллокаты; специальные тексты; меры ассоциации; синтагматическая связь; сочетаемость; система Sketch Engine; биграммы; структурные схемы номинативных конструкций

Полный текст:

PDF

Литература


Захаров В.П. Тезаурус по корпусной лингвистике // Информационные технологии и письменное наследие. El'Manuscript-10. Материалы Международной научной конференции. — Уфа, 2010. — С. 95-98.

Evert S. Computational Approaches to Collocations. URL: http://collocations.de

Evert S. The statistics of word cooccurrences: Word pairs and collocations. Ph. D. thesis, University of Stuttgart, 20; Krenn B., Evert S. Can we do better than frequency? A case study on extracting PP-verb collocations. // Proceedings of the ACL Workshop on Collocations. 2001. P. 39-46; Křen M. Kolokační miry a čestina: srovnaní na datech ČNK. // Kolokace. Praha: Ústav Českého národního korpusu, 2006. P. 223–248; Pečina P. Lexical association measures: collocation extraction. Praha, 2009.

Kilgarriff A., Rychly P., Smrz P., Tugwell D. The Sketch Engine // Proceedings of the XIth Euralex International Congress. — Lorient: Universite de Bretagne-Sud, 2004. — P. 105–116.

Pedersen T. Dependent Bigram Identication. //Proceedings Fifteenth National Conference on Artifical Intelligence. 1998. P. 1197.

Хохлова М.В. Экспериментальная проверка методов выделения коллокаций. // Slavica Helsingiensia 34. Инструментарий русистики: Корпусные подходы. Под ред. А. Мустайоки, М.В. Копотева, Л.А. Бирюлина, Е.Ю. Протасовой. Хельсинки, 2008. С. 343–357.


Ссылки

  • На текущий момент ссылки отсутствуют.