Выделение терминологических словосочетаний из специальных текстов на основе различных мер ассоциации
Аннотация
Статья представляет результаты исследования по выделению терминологических словосочетаний на основе различных статистических мер: t-score, MI, MI3, min. sensitivity, log-likelihood, logDice, и MI.log_f. Приводятся результаты экспериментов с помощью системы Sketch Engine.
Ключевые слова
Полный текст:
PDFЛитература
Захаров В.П. Тезаурус по корпусной лингвистике // Информационные технологии и письменное наследие. El'Manuscript-10. Материалы Международной научной конференции. — Уфа, 2010. — С. 95-98.
Evert S. Computational Approaches to Collocations. URL: http://collocations.de
Evert S. The statistics of word cooccurrences: Word pairs and collocations. Ph. D. thesis, University of Stuttgart, 20; Krenn B., Evert S. Can we do better than frequency? A case study on extracting PP-verb collocations. // Proceedings of the ACL Workshop on Collocations. 2001. P. 39-46; Křen M. Kolokační miry a čestina: srovnaní na datech ČNK. // Kolokace. Praha: Ústav Českého národního korpusu, 2006. P. 223–248; Pečina P. Lexical association measures: collocation extraction. Praha, 2009.
Kilgarriff A., Rychly P., Smrz P., Tugwell D. The Sketch Engine // Proceedings of the XIth Euralex International Congress. — Lorient: Universite de Bretagne-Sud, 2004. — P. 105–116.
Pedersen T. Dependent Bigram Identication. //Proceedings Fifteenth National Conference on Artifical Intelligence. 1998. P. 1197.
Хохлова М.В. Экспериментальная проверка методов выделения коллокаций. // Slavica Helsingiensia 34. Инструментарий русистики: Корпусные подходы. Под ред. А. Мустайоки, М.В. Копотева, Л.А. Бирюлина, Е.Ю. Протасовой. Хельсинки, 2008. С. 343–357.
Ссылки
- На текущий момент ссылки отсутствуют.