Сопоставительный анализ статистических мер на примере частеречных преференций сочетаемости существительных
Аннотация
Применение квантитативных методов к корпусному материалу позволяет исследователям количественно оценить получаемые данные. Наряду с наиболее часто используемыми мерами для вычисления силы связанности в рамках словосочетаний, такими как MI , t -score или log -likelihood , существуют и иные коэффициенты, которые реже упоминаются в исследованиях, посвященных автоматическому выделению коллокаций. В статье представлен обзор некоторых из данных метрик, в том числе обсуждаются их основные характеристики. Производится их сравнение на материале биграмм для некоторых высокочастотных русских существительных.
Ключевые слова
Статистический аппарат; меры ассоциации; биграммы; MI; LL; MI3; MS; t-score
Полный текст:
PDFDOI: https://doi.org/10.17586/2541-9781-2017-1-166-171
Ссылки
- На текущий момент ссылки отсутствуют.
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.