Сопоставительный анализ статистических мер на примере частеречных преференций сочетаемости существительных

Мария Владимировна Хохлова

Аннотация


Применение квантитативных методов к корпусному материалу позволяет исследователям количественно оценить получаемые данные. Наряду с наиболее часто используемыми мерами для вычисления силы связанности в рамках словосочетаний, такими как MI , t -score или log -likelihood , существуют и иные коэффициенты, которые реже упоминаются в исследованиях, посвященных автоматическому выделению коллокаций. В статье представлен обзор некоторых из данных метрик, в том числе обсуждаются их основные характеристики. Производится их сравнение на материале биграмм для некоторых высокочастотных русских существительных.

Ключевые слова


Статистический аппарат; меры ассоциации; биграммы; MI; LL; MI3; MS; t-score

Полный текст:

PDF


DOI: https://doi.org/10.17586/2541-9781-2017-1-166-171

Ссылки

  • На текущий момент ссылки отсутствуют.


Лицензия Creative Commons
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.