Полуавтоматическое пополнение словарей на основе синтаксических связей

Ю. В. Адаскина, П. В. Паничева, А. М. Попов

Аннотация


Статья описывает разработанный нами метод полуавтоматического пополнения семантических классов на основе синтаксических связей в корпусе. Такой алгоритм необходим для снижения трудозатрат экспертов при разработке коммерческих приложений для автоматического анализа клиентских отзывов в интернете. Представленные результаты доказывают эффективность предложенного подхода.


Ключевые слова


Полуавтоматическое пополнение словарей; семантические классы; синтаксические связи; словари для предметных областей; анализ клиентских отзывов; машинное обучение; алгоритм SVM; итеративный алгоритм; термины персонала; неразмеченные данные

Полный текст:

PDF

Литература


Кузнецов И. Методики выявления объектов и связей, заданных в неявном виде. Труды международной конференции “Диалог 2013”.

Abney S. Bootstrapping // 40th Annual Meeting of the Association for Computational Linguistics: Proceedings of the Conference, 2002.

Becker M., Hackey B., Alex B., Grover C. Optimising Selective Sampling for Bootstrapping Named Entity Recognition // Proceedings of the Workshop on Learning with Multiple Views, 22nd ICML, Bonn, 2005.

Chang J., Tsai R. T.-H., Chang J. S. Wikisense: Supersense tagging of Wikipedia named entities based WordNet // Proceedings of PACLIC, 2009.

Collins M., Singer Y. Unsupervised models for named entity classification // Proceedings of the Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora, 1999.

Higashinaka R., Sadamitsu K., Saito K., Makino T., Matsuo Y. Creating an Extended Named Entity Dictionary from Wikipedia // Proceedings of COLING 2012: Technical Papers, Mumbai, December 2012.

Hunter J. D. Matplotlib: A 2D Graphics Environment. Computing in Science and Engineering, 9 (2007), Nr. 3.

Joachims T. Making large-Scale SVM Learning Practical // Advances in Kernel Methods — Support Vector Learning, MIT Press, Cambridge, MA, USA, 1999.

Kozareva Z. Bootstrapping Named Entity Recognition with Automatically Generated Gazetteer Lists // EACL, The Association for Computer Linguistics, 2006.

Mavljutov R. R., Ostapuk N. A. Using basic syntactic relations for sentiment analysis // Proceedings of The International Conference “Dialog”, 2012.

McKeown K., Hatzivassiloglou V. Augmenting Lexicons Automatically: Clustering Semantically Related Adjectives // Proceedings of ARPA Workshop on Human Language Technology, 1998.

Mohit B., Hwa R. Syntax-based Semi-Supervised Named Entity Tagging // ACL, 2005.

Riloff E., Shepherd J. A corpus-based bootstrapping algorithm for Semi-Automated semantic lexicon construction // Natural Language Engineering 5(2), 1999.

Sekine S., Sudo K., Nobata C. Extended named entity hierarchy // Proceedings of LREC, 2002. [15] Yu H., Han J., Chang K.C.C. PEBL: Positive Example-Based learning for web page classification using SVM // Proceedings of ACM SIGKDD, 2002.


Ссылки

  • На текущий момент ссылки отсутствуют.