Применение метода ассоциативных правил для открытого извлечения семантических отношений

Р. М. Гареев, В. Д. Соловьев

Аннотация


В статье предлагается модель открытого извлечения экземпляров отношений из естественно-языковых текстов с использованием базы знаний онтологии, где открытое извлечение подразумевает поиск всевозможных отношений в тексте. В основе модели лежит поиск устойчивых сочетаний языковых единиц и их лексических, грамматических и семантических (онтологических) свойств. Для реализации поиска устойчивых сочетаний предлагается применить метод ассоциативных правил. Предлагаемая модель обладает следующими преимуществами: не требует избыточности информации в корпусе, не требует глубокого лингвистического анализа, не требует множества исходных примеров отношений, не является ориентированной на фиксированные структуры языковых выражений.


Ключевые слова


естественно-языковые тексты; устойчивое сочетание языковых единиц; метод ассоциативных правил; структуры языковых выражений

Полный текст:

PDF

Литература


Гареев, Р.М. Извлечение онтологических отношений из семантически размеченного корпуса текстов Википедии / Гареев Р.М., Иванов В.В. // Системный анализ и семиотическое моделирование: материалы первой всероссийской научной конференции с международным участием (SASM-2011). Казань: Академия Наук РТ, 2011. С. 33-40.

Agrawal, R. Mining association rules between sets of items in large databases / Agrawal R., Imielinski T., Swami A. // Proceedings of the 1993 ACM SIGMOD international conference on Management of data. ACM, 1993. P. 207-216.

Banko, M. Open information extraction from the web / Banko M., Cafarella M., Soderland S., Broadhead M., Etzioni. O. // Proceedings of the 20th International Joint Conference on Artificial Intelligence. IJCAI 2007, Proceedings of the 20th International Joint Conference on Artificial Intelligence, Hyderabad, India, January 6-12, 2007. P. 2670-2676.

Davidov, D. Unsupervised Discovery of Generic Relationships Using Pattern Clusters and its Evaluation by Automatically Generated SAT Analogy Questions / Davidov D., Rappoport A. // Proceedings of ACL-08: HLT. Association for Computational Linguistics, 2008. P. 692-700.

Hoffmann, R. Learning 5000 relational extractors / Hoffmann R., Zhang C., Weld D. S. // Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics. Association for Computational Linguistics, 2010. P. 286-295.

Maedche, A. Bootstrapping an ontology-based information extraction system / Maedche A., Neumann G., Staab S. // Intelligent exploration of the web. Heidelberg: Physica-Verlag GmbH, 2003. P. 345-359.

MaedcheЮ A. Discovering conceptual relations from text / Maedche A., Staab S. // ECAI 2000, Proceedings of the 14th European Conference on Artificial Intelligence / Horn, W., editor. Berlin, Germany, August 20-25, 2000. IOS Press, 2000. P. 321-325.

Sarawagi, S. Information extraction // Foundations and Trends in Databases. 2008. Vol. 1. № 3.

Schut,z A. RelExt: A Tool for Relation Extraction from Text in Ontology Extension / Schutz A., Buielaar P. // The Semantic Web–ISWC 2005. Vol. 3729. Springer, 2005. P. 593-606.

Weikum, G. From Information to Knowledge: Harvesting Entities and Relationships from Web Sources / Weikum G., Theobald M. // Proceedings of the twenty-ninth ACM SIGMOD-SIGACTSIGART symposium on Principles of database systems of data. ACM, 2010. P. 65-76.

Wu, F. Open information extraction using Wikipedia / Wu F., Weld D. S. // Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics. Association for Computational Linguistics, 2010. P. 118-127.


Ссылки

  • На текущий момент ссылки отсутствуют.