Методология создания шаблонов для русского языка в knowledge-based системах IE

В. Д. Соловьев, В. В. Иванов, Р. М. Гареев, С. В. Серебряков, Н. С. Васильева

Аннотация


Статья посвящена методологии создания шаблонов для основанных на знаниях систем извлечения знаний из текстов на русском языке. Для обеспечения полноты набора шаблонов, разрабатываемых экспертами, предлагается использовать две фундаментальные теории: контекстно-свободные грамматики Хомского в варианте восходящего анализа и теорию И. Мельчука “Смысл - Текст”. Методология демонстрируется на конкретных примерах – создания систем шаблонов для извлечения имен людей и ситуаций покупки одной компанией другой. Предложен алгоритм перефразирования, основанный на лексических функциях из модели “Смысл – Текст”, позволяющий из одного шаблона события покупки автоматически получить 44 варианта.

Полный текст:

PDF

Литература


Hogenboom F., Frasincar F., Kaymak U., and Franciska de Jong. An Overview of Event Extraction from Text // Workshop on Detection, Representation, and Exploitation of Events in the

Semantic Web (DeRiVE 2011) at Tenth International Semantic Web Conference (ISWC 2011), Vol. 779. P. 48-57. CEUR-WS.org, 2011.

Borsje J., Hogenboom F., Frasincar F. Semi-Automatic Financial Events Discovery Based on Lexico-Semantic Patterns // Int. J. Web Engineering and Technology. Vol. 6. No. 2.P. 115-140. 2010.

Xu, F., Uszkoreit, H., Li, H. Automatic Event and Relation Detection with Seedsof Varying Complexity // AAAI Workshop on Event Extraction and Synthesis. 2006.

Проект OntosMiner. URL: http://www.ontos.com/?page_id=630, 2012.

Kluegl P., Atzmueller M., and Puppe F. TextMarker: A Tool for Rule-Based Information Extraction // Proc. Unstructured Information Management Architecture UIMA, 2nd UIMA@GSCL Workshop. 2009 Conference of the GSCL Gesellschaft für Sprachtechnologie ind Computerlinguistik. 2009.

Мельчук И.А. Опыт теории лингвистических моделей «Смысл-Текст». М. 1974.

Ахо А., Ульман Дж. Теория синтаксического анализа, перевода и компиляции. М.: Мир, 1978.

Thompson C.A., Califf M.E., Mooney R.J. Active Learning for Natural Language Parsing and Information Extraction // Proceedings of the XVI International Machine Learning Conference. 1999. P. 4406-4414.

Bouma G., Fahmi I., Mur J., van Noord G., van der Plas L., Tiedemann J. Linguistic Knowledge and question answering // Traitement Automatique des Langues (TAL). 46 (3). 2005.P. 15-39.

Hermjacob U., Echihabi A., Marcu D. Natural language based reformulation resource and wide exploitation for question answering // XI Text Retrieval Conference, Vol. 5500-251 of NIST Special Publication. 2002.


Ссылки

  • На текущий момент ссылки отсутствуют.