Автоматизированная обработка научно-технических текстов с помощью Онтологии по естественным наукам и технологиям

Б. В. Добров, Н. В. Лукашевич

Аннотация


В статье представлен метод автоматической обработки научных документов на основе онтологии по естественным наукам и технологиям ОЕНТ. При разработке онтологии учитывались такие языковые явления, как лексическая многозначность и синонимия. Обработка текстов базируется на свойствах связного текста – лексической и тематической связности. В результате автоматической обработки для научных публикаций строится концептуальный индекс, производится автоматическая рубрикация и автоматическое аннотирование.


Ключевые слова


автоматическая обработка научных документов; лексическая многозначность; синонимия; концептуальный индекс; автоматическая рубрикация

Полный текст:

PDF

Литература


Агеев, М.С. Автоматическая рубрикация текстов: методы и проблемы / Агеев М.С., Добров Б.В., Лукашевич Н.В. // Ученые записки Казанского государственного университета. Серия Физико-математические науки. 2008. Том 150. Кн. 4. C. 25 – 40.

Добров, Б.В. Онтология по естественным наукам и технологиям ОЕНТ: структура, состав и современное состояние / Добров Б.В., Лукашевич Н.В. // Электронные библиотеки (электронная версия: [Электронный ресурс]. — Режим доступа: http://www.elbib.ru/index.phtml?page=elbib/rus/journal/2008/part1/DL).

Добров, Б.В. Разработка лингвистической онтологии для автоматического индексирования текстов по естественным наукам / Добров Б.В., Лукашевич Н.В., Синицын М.Н., Шапкин В.Н. // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды Седьмой Всероссийской научной конференции (RCDL’2005) (Ярославль 4-6 октября 2005 г.). Ярославль: ЯрГУ им. П.Г. Демидова, 2005. С.70 – 79.

Лукашевич, Н.В. Тезаурусы в задачах информационного поиска. М.: Изд-во Моск. университета, 2011.

Лукашевич, Н.В. Автоматическое разрешение лексической многозначности на базе тезаурусных знаний / Лукашевич Н.В., Чуйко Д.С. // Интернет-математика 2007: Сборник работ участников конкурса. Екатеринбург: Изд-во Урал. ун-та, 2007. С.108 – 117.

Подколодный, Н.М. Онтологическое моделирование в биоинформатике и системной онтологии // Труды Второго симпозиума «Онтологическое моделирование». Казань, 2011. C. 233 – 269.

Keet, C.M. A survey of requirements for eutomated reasoning services for bio-ontologies in OWL / Keet C.M., Roos M., Marshall M.S. // Workshop on OWL: Experiences and Directions. Insbruck, 2007.

Noy, N. Specifying ontology views by traversal / Noy N., Musen M. // Proceedings of International Semantic Web Conference, LNCS-3298. 2004. C. 713 – 725.

Rector, A. Ontological Issues in Using a Description Logic to Represent Medical Concepts: Expierence from GALEN / Rector A., Rogers J. // Proceedings of IMIA WG6 Workshop. 1999.

Rosse, C. A Reference Ontology for Biomedical Informatics: the Foundational Model of Anatomy / Rosse C., Mejino J. // Journal of Biomedical Informatics. 36 (6). 2003. C.478 – 500.

Seidenberg, J. Web Ontology Segmentation: Analysis, Classification, Use / Seidenberg J., Rector A. // Proceedings of Conference WWW-2006. 2006. C. 13 – 22.

Stearns, M.Q.SNOWMED clinical terms: overview of the development process and project status / Stearns M.Q., Price C., Spackman K., Wang A. // Proceedings of AMIA Symposium. 2001. C. 662 – 666.


Ссылки

  • На текущий момент ссылки отсутствуют.