Предсинтаксический модуль в анализаторе SemSin

Кирилл Кириллович Боярский, Евгений Александрович Каневский

Аннотация


Описаны принципы работы предсинтаксического модуля семантико-синтаксического анализатора SemSin. Использование этого модуля позволяет значительно уменьшить неоднозначность морфологического разбора еще до начала синтаксического анализа. Рассмотрены процедуры токенизации сложных лексических единиц и фразеологических словосочетаний. Приведены примеры снятия омонимии отдельных слов с использованием только ближайшего контекста.

Pre-syntactical module of the parser SemSin

The principles of work pre-syntactical module of the semantic-syntactic analyzer SemSin are described. Using of this module allows to significantly reduce the ambiguity of morphological parsing before the beginning of the syntactical stage. Tokenization procedures for complex lexical units and phraseological expressions are considered. The paper contains examples of removing ambiguity of certain words using only the nearest context.


Полный текст:

PDF

Литература


Баранов А.И. Словарь-тезаурус современной русской идиоматики. Аванта+, 2004. 1135 с.

Боярский К.К., Каневский Е.А. Разбиение текста на предложения // Дискуссия теоретиков и практиков. Научно-практический журнал. 2010. №1 (3). С. 135—137.

Боярский К.К., Каневский Е.А. Автоматическое выявление фамилий в тексте // Интернет и современное общество Материалы XV Всероссийской объединенной конференции «Ин-

тернет и современное общество». СПб.: МультиПроджектСистемСервис, 2012. С. 195—198.

Боярский К.К., Каневский Е.А., Клименко Е.Н. Морфологический анализ текста в системе MAZE-32 // Информационные технологии в гуманитарных и общественных науках. СПб.: СПб ЭМИ РАН, вып. 11, 2001. С. 1—8.

Дорохина Г.В., Журавлёв А.О., Бондаренко Е.А. Исследование алгоритма морфологического анализа слов с дефисным написанием // Системы и средства искусственного интеллекта. ССИИ-2012: материалы международной научной молодёжной школы. Донецк: ИПИИ «Наука і освіта», 2012. С. 17—24.

Епифанов М.Е., Антонова А.Ю., Баталина А.М., Кобзарева Т.Ю., Лахути Д.Г. Итеративное применение алгоритмов снятия частеречной омонимии в русском тексте // Труды международной конференции Диалог'2002. М., 2002. С. 119–123.

Зинькина Ю.В., Пяткин Н.В., Невзорова О.А. Разрешение функциональной омонимии в русском языке на основе контекстных правил // Труды международной конференции

Диалог'2006. М., Наука, 2006. С. 399–402.

Каневский Е.А. Некоторые вопросы автоматической обработки текстов // Экономико-математические исследования: математические модели и информационные технологии.

СПб.: Нестор-История. 2009. Вып. 7. С. 274—284.

Каневский Е.А., Колпакова Н.В. К вопросу построения морфологического анализатора // Труды Международного семинара Диалог’99 по компьютерной лингвистике и ее приложениям. РосНИИ ИИ, 1999. Т.2. С. 98—106.

Каневский Е.А., Боярский К.К. Морфолого-лексический анализатор и классификация текста // Прикладная лингвистика в науке и образовании. Материалы V Международной научно-практической конференции 26–27 марта 2010. СПб.: ЛЕМА, 2010. С. 157—163.

Каневский Е.А., Боярский К.К. Семантико-синтаксический анализатор SemSin. URL: http://www.dialog-21.ru/digest/2012/?type=doc (дата обращения: 22.05.2013).

Кобзарева Т.Ю., Афанасьев Р.Н. Универсальный модуль предсинтаксического анализа омонимии частей речи в РЯ на основе словаря диагностических ситуаций // Труды международной конференции Диалог'2002. М., 2002. С. 258—268.

Кобзарева Т.Ю. Морфоанализ in vivo // Труды Международной конференции Диалог’2004. М., 2004. С. 286—291.

Ляшевская О.Н. и др. Оценка методов автоматического анализа текста: морфологические парсеры русского языка // Компьютерная лингвистика и интеллектуальные технологии: По

материалам ежегодной Международной конференции «Диалог». Вып. 9 (16). М.: РГГУ, 2010. С. 318—326.

Национальный корпус русского языка URL: http://www.ruscorpora.ru/ (дата обращения: 9.07.2013).

Сокирко А. В. Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ) / Диссертация на звание к.т.н. М., 2001. URL: http://www.aot.ru/docs/sokirko/sokirko-candid-4-1.html (дата обращения: 9.07.2013).

Тузов В.А. Компьютерная семантика русского языка. СПб.: СПбГУ, 2004.


Ссылки

  • На текущий момент ссылки отсутствуют.