ПОЛНОТЕКСТОВЫЙ ПОИСК В ПОРТАЛАХ ТЕХНИЧЕСКОЙ ПОДДЕРЖКИ
Аннотация
Электронные ресурсы, посвященные ответам на вопросы (например, системы служб техподдержки или форумы) по мере своего развития накапливают все больше информации, поиск по которой способен, с одной стороны, помочь пользователям таких систем получить ответ немедленно, не ожидая ответа специалистов, а с другой – снизить количество дублирующихся вопросов и нагрузку людей, отвечающих на вопросы.
Однако практика показывает, что большинство пользователей предпочитает сразу прибегать к помощи других людей, не пытаясь найти ответ среди имеющейся информации. А значит, уменьшение количества дубликатов и снижение нагрузки специалистов может достигаться путем автоматического поиска по тексту вопроса до того, как этот вопрос (состоящий в общем случае из 1-10 предложений произвольного стиля на естественном языке) попадет в базу данных.
Имеющиеся в настоящее время системы позволяют производить автоматический поиск по ключевым словам из темы сообщения, но известная статистика показывает, что такой подход недостаточно эффективен. Только 1% пользователей находит нужную информацию среди автоматически подобранных результатов. Еще 4,5% после просмотра предложенных результатов изменяют свой вопрос.
Подавляющее большинство все же отправляет свои вопросы в техподдержку без изменений.
Объясняются такие результаты достаточно просто: лишь очень немногие пользователи могут достаточно кратко и в нужных терминах сформулировать суть проблемы, с которой они столкнулись. Большинство просто указывает абстрактные темы вроде «Support query» или «Usage problem». Следовательно, для повышения эффективности поиска необходимо анализировать весь текст запроса.
В данной статье рассматриваются задача и алгоритм поиска по полным текстам запросов. Решения иллюстрируются на примере портала техподдержки компании, занимающейся производством программного обеспечения.
Полный текст:
PDFЛитература
A World of Conceptual Graphs, http://conceptualgraphs.org/
Bani-Ahmad S.G., Al-Dweik G. A new term-ranking approach that supports improved searching in literature digital libraries // Research Journal of Information Technology, 2011. Volume 3, Number 1, p. 44-52.
Bogatyrev, M.Y., Mitrofanova, O. A., Tuhtin, V.V. Building Conceptual Graphs for Articles Abstracts in Digital Libraries. - Proceedings of the Conceptual Structures Tool Interoperability Workshop (CSTIW 2009) at 17th International Conference on Conceptual Structures (ICCS'09) - Moscow, Russia, July 2009, - p.p. 50-57.
Landauer, T.K., Foltz, P.W., Laham, D. An Introduction to Latent Semantic Analysis. Discource Processes, Issue 25, p. 259-284, 1998.
TF-IDF, Wikipedia, 10.01.2007 http://en.wikipedia.org/wiki/Tf%E2%80%93idf
Компания SmartBear Software http://smartbear.com/
Ссылки
- На текущий момент ссылки отсутствуют.