ПОЛНОТЕКСТОВЫЙ ПОИСК В ПОРТАЛАХ ТЕХНИЧЕСКОЙ ПОДДЕРЖКИ

Михаил Юрьевич Богатырев, Алексей Павлович Колосов

Аннотация


Электронные ресурсы, посвященные ответам на вопросы (например, системы служб техподдержки или форумы) по мере своего развития накапливают все больше информации, поиск по которой способен, с одной стороны, помочь пользователям таких систем получить ответ немедленно, не ожидая ответа специалистов, а с другой – снизить количество дублирующихся вопросов и нагрузку людей, отвечающих на вопросы.

Однако практика показывает, что большинство пользователей предпочитает сразу прибегать к помощи других людей, не пытаясь найти ответ среди имеющейся информации. А значит, уменьшение количества дубликатов и снижение нагрузки специалистов может достигаться путем автоматического поиска по тексту вопроса до того, как этот вопрос (состоящий в общем случае из 1-10 предложений произвольного стиля на естественном языке) попадет в базу данных.

Имеющиеся в настоящее время системы позволяют производить автоматический поиск по ключевым словам из темы сообщения, но известная статистика показывает, что такой подход недостаточно эффективен. Только 1% пользователей находит нужную информацию среди автоматически подобранных результатов. Еще 4,5% после просмотра предложенных результатов изменяют свой вопрос.

Подавляющее большинство все же отправляет свои вопросы в техподдержку без изменений.

Объясняются такие результаты достаточно просто: лишь очень немногие пользователи могут достаточно кратко и в нужных терминах сформулировать суть проблемы, с которой они столкнулись. Большинство просто указывает абстрактные темы вроде «Support query» или «Usage problem». Следовательно, для повышения эффективности поиска необходимо анализировать весь текст запроса.

В данной статье рассматриваются задача и алгоритм поиска по полным текстам запросов. Решения иллюстрируются на примере портала техподдержки компании, занимающейся производством программного обеспечения.


Полный текст:

PDF

Литература


A World of Conceptual Graphs, http://conceptualgraphs.org/

Bani-Ahmad S.G., Al-Dweik G. A new term-ranking approach that supports improved searching in literature digital libraries // Research Journal of Information Technology, 2011. Volume 3, Number 1, p. 44-52.

Bogatyrev, M.Y., Mitrofanova, O. A., Tuhtin, V.V. Building Conceptual Graphs for Articles Abstracts in Digital Libraries. - Proceedings of the Conceptual Structures Tool Interoperability Workshop (CSTIW 2009) at 17th International Conference on Conceptual Structures (ICCS'09) - Moscow, Russia, July 2009, - p.p. 50-57.

Landauer, T.K., Foltz, P.W., Laham, D. An Introduction to Latent Semantic Analysis. Discource Processes, Issue 25, p. 259-284, 1998.

TF-IDF, Wikipedia, 10.01.2007 http://en.wikipedia.org/wiki/Tf%E2%80%93idf

Компания SmartBear Software http://smartbear.com/


Ссылки

  • На текущий момент ссылки отсутствуют.