ОБНАРУЖЕНИЕ РОБОТИЗИРОВАННОГО ЗАПОЛНЕНИЯ ФОРМ НА ВЕБ-РЕСУРСЕ

А. А. Менщиков, А. В. Комарова, Ю. А. Гатчин

Аннотация


В современном высокотехнологичном мире огромное количество информации перенесено в сеть Интернет. Данная информация требует своевременной защиты от разного рода утечек. Во всемирной сети кражу информации осуществляют специализированные роботизированные средства, называемые веб-роботами или парсерами. В связи с этим, в данной работе рассматривается подход по обнаружению роботизированных действий в сети Интернет. Авторами предлагается использовать подход на базе шаблонов и машинного обучения. Данный метод на практике показал высокие результаты и может применяться на реальных веб-ресурсах сети Интернет.

Ключевые слова


информационная безопасность; защита информации; веб-роботы; краулеры; парсинг; сбор информации; обнаружение веб-роботов

Полный текст:

PDF

Литература


Эркенов М.С. Основные принципы построения и функционирования информационно-поисковых систем в сети Интернет // Вестник Ростовского государственного университета путей сообщения. 2007. № 2 (26). С. 69-77.

Junsup L., Sungdeok C., Dongkun L., Hyungkyu L. Classification of web robots: An empirical study based on over one billion requests // Computers & Security. 2009. V. 28. No 8. Pp. 795-802.

Nesi Paolo, Gianni Pantaleo, Marco Tenti. Geographical localization of web domains and organization addresses recognition by employing natural language processing, Pattern Matching and clustering // Engineering Applications of Artificial Intelligence. 2016. 51. Рр. 202-211. URL: http://dl.acm.org/citation.cfm?id=2910172 (дата обращения 16.04.2018).

Menshchikov A., Komarova A., Gatchin Y.A., Korobeynikov A.G., Tishukova N. A Study of Different Web-Crawler Behaviour // Proceedings of the 20th Conference of Open Innovations Association FRUCT – 2017. Pp. 268-274.

G. Jacob, E. Kirda, C. Kruegel, G. Vigna. PUB CRAWL: Protecting Users and Businesses from CRAWLers // Proceeding Security’12. Proceedings of the 21st USENIX conference on Security symposium. 2012. Pp. 25–36.

Отчет компании distil networks. URL: https://resources.distilnetworks.com/travel/2018-bad-bot-report, свободный (дата обращения: 23.04.2018).

Сайт компании imperva. URL: https://www.imperva.com/products/threatradar/bot-protection/, свободный (дата обращения 23.04.2018).

Web Robot Detection in Academic Publishing. URL: https://arxiv.org/pdf/1711.05098.pdf (дата обращения 23.04.2018).

Кипаева Е.В., Кириченко М.И., Орлова Ю.А., Заболеева-Зотова А.В. Распознавание ботов в социальных сетях // Открытые семантические технологии проектирования интеллектуальных систем. 2014. № 4. С. 431-434.

Менщиков А.А., Комарова А.В. Система обнаружения автоматизированного сбора информации с веб-ресурсов // Свидетельство о государственной регистрации программы для ЭВМ № 2017661508, 21 августа 2017 г.


Ссылки

  • На текущий момент ссылки отсутствуют.