Алгоритм сбора текстов для анализа тональности и тематического моделирования отзывов пациентов поликлиник
Аннотация
Пользовательский фидбек является ценным источником информации для оценки качества услуг, оказываемых медицинскими учреждениями, в частности поликлиниками, и выявления проблемных аспектов. Однако, процесс сбора пользовательских отзывов представляет достаточно сложную техническую задачу ввиду отсутствия единых требований сбора отзывов пациентов на сайтах поликлиник, которым бы следовали все учреждения здравоохранения. Собираемые традиционным способом данные такого типа, как правило, не являются открытыми. В данной работе рассматривается процесс сбора и анализа пользовательских отзывов о медицинских учреждениях на примере поликлиник города Санкт-Петербурга. Для сбора данных был разработан алгоритм на языке программирования Python, использующий веб-скрапинг. Собранный набор данных содержит более 64 тысяч отзывов о 350 поликлиниках. Собранные данные будут предобработаны и использованы для обучения моделей анализа тональности и тематического моделирования. Приводятся результаты предварительного анализа пользовательских отзывов, которые характеризуются большим лингвистическим и стилистическим разнообразием. Полученные результаты могут быть использованы медицинскими учреждениями для улучшения качества обслуживания и повышения удовлетворенности пациентов. Кроме того, модель может быть применена для сравнительного анализа различных учреждений и выявления областей, требующих внимания.
Ключевые слова
отзывы пациентов поликлиник; открытые данные; Яндекс Карты; веб-скрапинг; естественная обработка языка; анализ тональности; тематическое моделирование
Полный текст:
PDFDOI: https://doi.org/10.17586/2541-9781-2024-8-70-78
Ссылки
- На текущий момент ссылки отсутствуют.
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.