Оценка эмоциональной окраски постов социальной сети «ВКонтакте», включающих эмодзи, методами машинного и глубокого обучения

Анна Павловна Быкова

Аннотация


В данной работе исследуются возможности применения методов машинного и глубокого обучения к оценке эмоциональной окраски текста постов, содержащих эмо́дзи, из социальной сети «ВКонтакте». Описывается несбалансированный набор данных с текстом постов, размеченный по 15 классам, учитывающим эмоциональную и тональную составляющие в тексте. На полученном наборе данных проводятся эксперименты с использованием 6 методов классического машинного обучения, их ансамблей с мажоритарным и мягким голосованием и 3 нейросетевых методов. Лучший результат по метрикам качества классификации получился для модели BoW +VotingClassifier (soft) (мешок слов + ансамблевый метод с мягким голосованием) на лемматизированном тексте c пунктуацией и с эмо́дзи: F1-мера macro = 69.70%, F1-мера weighted = 82.06% и для рекуррентной нейросети GRU на 15 эпохах обучения: F1-мера macro = 48.77%, F1-мера weighted = 83.74%.

Ключевые слова


анализ эмоций, эмоциональная окраска текста, эмо́дзи, машинное обучение, нейронные сети



DOI: https://doi.org/10.17586/2541-9781-2024-7-12–22

Ссылки

  • На текущий момент ссылки отсутствуют.


Лицензия Creative Commons
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.