Использование алгоритмов машинного перевода в задаче субтитрирования образовательного видеоконтента
Аннотация
В статье исследуется возможность интеграции алгоритмов машинного перевода (МП) в задачу субтитрирования образовательного видеоконтента и, в частности, в процесс создания высококачественных английских субтитров для русскоязычных видеолекций по лингвистике YouTube-канала «Постнаука». Метод улучшения качества перевода субтитров основан на дообучении модели машинного перевода на специализированном корпусе видеолекций. Для лучшего понимания проблемы автоматического субтитрирования образовательных видео был изучен ряд теоретических вопросов: природа образовательного видео как жанра аудиовизуального текста, специфика аудиовизуального перевода (АВП) и субтитрирования, в частности, а также эволюция и современное состояние алгоритмов машинного перевода (МП), и применение МП к АВП. В результате проведения экспериментального исследования было установлено, что перевод субтитров, осуществленный моделью, когерентен при изменении их форматирования на формат одна строка — одно предложение. Перевод является адекватным, за исключением терминологии, которую модель с трудом распознает и неправильно переводит во многих случаях. После дообучения модель начала распознавать больше терминов. В статье обсуждаются возможные причины, по которым не удалось правильно перевести русскую лингвистическую терминологию из видеолекций на английский язык. Результаты исследования доказали возможность применения алгоритмов МП для создания субтитров к образовательным видеороликам при условии предварительного редактирования, например, изменения формата текста. Обозначены будущие направления исследований.
Ключевые слова
субтитрирование; образовательный видеоконтент; машинный перевод; аудиовизуальный перевод
Полный текст:
PDFDOI: https://doi.org/10.17586/3033-5582-2025-9-12-25
Ссылки
- На текущий момент ссылки отсутствуют.

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.


