ВК Видео обновила алгоритмы искусственного интеллекта, которые автоматически распознают речь и добавляют субтитры к видео. Нейронные сети теперь знают тысячи новых слов, включая мемы, имена собственные, аббревиатуры и профессиональные термины.

Точность анализа и декодирования увеличилась на 25%.

Автоматические субтитры создаются по шаблонам Ml. Для повышения точности аудиопоток проходит несколько этапов обработки, в ходе которых нейросеть отфильтровывает посторонние звуки, выделяет речь и преобразует ее в текст. Модели денормализации и пунктуации затем преобразуют распознанные слова в легко читаемый текст. Затем ИИ синхронизирует полученный текст с аудиодорожкой.

Ожидается, что вскоре нейронные сети научатся различать голоса, что позволит разделять речь разных говорящих на отдельные реплики. Это сделает чтение и понимание субтитров еще проще.

Видео-субтитры помогают людям с нарушениями слуха и удобны в условиях, когда нет возможности включить звук. ВКонтакте сообщает, что эта технология становится все более популярной:

Только за последний месяц доля пользователей, использующих эту функцию в веб-версии, выросла на 28%, и теперь 11% всей аудитории «Видео ВК» использует субтитры.

Напомним, что с момента официального запуска в сентябре 2023 года приложение ВК Видео было установлено более 20 миллионов раз.

Источник: пресс-релиз В.К.



Source

ЧИТАТЬ  GA4 Legal в Европе следует новой концепции конфиденциальности данных