Этот день заканчивается буквой Y, поэтому новый генератор видео с искусственным интеллектом присоединяется к постоянно растущей массе подобных инструментов. Alibaba является последним участником этой отрасли со своей новой моделью преобразования текста в видео, которая является частью ее портфолио Tongyi Wanxiang. Видеоинструмент искусственного интеллекта, анонсированный на конференции Alibaba Cloud Apsara, был лишь частью лавины новых вариантов искусственного интеллекта от китайского технологического гиганта, включая более 100 новых больших языковых моделей (LLM).

Tongyi Wanxiang — это коллекция моделей генерации синтетических медиа от Alibaba, которая началась в прошлом году с создателя изображений с использованием искусственного интеллекта. Новый инструмент будет создавать высококачественные видеоролики на основе текстовых подсказок на китайском и английском языках, а также фотографий. Руководители Alibaba похвастались, что компания обладает одной из самых передовых архитектур диффузионного преобразователя (DiT), позволяющей создавать видео, сохраняющее свое качество независимо от стиля, который желает пользователь, включая реалистичное живое действие и множество стилей анимации.

Source