Stability AI привносит свою генеративную технологию искусственного интеллекта в мир музыки, поскольку разработчик запустил новый движок преобразования текста в аудио под названием Stable Audio.

Аналогичный Стабильная диффузионная модель, Stable Audio может создавать короткие звуковые фрагменты на основе простой текстовой подсказки. Компания объясняет в своем Анонсирующий пост что ИИ обучался на контенте из музыкальной онлайн-библиотеки АудиоСпаркс. Там даже утверждается, что модель способна воспроизводить «высококачественную музыку с частотой 44,1 кГц для коммерческого использования». Чтобы представить это число в перспективе, предполагается, что частота составляет 44,1 кГц. звук CD-качества. Так что это неплохо, но не самое лучшее.

(Изображение предоставлено: Stability AI)

Бесплатная версия Stable Audio. в настоящее время доступен для всех, что позволяет вам создавать и загружать 20 отдельных игр в месяц. Продолжительность каждого звукового фрагмента составляет 45 секунд, поэтому он не будет очень длинным.

Стимулирующая музыка

Source