Stability AI привносит свою генеративную технологию искусственного интеллекта в мир музыки, поскольку разработчик запустил новый движок преобразования текста в аудио под названием Stable Audio.
Аналогичный Стабильная диффузионная модель, Stable Audio может создавать короткие звуковые фрагменты на основе простой текстовой подсказки. Компания объясняет в своем Анонсирующий пост что ИИ обучался на контенте из музыкальной онлайн-библиотеки АудиоСпаркс. Там даже утверждается, что модель способна воспроизводить «высококачественную музыку с частотой 44,1 кГц для коммерческого использования». Чтобы представить это число в перспективе, предполагается, что частота составляет 44,1 кГц. звук CD-качества. Так что это неплохо, но не самое лучшее.
Бесплатная версия Stable Audio. в настоящее время доступен для всех, что позволяет вам создавать и загружать 20 отдельных игр в месяц. Продолжительность каждого звукового фрагмента составляет 45 секунд, поэтому он не будет очень длинным.
Стимулирующая музыка
Вводимые вами текстовые подсказки могут быть простыми. Если прослушать сэмплы, предоставленные Stability AI, «Car Passing By» звучит именно так, как следует из названия — проезжающая вдалеке машина, хотя и немного приглушенно. И наоборот, вы также можете сосредоточиться на деталях. Один конкретный семпл содержит подсказку с эмбиент-техно, драм-машиной 808, хлопками, синтезатором, словом «эфирный», 122 BPM и «Скандинавским лесом» (что бы это ни значило). Результатом такого сочетания слов является атмосферный lo-fi хип-хоп бит.
Мы взяли с собой Stable Audio, чтобы быстро опробовать. Нам удалось ввести подсказку с просьбой к ИИ создать динамичную гаражную рок-песню начала 2000-х, и каким-то образом цель была достигнута. Сгенерированный трек соответствовал стилю, хотя и звучал весьма хаотично.
К сожалению, дальше отдельных записей мы не продвинулись. На момент написания Stable Audio наблюдает огромный приток людей, желающих опробовать эту модель. Разработчик рекомендует повторить попытку позже или на следующий день, если вы видите только пустой экран.
У бесплатной версии есть подвох: она предназначена только для некоммерческого использования. Если вы хотите использовать контент в коммерческих целях, вам необходимо приобрести ежемесячный план Stable Audio Professional за 12 долларов США. Он также предлагает 500 поколений песен в месяц, каждая продолжительностью до 90 секунд. Существует также план Enterprise с индивидуальной продолжительностью звука и ежемесячной генерацией. Однако сначала вам необходимо связаться со Stability AI, чтобы разработать план.
Помните, что технологии несовершенны. Большая часть контента звучит хорошо, но некоторые аспекты кажутся неприятными. На наш взгляд, микс в вышеупомянутой эмбиент-техно-песне не очень хорош. Как будто бас и синтезатор спорили о том, какой звук будет доминировать, в результате чего получался чистый шум. Кроме того, похоже, что ИИ не способен воспроизводить вокал. Исполняются только инструментальные произведения.
Стабильный звук, безусловно, интересен, но на него не обязательно полагаться. Следует отметить, что компания просит пользователей оставить отзыв для улучшения ИИ. Контактный адрес электронной почты можно найти на официальной странице объявления.
Если вы планируете использовать эту технологию в своих целях, рекомендуем взглянуть на список TechRadar. лучшие аудиоредакторы 2023 года чтобы исправить любую ошибку, с которой вы можете столкнуться.