Stability AI, разработчик Stable Diffusion, представляет новый генеративный ИИ, который может создавать короткие видеоролики с текстовой подсказкой.
Точно названный Стабильная раздача видеоОн состоит из двух моделей AI (известных как SVD и SVD-XT) и способен создавать клипы с разрешением 576 x 1024 пикселей. Пользователи могут регулировать частоту кадров от трех до 30 кадров в секунду. Продолжительность видеороликов зависит от того, какая из моделей-близнецов выбрана. Если вы выберете SVD, контент будет воспроизводиться в течение 14 кадров, а SVD-XT немного увеличивает его до 25 кадров. По их словам, длина не имеет большого значения, поскольку отрендеренные клипы воспроизводятся всего около четырех секунд, а затем заканчиваются. официальный листинг на Hugging Face.
Компания разместила на своем канале YouTube видео, показывающее, на что способна Stable Video Diffusion, и контент на удивление качественный. Они определенно не являются тем кошмарным топливом, которое можно увидеть у других ИИ. Видео Make-A-Video от Meta. По нашему мнению, демоверсия Ice Dragon может оказаться самой впечатляющей. Чешуя дракона очень детализирована, а горы на заднем плане выглядят как с картины. Анимация, как вы можете себе представить, довольно ограничена, поскольку объект может лишь медленно двигать головой. То же самое можно увидеть и в других демо. Это либо жесткий цикл шагов, либо медленный панорамный снимок.
На ранних стадиях
На этом ограничения не заканчиваются. Сообщается, что Stable Video Diffusion не может достичь «идеального фотореализма», не может создавать «читаемый текст» и испытывает трудности с отображением лиц. Другая демонстрация на веб-сайте Stability AI показывает, что ее модель способна отображать лицо мужчины без каких-либо странных ошибок, поэтому это можно делать в каждом конкретном случае.
Имейте в виду, что этот проект все еще находится на ранней стадии. Очевидно, что модель не готова к масштабному выпуску и планов на него нет. Stability AI подчеркивает, что Stable Video Diffusion в настоящее время не предназначен «для реальных или коммерческих приложений». Фактически, в настоящее время он предназначен «только для исследовательского использования». Нас не удивляет, что разработчик очень бережно относится к своей технологии. В прошлом году произошел случай, когда… Модель Stability Diffusion попала в сетьЭто приводит к тому, что злоумышленники используют его для создания поддельных изображений.
Доступность
Если вы хотите попробовать Stable Video Diffusion, вы можете присоединиться к листу ожидания, заполнив форму. Форма на сайте компании. Неизвестно, когда людей пустят, но предварительный просмотр будет включать интерфейс преобразования текста в видео. А пока вы можете это проверить Технический документ по искусственному интеллекту и узнайте все подробности проекта.
Изучив документ, нам показалось интересным, что в нем упоминается использование «общедоступных наборов видеоданных» как части учебного материала. Опять же, учитывая это, неудивительно слышать это Getty Images подала в суд на Stability AI из-за обвинений в неправомерном использовании данных в начале года. Похоже, команда стремится быть осторожнее, чтобы не нажить больше врагов.
Пока неизвестно, когда начнется Stable Video Diffusion. К счастью, есть и другие варианты. Обязательно ознакомьтесь со списком лучших производителей видео с использованием искусственного интеллекта на 2023 год по версии TechRadar.