OpenAI, возможно, готовит следующую версию своего генератора текста в изображение DALL-E AI с серией альфа-тестов, которые уже опубликованы. декодер.
Анонимный лидер на Discord поделился подробностями о своем опыте доступа к будущей модели изображения OpenAI, получившей название DALL-E 3. Впервые он появился в мае и поделился с каналом Discord на основе интересов, что он участвует в альфа-тестировании OpenAI тестирует новую модель изображения AI. Он поделился изображениями, которые создавал в то время.
Майский альфа-тест имел возможность генерировать изображения с несколькими соотношениями сторон в рамках модели изображения. ютубер, MattVidPro ИИ Затем были представлены некоторые изображения, созданные в формате 16:9. Этот выпуск также продемонстрировал способность модели создавать высококачественный текст, что по-прежнему является проблемой для конкурирующих моделей, даже для лучших генераторов, таких как Stable Diffusion и Midjourney.
В некоторых примерах использовались изображения, такие как текст, встроенный в кирпичную стену, неоновая вывеска со словами, рекламный щит в городе, верхушка для торта и имя, выгравированное на горе. Модель предполагает, что DALL-E умеет генерировать людей. На одном из таких изображений была показана женщина, поедающая спагетти на вечеринке.
Ликер вернулся на канал Discord в середине июля с более подробной информацией и новыми изображениями. Он утверждал, что участвовал в «закрытом альфа-тестировании», в котором участвовало около 400 испытуемых. Он добавил, что его пригласили на тест по электронной почте, а также он участвовал в тестировании оригинальных DALL-E и DALL-E 2. Это привело к выводу, что альфа-тест может применяться к DALL-E 3, но это не подтвердилось.
Модель была значительно обновлена в период с мая по июль. Ликер продемонстрировал это, поделившись изображениями, созданными на основе той же командной строки, показывая, насколько мощным со временем стал DALL-E 3. Подсказка Картина розового шута, дающего пять панде во время соревнований по велоспорту. Велосипеды сделаны из сыра, а земля очень грязная. Вы едете через туманный лес. Панда злится.
May Alpha создает общую сцену, которая затрагивает большинство моментов подсказки. При соединении рук есть небольшое искажение, а колеса на велосипедах скорее желтые, чем сырные. Тем не менее, июльская альфа гораздо более детализирована, так как розовый шут и панда явно дают пять, а велосипедные колеса сделаны из сыра на протяжении нескольких поколений.
Между тем, в Midjourney шут отсутствует, а панды едут на мотоциклах вместо велосипедов. Вместо грязи дороги. Панды счастливы, а не злы.
Есть множество примеров альфа-изображений DALL-E от 3 июля, которые показывают потенциал модели. Однако, поскольку альфа-тест не подвергается цензуре, по словам источника утечки, также могут быть сцены с «насилием и наготой или материалами, защищенными авторским правом, такими как логотипы компаний».
Некоторые примеры: окровавленная аниме-девушка, Игра престолов характер, а Grand Theft Auto V Обложка, зомби-Иисус, поедающий бутерброд Subway, что также предполагает светлую кровь, и, среди прочего, Шрек, обнаруженный во время археологических раскопок.
MattVidPro AI обнаружил, что модель изображения генерирует изображения так, как будто они должны иметь определенный стиль.
DALL-E 2 был запущен в апреле 2022 года, но строго регламентировался и имел лист ожидания из-за своей популярности, а также соображений этики и безопасности. Генератор изображений AI был выпущен для публики в сентябре 2022 года.
Рекомендации редактора