Openai раскатывает создание изображения GPT-4O для всех • Продвижение Web 2.0

OpenAI развернула новую систему генерации изображений, непосредственно интегрированная с GPT-4O. Эта система позволяет ИИ доступ к своей базе знаний и контексту разговора при создании изображений.

Говорят, что эта интеграция обеспечивает более релевантные и точные визуальные выходы.

Openai’s объявление читает:

«Генерация изображений GPT -4O превосходна в точном рендеринге текста, точно следовал подсказкам и использованию внутренней базы знаний 4o, включая преобразующие загруженные изображения или использование их в качестве визуального вдохновения. Эти возможности облегчают создание именно изображения, которое вы представляете, помогая вам более эффективно общаться с помощью визуального и развития генерации изображений в практическом инструменте с Precsion и Power.

Вот все остальное, что вам нужно знать.

Содержание

1 Технические возможности
- 1.1 Примеры
2 Ограничения
3 Поиск последствий
4 Доступность

Технические возможности

OpenAI выделяет следующие возможности его новой системы генерации изображений:

Он точно отображает текст в изображениях.
Это позволяет пользователям совершенствовать изображения посредством разговора, сохраняя при этом постоянный стиль.
Он поддерживает сложные подсказки с до 20 различных объектов.
Он может генерировать изображения на основе загруженных ссылок.
Он создает визуальные эффекты, используя информацию из учебных данных GPT-4O.

Открытые заявления в своем объявлении:

«Поскольку генерация изображений теперь является родным для GPT -4O, вы можете уточнить изображения посредством естественного разговора. GPT -4O может опираться на изображения и текст в контексте чата, обеспечивая последовательность на протяжении всего.

Примеры

Продемонстрировать консистенция персонажаВот пример, показывающий кошку, а затем ту же кошку с шляпой и монокль.

Скриншот от: openai.com/index/introducing-4o-image-Generation/, март 2025 г.

Вот более практичный пример для маркетологов, демонстрируя генерация текста: Полное меню ресторана, созданное с подробной подсказкой.

Openai раскатывает создание изображения GPT-4O для всех

Скриншот от: openai.com/index/introducing-4o-image-Generation/, март 2025 г.

В сообщении Openai есть еще десятки примеров, многие из которых содержат несколько подсказок и последующих действий.

ЧИТАТЬ Теперь вы можете проверить пост всех в WhatsApp - вот как

Ограничения

Openai признает:

«Наша модель не идеальна. Мы знаем о нескольких ограничениях в данный момент, которые мы будем работать над решением модели после первоначального запуска».

Компания отмечает следующие ограничения своей новой системы генерации изображений:

Посещение: GPT-4O иногда обрывает длинные изображения, как плакаты, слишком близко внизу.
Галлюцинации: Эта модель может создавать ложную информацию, особенно с расплывчатыми подсказками.
Высокие проблемы с смешиванием: Он изо всех сил пытается точно изобразить более 10-20 концепций одновременно, например, полная периодическая таблица.
Многоязычный текст: Модель может иметь проблемы, показывающие нелатиновые символы, что приводит к ошибкам.
Редактирование: Запросы на редактирование конкретных деталей изображения могут изменить другие области или создавать новые ошибки. Он также изо всех сил пытается поддерживать согласованные лица в загруженных изображениях.
Информационная плотность: Модель испытывает трудности с показом подробной информации в небольших размерах.

Поиск последствий

Это обновление изменяет генерацию изображений ИИ из в основном декоративных использования для более практичных функций в бизнесе и общении.

Веб-сайты могут использовать изображения, сгенерированные AI, но с важными соображениями.

Руководящие принципы Google не запрещают изображения, сгенерированные AI, вместо этого сосредоточив внимание на том, предоставляет ли контент ценность независимо от того, как он производится.

Рекомендуется следуя этой лучшей практике:

Использование метаданных C2PA (которые GPT-4O добавляет автоматически) для поддержания прозрачности
Добавление правильного альт -текста для доступности и индексации
Обеспечение изображений служит намерениям пользователя, а не просто заполнение места
Создание уникальных визуальных эффектов, а не общих шаблонов ИИ

Защитник поиска Google Джон Мюллер имеет выражен Негативное мнение относительно ИИ-сгенерированных изображений. Хотя его личные предпочтения не влияют на алгоритмы Google, они могут указывать на то, как другие относятся к изображениям ИИ.

Скриншот от: bsky.app/profile/johnmu.com, март 2025 года.

Обратите внимание, что Google реализует меры Чтобы пометить сгенерированные AI изображения в результатах поиска.

ЧИТАТЬ Раскрытие ценностей: стратегический успех Team Internet Group и возможности для инвесторов

Доступность

Эта функция теперь доступна пользователям CHATGPT с плюсом, профессионалом, командой или бесплатными планами. Доступ для пользователей Enterprise и EDU скоро будет доступен.

Разработчики могут ожидать доступ API в ближайшие недели. Из -за более высоких потребностей в обработке генерация изображений занимает в среднем около одной минуты.

Показанное изображение: Patrickassale/Shutterstock

Source link