OpenAI развернула новую систему генерации изображений, непосредственно интегрированная с GPT-4O. Эта система позволяет ИИ доступ к своей базе знаний и контексту разговора при создании изображений.

Говорят, что эта интеграция обеспечивает более релевантные и точные визуальные выходы.

Openai’s объявление читает:

«Генерация изображений GPT -4O превосходна в точном рендеринге текста, точно следовал подсказкам и использованию внутренней базы знаний 4o, включая преобразующие загруженные изображения или использование их в качестве визуального вдохновения. Эти возможности облегчают создание именно изображения, которое вы представляете, помогая вам более эффективно общаться с помощью визуального и развития генерации изображений в практическом инструменте с Precsion и Power.

Вот все остальное, что вам нужно знать.

Технические возможности

OpenAI выделяет следующие возможности его новой системы генерации изображений:

  1. Он точно отображает текст в изображениях.
  2. Это позволяет пользователям совершенствовать изображения посредством разговора, сохраняя при этом постоянный стиль.
  3. Он поддерживает сложные подсказки с до 20 различных объектов.
  4. Он может генерировать изображения на основе загруженных ссылок.
  5. Он создает визуальные эффекты, используя информацию из учебных данных GPT-4O.

Открытые заявления в своем объявлении:

«Поскольку генерация изображений теперь является родным для GPT -4O, вы можете уточнить изображения посредством естественного разговора. GPT -4O может опираться на изображения и текст в контексте чата, обеспечивая последовательность на протяжении всего.

Примеры

Продемонстрировать консистенция персонажаВот пример, показывающий кошку, а затем ту же кошку с шляпой и монокль.

Скриншот от: openai.com/index/introducing-4o-image-Generation/, март 2025 г.

Вот более практичный пример для маркетологов, демонстрируя генерация текста: Полное меню ресторана, созданное с подробной подсказкой.

Openai раскатывает создание изображения GPT-4O для всехСкриншот от: openai.com/index/introducing-4o-image-Generation/, март 2025 г.

В сообщении Openai есть еще десятки примеров, многие из которых содержат несколько подсказок и последующих действий.

ЧИТАТЬ  Десятки доменов и полный крах (что делать)? - Вопросы для начинающих SEO - Практические вопросы по оптимизации - Форум интернет-маркетинга

Ограничения

Openai признает:

«Наша модель не идеальна. Мы знаем о нескольких ограничениях в данный момент, которые мы будем работать над решением модели после первоначального запуска».

Компания отмечает следующие ограничения своей новой системы генерации изображений:

  • Посещение: GPT-4O иногда обрывает длинные изображения, как плакаты, слишком близко внизу.
  • Галлюцинации: Эта модель может создавать ложную информацию, особенно с расплывчатыми подсказками.
  • Высокие проблемы с смешиванием: Он изо всех сил пытается точно изобразить более 10-20 концепций одновременно, например, полная периодическая таблица.
  • Многоязычный текст: Модель может иметь проблемы, показывающие нелатиновые символы, что приводит к ошибкам.
  • Редактирование: Запросы на редактирование конкретных деталей изображения могут изменить другие области или создавать новые ошибки. Он также изо всех сил пытается поддерживать согласованные лица в загруженных изображениях.
  • Информационная плотность: Модель испытывает трудности с показом подробной информации в небольших размерах.

Поиск последствий

Это обновление изменяет генерацию изображений ИИ из в основном декоративных использования для более практичных функций в бизнесе и общении.

Веб-сайты могут использовать изображения, сгенерированные AI, но с важными соображениями.

Руководящие принципы Google не запрещают изображения, сгенерированные AI, вместо этого сосредоточив внимание на том, предоставляет ли контент ценность независимо от того, как он производится.

Рекомендуется следуя этой лучшей практике:

  • Использование метаданных C2PA (которые GPT-4O добавляет автоматически) для поддержания прозрачности
  • Добавление правильного альт -текста для доступности и индексации
  • Обеспечение изображений служит намерениям пользователя, а не просто заполнение места
  • Создание уникальных визуальных эффектов, а не общих шаблонов ИИ

Защитник поиска Google Джон Мюллер имеет выражен Негативное мнение относительно ИИ-сгенерированных изображений. Хотя его личные предпочтения не влияют на алгоритмы Google, они могут указывать на то, как другие относятся к изображениям ИИ.

Openai раскатывает создание изображения GPT-4O для всехСкриншот от: bsky.app/profile/johnmu.com, март 2025 года.

Обратите внимание, что Google реализует меры Чтобы пометить сгенерированные AI изображения в результатах поиска.

ЧИТАТЬ  Новое сотрудничество, поддержка и инструменты для содействия цифровому благополучию детей и подростков.

Доступность

Эта функция теперь доступна пользователям CHATGPT с плюсом, профессионалом, командой или бесплатными планами. Доступ для пользователей Enterprise и EDU скоро будет доступен.

Разработчики могут ожидать доступ API в ближайшие недели. Из -за более высоких потребностей в обработке генерация изображений занимает в среднем около одной минуты.


Показанное изображение: Patrickassale/Shutterstock



Source link