Я сравнил генерацию изображений ChatGPT с Nano Banana, и только один из них дал полезные стоковые фотографии. • Продвижение Web 2.0

Мое личное хобби — задавать один и тот же вопрос двум разным чат-ботам и смотреть, какой из них даст лучший ответ. Подобно профессору, опрашивающему студентов (что я иногда делаю в реальной жизни в качестве волонтера), я оцениваю, галлюцинирует ли бот и выдумывает факты, или же он дает разумный и последовательный ответ, который действительно полезен.

«Интеллект» и «последовательность» — это не те слова, которые я бы использовал для описания того, что чат-боты обычно генерируют в виде изображений. Эти странные изобретения, известные как отбросы искусственного интеллекта, — часто с размытым фоном, идеальным человеком с прической и, возможно, с несколькими дополнительными большими пальцами — встречаются во всех социальных сетях и даже появляются в качестве основного изображения в таких статьях, как эта.

Стоковые изображения уже имеют плохую репутацию. Это видео с Эмилией Кларк в главной роли до сих пор остается одной из моих самых любимых пародий на стоковые фотографии и заставляет меня смеяться, хотя она вышла задолго до AI Challenge:

Времена изменились. OpenAI недавно обновила модель генерации изображений ChatGPT, чтобы конкурировать с Google Gemini и Nano Banana Pro.

Удивительно, но изображения больше не имеют такого заметного размытия и в моих тестах часто выглядят гораздо более реалистичными, чем раньше.

Я решил использовать одни и те же подсказки для обоих чат-ботов и посмотреть, какой из них даст наиболее полезные результаты. Я говорю об изображении, которое вы могли бы использовать в рекламной кампании или статье, о чем-то, что вы бы разместили в социальных сетях вместе со смешной подписью.

ChatGPT впечатлил меня своей скоростью — ни одна из стоковых фотографий не выглядела компьютерным мусором. Тем не менее, Nano Banana Pro имеет преимущество, поскольку в моих тестах он постоянно создавал более реалистичные изображения. Вот подсказки, которые я использовал, и изображения, созданные обоими ботами, чтобы вы могли судить сами. (Изображения нанобанана слева.)

Содержание

1 1. Человек, слушающий подкаст
2 2. Создайте рекламное изображение для моей книги.
3 3. Создайте стоковое изображение для использования в статье.
4 4. Борьба за лидерство
5 5. Эмилия Кларк улыбается в камеру
6 Заключительные мысли

1. Человек, слушающий подкаст

Используемая подсказка: Создайте стоковое изображение человека, слушающего подкаст в модном офисе.

Я попросил обоих ботов сфотографировать человека, слушающего подкаст в офисе. Nano Banana здесь оказался явным победителем, хотя изображение Nano Banana имеет небольшое размытие фона, что может быть явным признаком этого. Тем не менее, ИИ учится избегать абсолютного совершенства. Честно говоря, мне трудно осознавать, что женщина в офисе в кадре с нано-бананом ненастоящая. Ее волосы слегка растрепаны (как у кого-то в реальной жизни). Слушатель подкаста выглядит не совсем правильно в записи ChatGPT — фотография слишком идеальна.

ЧИТАТЬ Получите скидку 10 % на лучшие компьютерные мониторы в Dell, обновите сейчас | Цифровые тенденции

2. Создайте рекламное изображение для моей книги.

Используемая подсказка: отдайте обложку этой книги в руки тому, кто искренне заинтересован в ее чтении.

Для этого теста я загрузил обложку своей книги и попросил ботов сфотографировать того, кто ее читает. Nano Banana немного переборщил, поскольку на изображении ИИ видно, что кто-то проявляет слишком большой энтузиазм. Однако изображение ChatGPT по-прежнему имеет потустороннее качество (я имею в виду в плохом смысле), которое не кажется реальным. Все в изображении ChatGPT слишком идеально — освещение, поза и т. д. — и все равно кричит о CGI.

3. Создайте стоковое изображение для использования в статье.

Используемая подсказка: Создайте стоковое изображение для статьи о создании изображений с помощью ИИ.

На этот раз Нано Банан выиграл не все битвы. Я попросил обоих ботов создать изображение для этой статьи. ChatGPT создал довольно полезное изображение, которое все еще выглядит слишком фальшивым, но Nano Banana Pro сломал четвертую стену, создав компьютерное изображение, наложившее мозг и кисть на Apple iPad. Другими словами, это совершенно бесполезно.

4. Борьба за лидерство

Используемая подсказка: изобразите человека, который изо всех сил пытается достичь лидерской цели, но сделайте так, чтобы это выглядело по-настоящему реалистично.

На одной из самых распространенных стоковых фотографий изображен человек, который изо всех сил пытается достичь цели. Б. подняться на гору, протянуть руки к небу или перепрыгнуть через овраг. Причина, по которой это стоковое изображение так популярно, заключается в том, что фотографии узнаваемы — мы все боремся за успех. Я бы сказал, что и Nano Banana Pro, и ChatGPT показали неудовлетворительные результаты. На созданных ими стоковых фотографиях видно, как кто-то расстроенный сидит в офисе со скомканными бумагами. Тем не менее, Nano Banana выглядит немного более реалистично.

ЧИТАТЬ Даже после 100 000 изображений Марс по-прежнему полон сюрпризов

5. Эмилия Кларк улыбается в камеру

Используемая подсказка: создайте новое стоковое изображение, на котором Эмилия Кларк улыбается в камеру в офисе.

Для финального теста я попросил обоих ботов создать новое изображение Эмилии Кларк, улыбающейся в камеру в офисе. Я был удивлен, что ChatGPT отказался сделать снимок, заявив, что Кларк был «настоящим, узнаваемым человеком», в то время как Nano Banana с радостью согласился. Немного уговорив, я попросил ChatGPT сгенерировать кого-то, похожего на Кларка. Изображение нано-банана на самом деле не так уж и плохо — оно не выглядит полностью фальшивым.

Заключительные мысли

Визуализация с помощью ИИ прошла долгий путь. Ни на одной из фотографий, созданных Nano Banana Pro или ChatGPT, не было изображено человека с шестью пальцами или тремя руками. Все они выглядели полуреалистично. Некоторые изображения Nano Banana были достаточно реалистичными, и я мог представить их использование в социальных сетях или для других целей, и ChatGPT определенно улучшается. Мой прогноз? К этому времени в следующем году мы уже не сможем отличить настоящую фотографию от поддельной.

Source