Nano Banana был построен из нуля для обработки текста и изображений одновременно. Эта собственная мультимодальная мощность позволяет совершенно новый ассортимент приложений и творческих возможностей. Вместо того, чтобы генерировать только изображения на основе текстовой подсказки, модель может понять и включать существующее изображение в своем творческом процессе.

Он также не рассматривает каждый новый запрос как пустой лист. Имея дело с изображениями постоянным контекстуальным способом, он понимает, что он только что создал, позволяя более точные и последовательные модификации. И с усовершенствованными рассуждениями и обширными знаниями о Близнецах в мире, Nano Banana может интерпретировать инструкции Waves и применять логику для заполнения белых творческим и контекстуальным способом.

Вот несколько способов поставить эти новые способности работать на вас.

1. Опыт последовательности

Одной из основных сил нано банана является его способность поддерживать согласованность сцен и персонажей через несколько модификаций и поколений. Модель может повторно использовать одни и те же персонажи, изменяя свои наряды, их позы, освещение или всю сцену, или даже создавая их с разных сторон, сохраняя при этом сходство.

«Тонкие недостатки имеют значение, когда публикует фотографии себя или людей, которых вы хорошо знаете. Представление, которое« близко, но не совсем то же самое »может чувствовать себя погашением», — сказал Дэвид Шарон, менеджер по продукту приложения Gemini. «Вот почему изображение Flash Gemini 2.5 означает, что фотографии людей и даже животных выглядят как они.

Подсказка, которая стала особенно популярной? Преобразовать фотографии в фигурки.

Source

ЧИТАТЬ  Эмпатия в искусственном интеллекте: будущее обслуживания клиентов