Мы все знаем историю первого видео на YouTube, гранулированном 19-секундном клипе соучредителя Карима в зоопарке, который замечает слонов позади него. Это видео было решающим моментом в цифровом пространстве, и в некотором смысле это отражение или, по крайней мере, обратное отражение сегодняшнего дня, когда мы перевариваем прибытие VEO 3.
Часть Google Gemini, VEO 3, была представлена в Google I/O 2025 и является первой генеративной видео платформой, которая может генерировать видео с синхронизированным диалогом, звуковыми эффектами и фоновым шумом с одним входным запросом. Большинство из этих 8-секундных клипов поступают менее чем через 5 минут после входа в командную строку.
Я играл с VEO 3 в течение нескольких дней, и для моего последнего вызова я попытался вернуться к началу социального видео и YouTube «Я в зоопарке» Мгновенный В частности, я подумал, сможет ли Veo 3 создать это видео снова.
Как я писал, ключом к хорошему результату VEO 3 является подсказка. Без деталей и структуры Veo 3 делает выбор для вас, и у вас обычно нет того, что вы хотите. Для этого эксперимента я задавался вопросом, как я мог бы описать все детали, которые я хотел извлечь из этого короткого видео, и хотел доставить его в виде запроса на VEO 3. Поэтому, конечно, я обратился к другому ИИ.
Google Gemini 2.5 Pro в настоящее время не может проанализировать URL, но режим Google AI, совершенно новая форма поиска, которая быстро распространяется в США.
Вот командная строка, которую я ввел в режиме AI Google:
Режим Google AI почти сразу же вернулся с подробным описанием, которое я взял в поле Gemini Veo 3 и упал в поле.
Я выполнил некоторые обработки и в основном фразы, такие как «Видео появляется …» и окончательный анализ в конце, но в остальном я оставил большую часть его и добавил это в верхнюю часть записи:
«Давайте создадим видео на основе этих деталей. Вывод должен содержать соотношение 4: 3 и выглядеть так, как будто оно было включено в 8 -мм видеоиндиаса».
VEO 3 потребовалось некоторое время, чтобы сгенерировать видео (я думаю, что услуга в настоящее время забивается), и, поскольку оно производит только 8-секундные куски одновременно, оно было неполным и отрезало диалог в середине палатки.
Тем не менее, результат впечатляет. Я бы не сказал, что главный герой выглядит как Карим. Чтобы быть справедливым, подсказка не описывает стрижку Карима, форму его лица или глубокие глаза. Описание его наряда от Google, вероятно, также было неадекватным. Я уверен, что это сделало бы лучшую работу, если бы я накормил его скриншотом оригинального видео.
Примечание для себя: вы никогда не можете предложить достаточно подробностей в генеративной подсказке.
8 секунд после другого
Veo 3 -Videozoo красивее, чем посетил Карим, и слоны намного дальше, даже если они там в движении.
Veo 3 сделал качество фильма правильно и придал ему хороший вид с 2005 года, но не коэффициент сторон 4: 3. Кроме того, он добавил архаичные и ненужные этикетки наверху, которые, к счастью, быстро исчезли. Теперь мне ясно, что я должен удалить бит «заголовок» из моего запроса ввода.
Аудио особенно хорош. Диалог хорошо синхронизируется с моим главным героем, и если вы внимательно слушаете, вы также услышите фоновый шум.
Самая большая проблема заключается в том, что это была только половина короткого видео на YouTube. Я хотел полного выздоровления, поэтому я решил вернуться с гораздо более короткой подсказкой:
Продолжайте с тем же видео и добавьте его, чтобы оглянуться назад на слонов, а затем посмотреть в камеру, пока он говорит этот диалог:
«Фронтен, и это круто». «И это почти все, что нужно сказать».
VEO 3 соответствовал отношению и главному герою, но потерял часть сюжета и сбросил детальное видео старой школы первого сгенерированного клипа. Это означает, что когда я представляю их вместе (как указано выше), мы теряем значительную непрерывность. Это похоже на пленку, в котором прыгает время, в котором они внезапно получили гораздо лучшую камеру.
Я также немного разочарован тем, что все мои видео Veo 3 имеют бессмысленные кепки. Я должен помнить, чтобы попросить Veo 3, удалить их, спрятаться или положить их за пределы видеокассеты.
Я думаю о том, как сложно было для Карима снимать, редактировать и загружать это первое короткое видео и как я по сути сделал тот же клип без людей, освещения, микрофонов, камер или слонов. Мне не нужно было передавать материал пленки из группы или iPhone. Я только что вызвал это из алгоритма. Мы действительно прошли через выглядящий стекло, друзья мои.
Я узнал другое дело в этом проекте. Как член Google AI Pro, у меня есть два поколения видео Veo 3 в деньПолем Это означает, что я могу сделать это завтра. Дайте мне знать, что создать в комментариях.