Создать качественное видео можно без камеры, актеров и монтажа в сложных программах.
Главное правильно создать процесс и правильно пригласить GPT.
ChatGPT становится ведущим инструментом, который помогает придумать идею, написать сценарий, подготовить подсказки, а затем адаптировать текст для озвучки и редактирования.
Меня зовут Паша Захаров, я автор Telegram-канала. Цифровое мышлениев котором я делюсь своими наблюдениями и размышляю о темах цифрового роста и набора персонала.
Ниже приведено подробное описание того, как собрать AI-видео с нуля:
от истории до финального клипа, который можно опубликовать в Reels, Shorts или других органических каналах.
Пойдем.
Содержание
1. Идея и сценарий: с чего начинается хорошее видео
Хорошее видео начинается не с предложения, а со структурированного рассказа.
Обычно это 4-6 сцен, где есть начало, развитие, кульминация и финал.
Каждая сцена это эмоция + действие + визуальный образ.
Если история начинается с общей идеи, запишите ее как историю.
Например, не «корабль тонет», а:
«Корабль плывет под ясным небом, не зная, что грядущая ночь все изменит».
Так что контраст, интрига и атмосфера уже есть.
Затем сценарий.
Запрос в GPT:
Помогите мне создать сценарий короткометражного видео из 5 сцен в духе фильма «Титаник».
Подробно опишите каждую сцену: локацию, действие, свет, звук, атмосферу, эмоции.
Пример результата:
-
Закат, корабль плывет по спокойной воде, золотое отражение.
-
Девушка стоит возле перил, ветер, легкая тревога.
-
Ночь. Мы слышим где-то треск металла, предчувствие.
-
Паника, вода в коридорах, мерцающий свет, шум и хаос.
-
Тишина. Кольцо падает в воду, и камера замедляется.
Совет:
-
Добавьте фоновые звуки и свет (например, «звуки ветра», «мерцающий огонь») — они влияют на атмосферу видео.
-
Лучше сразу подумать о смене настроения: от спокойствия к тревоге, от хаоса к тишине.
-
Если GPT написал это как шаблон, попросите добавить подробности:
Добавьте окружающий контраст между сценами »
«Описывайте чувства героев без лишнего драматизма»
2. Подготовка визуала с помощью Midjourney
После сценария переходим к визуальным эффектам.
Задача — превратить каждую сцену в кадр с правильным светом и атмосферой.
Для этого используйте GPT в качестве переводчика между «историей» и «сеттингом».
Запрос в GPT:
Напишите подсказку для каждой сцены Midjourney в кинематографическом стиле, с последовательным освещением, цветами и реализмом.
Примеры подсказок:
-
Титаник, плывущий по спокойному океану на закате, золотые блики, кинематографическая композиция, съемка с дрона, 4k, теплый свет, детальная текстура
-
Молодая женщина на мосту, ветер развевает ее волосы, мягкий вечерний свет, задумчивый взгляд, 35-мм пленка, малая глубина резкости.
-
Ночной океан, впереди айсберг, холодный синий свет, молчаливое напряжение, кинематографический реализм
-
Затопленный коридор внутри корабля, мерцающие огни, бегущие люди, хаос, реалистичная текстура воды, драматическая атмосфера
-
Золотое кольцо, погружающееся под воду, мягкие лучи света, тишина, кинематографическая четкость, крупный план 4k.
Практические советы:
-
Используйте одинаковые описания света и цвета в каждой подсказке (золотой свет, кинематографический вид, кинематографический вид) — так изображения будут выглядеть как одно видео.
-
Избегайте «лишних» слов типа «красивый», «захватывающий дух», «великолепный» — они портят реализм.
-
Для вертикальных видео добавьте —ar 9:16, для горизонтальных — —ar 16:9.
-
Укажите стиль: реалистичный, зернистый, естественный свет, угрюмый.
-
Если изображение кажется «пластиковым», добавьте к просьбе:
«мягкие тени, меньше контраста, естественные тона».
3. Анимация с помощью Клинга и Соры.
Когда кадры готовы, нужно добавить движение.
Клинг – преобразует статичные изображения в плавные движения.
Подходит для портретов, пейзажей, панорам.
Хорошо работает, если вам нужно небольшое движение камеры.
Запрос в GPT:
На основе этих сцен составьте короткие подсказки для Клинга.
Пусть камера движется плавно, свет естественный, без резких эффектов.
Примеры:
-
камера медленно движется над океаном, отражения теплого света
-
медленное увеличение лица женщины, нежный ветер, эмоциональная атмосфера
-
портативная камера в коридоре, мерцающий свет, брызги воды, хаос
Совет:
-
Подсказки должны быть короткими (до 12 слов).
-
Избегайте ненужных прилагательных: Клинг лучше всего описывает действие камеры, а не «красоту».
-
Используйте слова: дрон, увеличение/уменьшение масштаба, панорамирование влево/вправо, медленное вращение, естественное движение.
-
Если кадр прерывистый, добавьте «постоянная камера, медленное движение».
Сора — создаёт видео с нуля по описанию.
Подходит, если нужно продемонстрировать динамику – движение корабля, воды, ветра, паники.
Запрос в GPT:
Напишите подсказки для Соры к этим сценам.
Видео должно быть реалистичным, длиться 6-8 секунд, без карикатурных движений.
Примеры:
-
Титаник плывет по спокойному океану на закате, нежные волны, кинематографическое движение, реалистичная текстура воды 4k, продолжительность 8 с.
-
Женщина стоит на мосту, ее волосы развеваются на ветру, камера медленно вращается вокруг нее, кинопленка, 35 мм, продолжительность 6 с.
-
Затопленный коридор внутри корабля, бегущие люди, брызги воды, слегка трясется камера, реалистичное освещение, —продолжительность 8 секунд.
Совет:
-
Для большего реализма добавьте зернистость пленки, кинематографическое освещение и реалистичную текстуру воды.
-
Для плавности: замедленное движение, неглубокий фокус, естественное движение.
-
Проверьте продолжительность: если видео прерывается, уменьшите —duration.-
-
Важно, чтобы все сцены имели одинаковую цветовую температуру, иначе монтаж «сломается».
4. Текст и озвучка через ElevenLavs
После визуальных эффектов и анимации вам нужен текст — короткий, четкий и ритмичный.
Это должно завершить видео
Запрос в GPT:
Напишите короткий текст для озвучки данного видео (до 25 секунд), спокойный, с эмоциями и паузами.
Совет:
-
Лучше всего разделить текст на 3-4 коротких предложения.
-
Делайте паузы: они важнее длинных предложений.
-
Вы можете установить время для каждой фразы
Если вы не хотите добавлять текст, вы можете попросить GPT предложить подходящую музыку на основе сценария.
Голос через ElevenLabs
Здесь важно не просто «синтезировать», а подобрать тембр, ритм и эмоцию. При этом он также может Справка по GPT:
Выберите стиль речи, тембр и эмоцию, чтобы выразить текст:
Видео короткое, драматичное, в духе фильмов о море и воспоминаниях.
Опишите, как должен звучать голос (тембр, скорость, интонация) и с каким акцентом его лучше всего читать для ElevenLabs.
Советы для ElevenLabs:
-
Мужской голос с глубоким тембром предназначен для драматизма.
-
Сладкий для женщин – для ностальгии и спокойствия.
-
Используйте стабильность 20-30% и ясность 70-80%, чтобы звук был естественным.
-
Сделайте несколько дублей — иногда «неидеальная» версия кажется более живой.
-
Если вам нужно больше эмоций, уменьшите стабильность; если вам нужно больше ясности, увеличьте ясность.
-
Сделайте голос немного медленнее обычного — нейронные сети любят дыхание и паузы.
5. Монтаж и структурирование видео через CapCut
Когда у вас готовы видеоклипы (от Клинга или Соры), изображения, текст и озвучка, начинается самая важная часть: монтаж.
CapCut — лучший вариант: бесплатный, простой и позволяющий добиться кинематографических результатов, если знать несколько хитростей.
Запрос в GPT:
Разбейте сценарий на части для 30-секундного видео.
Добавьте рекомендации по темпу каждой сцены: где ускорить, где замедлить.
-
0:00-0:06 — закат и лодка, плавный темп.
-
0:06–0:10 – девушка у перил, небольшое движение камеры.
-
0:10–0:18 — ночь и столкновение, быстрое редактирование.
-
0:18-0:25 – паника, мерцание, хаос.
-
0:25-0:30 — кольцо падает, тишина, дальний выстрел.
Совет:
-
Формат: 9:16 для вертикальных видео, 16:9 для YouTube.
-
Качество: установите значение 1080p или 4K, 30 кадров в секунду (60 кадров в секунду, если движение плавное).
-
Пропускная способность: 20–25 Мбит/с для 1080p, 40–50 Мбит/с для 4K.
-
Цвет: уменьшите насыщенность на 10–15 %, добавьте светофильтр «Кинематографический» или «Теплый свет», чтобы выровнять яркость между сценами.
-
Стабилизация: включите автоматическую стабилизацию, если камера трясется.
-
Звук: голос на 3–5 дБ громче музыки, добавлено плавное появление/затухание и легкая реверберация.
-
Переходы: используйте простое плавное или перекрестное затухание длительностью не более 0,3 секунды.
-
Финал: добавьте 1 секунду тишины, перед экспортом проверьте соответствие света, звука и ритма.
6. Общие советы и рекомендации
-
Подробно подготовьте сценарий. Чем подробнее описание сцены, тем меньше последующих исправлений.
-
Держите это в стиле. Фильтр, палитра, свет: все это создает эффект кинопленки.
-
Не бойтесь модификаций. Даже 2-3 итерации GPT дают качественно лучший результат.
-
Работайте сериями. Разный стиль, разные сюжеты – это быстро создает узнаваемость.
-
Делайте ссылки. В запросе к GPT можно написать:
«Создать сценарий в стиле фильмов Нолана/Прометея/Данка».
Это позволяет задать правильный визуальный ритм.
-
Озвучку и текст делайте в последнюю очередь. Тогда это будет зависеть от готового темпа видео, а не наоборот.
-
Сделайте версию без звука. Видео часто смотрят без звука, поэтому важен визуальный смысл.
-
Не бойтесь экспериментировать. Меняйте свет, ракурс камеры, ритм – даже мелкие детали влияют на восприятие.
Заключение
ChatGPT помогает построить весь процесс: от сценариев и подсказок до текста и редактирования.
Midjourney — за визуал, Kling и Sora — за движение, ElevenLabs — за озвучку, CapCut — за финальную сборку.
Главное – конкретные запросы, единый стиль и внимание к деталям.
Если вы сохраните контроль над светом, звуком и ритмом, видео будет выглядеть собранным и качественным независимо от инструментов.
Спасибо за чтение! Надеюсь, это было полезно и интересно. До скорой встречи.

