Это началось как шутка. «Что, если я создам подкаст, в котором буду общаться с ботами искусственного интеллекта и притворяться, что мне интересно то, что они говорят?» Я спросил своего друга.
Это было несколько месяцев назад, прежде чем я понял, что у Google есть инструмент искусственного интеллекта под названием NotebookLM, который позволяет вам общаться с двумя хостами, похожими на людей, (в основном) в режиме реального времени. В так называемом интерактивном режиме вы можете в любой момент принять участие в подкасте и задать вопрос. Боты делают паузу и распознают вас как «слушателя», а затем комментируют то, что вы хотите сказать.
Я решил протестировать NotebookLM, чтобы создать настоящий подкаст, запустить его через Spotify for Creators, а затем продвигать в своих социальных сетях. В процессе я многому научился, но конечный результат многое рассказал о том, что нужно для создания подкаста. Чего следует избегать? Создание подкаста с чересчур роботизированным звучанием и без души. Вот так у меня все заработало.
Запись в интерактивном режиме
Сначала я этого не осознавал, но NotebookLM на самом деле не записывает ваше взаимодействие с хостами-роботами. Поскольку приложение (доступно для мобильных устройств, но также может быть запущено в браузере) находится в стадии бета-тестирования, хорошей документации или даже инструкций по его использованию не так много. Вместо того чтобы полагаться на NotebookLM для записи интерактивного обсуждения, я использовал приложение iPhone Voice Memos. Хотя настоящий подкастер посмеялся бы над плохим качеством, это было быстро и легко.
Для начала вам необходимо выбрать источник для обсуждения. Я решил создать «Происхождение с Джоном Брэндоном» как несколько ироничный подкаст о происхождении повседневных вещей. Мой первый выпуск должен был быть посвящен созданию пузырчатой пленки, поэтому я сначала нашел несколько статей на эту тему и загрузил их в NotebookLM. Это данные обучения, которые используют «ведущие», так как обычно они просто разговаривают друг с другом, но мне не хотелось, чтобы они просто начинали говорить на эту тему. Вместо этого я немедленно вмешался и представился настоящим хозяином.
Как вы можете себе представить, это не совсем то, что задумал Google. Боты отреагировали удивленно и даже заметили, что я не хозяин (упомянув меня по имени), и настояли на том, что это настоящие люди-хозяева. Я задал несколько вопросов о пузырчатой упаковке, но в конечном итоге беседа переросла в дискуссию об осведомленности и сознании ИИ. На мой взгляд, это была гораздо более интересная тема, поэтому мой подкаст приобрел более сатирический тон, похожий на The Onion. Другими словами, хотя речь должна была идти о пузырчатой пленке, речь шла больше об искусственном интеллекте.
Я был доволен результатами, хотя качество записи было не очень хорошим. Я представил, что было бы лучше, если бы я записал дискуссию в прямом эфире на отдельный цифровой диктофон, но меня не интересовало получение награды за подкаст. Я хотел опубликовать свой первый выпуск, и NoteBookLM впечатлил меня, по крайней мере, с точки зрения связного обсуждения. Что еще было круто, так это то, как боты реагировали на мой комментарий в режиме реального времени.
Создание активов

Конечно, подкаст — это больше, чем просто аудиофайл, который вы публикуете. Сюда также входит оформление подкаста, музыкальная заставка, закадровый голос и другие элементы.
После того, как у меня была запись первого эпизода, я обратился к Google Gemini, чтобы создать квадратную плитку, которую можно было бы использовать для шоу. У каждого подкаста есть плитка, которую пользователи могут использовать для идентификации подкаста в таком приложении, как Apple Podcasts. Моя просьба была проста: Создайте квадратное изображение для подкаста Origins с Джоном Брэндоном.. Я также предоставил свое искусственное изображение. На первый взгляд, Gemini создала исключительно хорошую плитку, похожую на ту, которую спроектировал бы профессионал. Однако мне не понравилось, что с ним ассоциировалось мое изображение, поэтому я попросил бота попробовать еще раз. Результат выглядел немного безвкусно, но сносно.
Я собирался на скачки. Затем я использовал Suno для создания музыкальной заставки для моего нового подкаста. Этот инструмент генерации звука AI обычно использует такие подсказки: Напишите новую песню, которая будет звучать как смесь Coldplay и Nirvana.. Вместо этого я больше предложил попросить включить в подкаст взрывную музыку с синтезаторами и барабанами, чтобы добавить немного энергии и волнения, прежде чем мы начнем разговор.
Как и в моей первой попытке с Gemini, Suno выпустила великолепную музыку, которая сразу же звучала идеально. Мне не нужно было делать больше объявлений, но я хотел дополнить вступление закадровым голосом. Я обратился к Speechify, который может взять любой предоставленный вами текст и создать закадровый голос. Затем я использовал ChatGPT, чтобы объединить музыку заставки с закадровым голосом в качестве наложения. Полное раскрытие: я не знал, что с помощью ChatGPT можно создавать аудиофайлы.
Через несколько минут у меня была вступительная музыка в качестве фоновой музыки с закадровым голосом. Я даже настроил затухание между музыкальным вступлением и началом закадрового голоса, а затем оно исчезло. Я попросил ChatGPT добавить звук подкаста для моего первого эпизода, и был создан окончательный аудиофайл, который я загрузил в Spotify.
Одна вещь, которую вам следует избегать

Я был впечатлен результатами и тем, как все сложилосьно я бы сказал, что слишком сильно полагался на искусственный интеллект в своем новом подкасте. Плитка выглядела слегка фальшивой и бездушной, тем более что изображение плитки, которое я использовал, было создано искусственным интеллектом. В самом тоне NotebookLM действительно есть немного больше человечности и души, особенно потому, что я разговариваю с ботами, но в конечном итоге эпизод звучал так, как будто человек разговаривает с чат-ботами, что является верным путем к катастрофе. Люди слушают подкасты не только для того, чтобы узнать что-то новое, но и потому, что говорящие люди близки, интересны и реальны. По крайней мере, это побудило меня сделать настоящий подкаст без каких-либо ботов, занимающихся той же темой.
Мой главный урок был связан с NotebookLM. Это хороший экспериментальный инструмент, который помог мне понять, как создать и запустить подкаст. Это всего лишь лабораторный эксперимент. «Ведущие» повторяют одни и те же звуковые помои снова и снова, особенно когда я присоединяюсь к их разговору. Когда вы слышите, как они несколько раз говорят: «О, у нас есть слушатель, который хочет прокомментировать», вы начинаете подозревать, что это компьютерный обман. Они используют одни и те же вокальные тики и причудливые слуховые манеры снова и снова, до такой степени, что это почти не слышно и раздражает.
Короче говоря, это скучно. Подкаст — это не то, что я хочу держать в сети, и, прежде всего, он показывает, что боты, разговаривающие друг с другом таким образом, никого не расстроят. Это почти как смотреть, как два компьютера играют в видеоигру. Единственное, чего следует избегать при использовании любого подкаста, — это настолько сильно полагаться на ИИ, что он исключает все человечество.
По мере развития ИИ нам, возможно, придется решить, не является ли это хорошим результатом.

