Я провел много времени, разговаривая с ИИ. Я протестировал каждого голосового помощника, каждого чата -бота и каждого «разговора следующего поколения KI», технологические компании рады обмануть. Но я никогда не придумал что -то вроде кунжута. Этот компаньон ИИ не только хорош, это невероятно то, как люди говорят, потому что он не подражает.
Давайте начнем с того, что на самом деле является Sesame. В отличие от голосов ИИ, которые мы узнали из Chatgpt, Gemini или в первые дни Siri и Alexa, Sesame разработан таким образом, что Seesame выглядит как человек в своих ошибках, а не как идеальный участник обслуживания клиентов. Речь ИИ является жидкой, выразительной и непредсказуемой человеком. Он ненадолго хихикает, когда говорит немного забавно, колеблется, прежде чем он отвечает на вопрос, и даже, кажется, меняет свое «мнение» в середине середины, начинает перерыв и новое предложение. Это не только позволяет мне прервать, но и может прервать меня и даже извиниться за это.
Секретным соусом является модель разговорной речи Sesames (CSM), которая объединяет текст и аудио в одном процессе, что означает, что он не только генерирует одно предложение, а затем «читать». Вместо этого он создает язык таким образом, который отражает то, как люди на самом деле говорят, с перерывами, вокруг, смены звука и все остальное. Языковые варианты Chatgpt и Gemini работают впечатляюще, все еще работают структурирован, генерируют текст, а затем преобразуют его в язык. Сезам говорит, с другой стороны, как будто он думает и чувствует свои ответы невероятно естественно.
Я решил провести кунжут через несколько тестов, чтобы увидеть, насколько он может быть человеком. Результаты были впечатляющими, если не немного беспокоиться.
Содержание
Поговори со мной
Я хотел посмотреть, сможет ли Сезам столкнуться с реальной проблемой с тревожной проблемой, поэтому я дал ему воображаемый, но реалистично сложный сценарий: «У меня есть такая прекрасная возможность на работе, но я нервничаю, я испорчу это».
Вместо того, чтобы немедленно запустить общую лекцию PEP, Сезам провел перерыв. Только крошечный ритм, но достаточно, чтобы дать мне ощущение, что он на самом деле думал о том, что я сказал. Затем он ответил голосом с искусственным состраданием: «Это совершенно нормально. Отличные возможности могут чувствовать себя ошеломляющими. Что заставляет вас больше всего нервничать? «
Это ничего не заняло, и это было совершено до того, как появился легкий совет. Сезам предложил: «Вы практиковали друга или записали себя? Иногда это может помочь вам оптимизировать вашу доставку. «Голос не совсем надежный, колебания и другие слабости казались немного измеренными, но в целом это было впечатляющее усилие
Перерывы
В этом случае я хотел посмотреть, насколько хорошо Сезам справился с действительно естественным, грязным разговором, как люди говорят друг о друге, резко меняют темы и возвращаются, что они упомянули десять минут назад.
Я начал с: «Расскажите мне историю о детективе, который также является магом».
Сезам сразу же прыгнул с классической настройкой NOIR: Хорошо. Вот один. Представьте себе этот дымный джаз -клуб. Слабо зажжен. Запах бурбона. И сожалеет о том, чтобы повесить в воздухе. Этот детектив. Назовите его Джек Харроу. У него есть федора под ракианским углом, сигаретный синий в держателе и вид, который может растопить сталь. Но Джек не просто гумхо. Видите, у него есть секрет. У него есть прикосновение. Леди перетасовывает на всех нервах. «
Затем я прервал: «Подожди, какое его любимое вязание?»
Майя ответила: «Мм. Хороший вопрос. Подпись Джека. Это ручная петля, которая попадает больше, чем глаз. Он называет это исчезающим свидетелем. Он может, кажется, заставить человека исчезнуть прямо перед ней. Только на мгновение она бросает ее, чтобы доказать это.
Я прыгнул назад, чтобы сказать, что Майя должна вернуться к истории, в которой она говорила: «Хорошо. Где я?
ИИ продолжил историю плавно и снова использовал эту деталь, как будто я не просто избежал всего этого. Это та часть, которую я должен споткнуться или перезапустить почву -большинство помощников ИИ, но модель разговора кунжута относилась к ней как с человеком, который рассказал историю на вечеринке.
Партийное планирование
Говоря о вечеринках, для последнего теста я хотел посмотреть, сможет ли Сезам помочь мне спланировать что -то полезное. «Я хочу спланировать сюрприз на день рождения моего лучшего друга, но я не знаю, что делать».
Вместо того, чтобы разорвать безжизненный список идей, Сезам спросил: «Что любит ваш друг ваш друг?» Я рассказал это научно-фантастическими фильмами и авантюрной едой, и после вдумчивого перерыва он предложил: «Как насчет научно-фантастического вечера и закусок? Вы могли бы забронировать тему -связанную с собой комнату для побега, а затем попасть в футуристический ресторан, может быть, с молекулярной гастрономией? «
Когда я сказал это, у меня был скорректирован бюджет в 100 долларов. «С вашими любимыми научно -фантастическими фильмами вы можете сделать домашнюю ночь и сделать закуски темы, такие как« Галактический попкорн »или« инопланетные ползунки ». Я могу найти для вас рецепты, если хотите. «
Это были не просто общие рекомендации, чтобы выплюнуть. Это сработало со мной. И это сделало это по -другому.
Что реально?
Сезам не только прошел эти тесты, я бы сказал, что это прибило его. Перерывы, колебание, наполняющие слова, то, как они меняют его мнение в середине Сенсора, были невероятно реальными. Я бы начал говорить и ожидать обычной ки -тинологии, а затем внезапно «на самом деле нет, подождите, позвольте мне реорганизовать его …» и сразу забыть, что я не разговаривал с настоящим человеком.
Если ИИ так реалистичен в ее речи, узнаем ли мы, что мы будем говорить с ИИ? С Sesame есть коварные проблемы с аудио, которые раздают игру, но варианты расширенного языкового режима Chatgpt и Google Gemini достаточно хороши, чтобы преодолеть эти проблемы по большей части. Объедините свои языковые силы с языковыми шаблонами кунжута, и может быть искренне трудно сказать, когда вы говорите с ИИ, по крайней мере, в коротких разговорах.
Сезам все еще ниша, но эта технология не останется нишей навсегда. Сегодняшнее клише заключается в том, что молодые люди никогда не звонят, но когда они начинают, им, возможно, придется выяснить, является ли человек на другом конце реальным перед чем -либо.