Я провел много времени, разговаривая с ИИ. Я протестировал каждого голосового помощника, каждого чата -бота и каждого «разговора следующего поколения KI», технологические компании рады обмануть. Но я никогда не придумал что -то вроде кунжута. Этот компаньон ИИ не только хорош, это невероятно то, как люди говорят, потому что он не подражает.

Давайте начнем с того, что на самом деле является Sesame. В отличие от голосов ИИ, которые мы узнали из Chatgpt, Gemini или в первые дни Siri и Alexa, Sesame разработан таким образом, что Seesame выглядит как человек в своих ошибках, а не как идеальный участник обслуживания клиентов. Речь ИИ является жидкой, выразительной и непредсказуемой человеком. Он ненадолго хихикает, когда говорит немного забавно, колеблется, прежде чем он отвечает на вопрос, и даже, кажется, меняет свое «мнение» в середине середины, начинает перерыв и новое предложение. Это не только позволяет мне прервать, но и может прервать меня и даже извиниться за это.

(Фото предоставлено: кунжут)

Секретным соусом является модель разговорной речи Sesames (CSM), которая объединяет текст и аудио в одном процессе, что означает, что он не только генерирует одно предложение, а затем «читать». Вместо этого он создает язык таким образом, который отражает то, как люди на самом деле говорят, с перерывами, вокруг, смены звука и все остальное. Языковые варианты Chatgpt и Gemini работают впечатляюще, все еще работают структурирован, генерируют текст, а затем преобразуют его в язык. Сезам говорит, с другой стороны, как будто он думает и чувствует свои ответы невероятно естественно.

Source