Это будущее, о котором мы давно мечтали, но когда мы сталкиваемся с Alexa, которой не нужно ключевое слово для ее активации и которая может вести разговор так же хорошо, как ваш коллега, друг или случайный знакомый, это шокирует.
Настоящая голосовая поддержка разговоров скоро станет реальностью. Не сегодня, но в самом ближайшем будущем благодаря генеративному ИИ и большим языковым моделям (LLM). В среду (20 сентября) Amazon показала нам новую экспериментальную Alexa, которая намного превосходит свою неестественную реакцию первых дней и легко обгоняет Alexa 2023 года.
По общему признанию, мой опыт работы с этой новой мощной Alexa ограничивался тем, что я мог видеть и слышать как в готовых видеороликах, так и в живой демонстрации, показанной нам Дамой Лимпом, уходящим старшим вице-президентом Amazon по устройствам.
Тем не менее, это не та Алекса, которую вы или я знаем. Он говорит ясно и ясно, без прерывистой и запинающейся манеры, которую мы привыкли ожидать и неохотно принимать. Он знает контекст и обладает памятью.
Чтобы активировать новую Алексу, Дэйв Лимп начал со слов «Алекса, давай поболтаем», и с этого момента Лимп вел открытый разговор с Алексой, в котором ему не нужно было повторять «Алекса».
Алекса ответила: «Хорошо, чем я могу тебе помочь?»
Лимп как-то перенаправился и спросил: «Как дела?»
Такая реакция обычно застает Алексу врасплох и приводит голосового помощника в тупик.
Однако на этот раз подопытная Алекса тут же ответила: «Со мной все в порядке, я очень рада, что могу помогать такому количеству людей каждый день, общаясь с ними».
Разговор продолжался несколько минут, пока Лимп спросил о своей любимой футбольной команде и игре квотербека в последней игре. Это был необычный компромисс, обычный разговор с совершенно необычным собеседником по имени Алекса.
Голос Алексы звучит не совсем по-человечески, но звучит ближе, чем когда-либо. Подумайте о фильме Ее но без сексуального подтекста. Этот фильм десятилетней давности, выпущенный за год до «Алексы», представляет собой тревожную историю человека, которого играет Хоакин Феникс, который влюбляется в ИИ с голосом Скарлетт Йоханссон. Это тревожный роман, который, вероятно, рисует слишком мрачную картину будущего, которое теперь больше похоже на нашу реальность.
Чтобы внести ясность: даже эта экспериментальная Alexa еще не достигла такого уровня.
Однако, поскольку Лимпу не пришлось повторять слоган, разговор продолжился так, как будто Алекса была почти человеком. Улучшенный синтез речи радикально изменит качество голоса Алексы. В конечном счете, я уверен, что это обманет многих людей при слепых аудиотестах.
Человечность исходит не только из звука голоса Алексы, но и из эмоций. Алекса теперь, кажется, связана с моментом.
Это была не идеальная демонстрация. Лимпу пришлось несколько раз повториться, чтобы Алекса ответила, а это примерно то, чего и следовало ожидать от экспериментальной технологии.
Более личностный голос Алексы и контекстуальная осведомленность — лишь часть этой грядущей трансформации. Алекса в конечном итоге узнает вас, когда вы подойдете к эхо-шоу, а затем продолжит разговор с того места, где вы остановились.
Да, я знаю, это звучит превосходно и, возможно, немного пугающе. Да, чтобы это работало, вам нужно выбрать визуальную идентификацию, чтобы камера Echo Show могла видеть, что вы приближаетесь, и, по сути, получить доступ к данным вашего последнего разговора.
Мне вообще-то нравится эта идея, потому что она мало чем отличается от того, когда моя жена начинает говорить со мной о чем-то, о чем мы говорили вчера. Ваше разумное ожидание состоит в том, что я запомню и смогу продолжить разговор. Конечно, иногда я терплю неудачу в этом отношении, но почему компьютер вообще может выйти из строя таким образом?
Сценарий таков: вы подходите к эху и начинаете говорить. Если вы спросите: «Когда игра?», Алекса запомнит, какая команда вам нравится, и что это, скорее всего, связано с сегодняшней игрой, а не с игрой на следующей неделе. Разговор мог бы продолжиться оттуда.
Нам мало что известно о том, как Amazon обучала свою LLM, хотя там упоминался «Ответственный ИИ». Будем надеяться, что это больше, чем просто пустые слова, и что Amazon обучил ИИ использовать разные голоса, а не фрагменты записанных высказываний клиентов.
Вероятно, мы не увидим эту новую Alexa до 2024 года, который не случайно отмечает 10-летие Alexa и Echo. Что может быть лучше, чтобы выпустить совершенно новое Echo и новаторский голосовой помощник Alexa?
Я чувствую, что это обновление привлекает внимание к Siri и Google Assistant. Google, возможно, продвинулся дальше в этой области, но Apple сильно отстает, когда дело доходит до того, чтобы сделать Siri по-настоящему знакомой. Если следующая Alexa окажется настолько хороша, как я ожидаю, Apple, возможно, придется отправить Siri на экстренную операцию на головном мозге.
Даже если первый взгляд на Alexa на базе LLM не оправдает сегодняшних обещаний, я не сомневаюсь, что это произойдет скоро. Конечно, наше волнение по поводу генеративного ИИ и LLM смешано с щедрой порцией страха по поводу того, что нас ждет в будущем, но это всего лишь еще один сигнал о том, что поезд ИИ быстро приближается и никогда не остановится.