OpenAI начала внедрять новые голосовые и графические функции для своего популярного чат-бота ChatGPT на базе искусственного интеллекта.

Эти новые возможности позволит вам вести более естественное общение с ChatGPT, разговаривая с ним и показывая ему изображения.

Это открывает больше способов использовать ChatGPT в повседневной жизни. Например, во время путешествия вы можете отправить в ChatGPT фотографию достопримечательности и поговорить о ней в режиме реального времени.

Точно так же дома вы можете сфотографировать содержимое своего холодильника и обсудить идеи еды или попросить пошаговый рецепт.

В ближайшие недели OpenAI предоставит эти функции пользователям Plus и Enterprise. Голосовые возможности будут доступны в мобильных приложениях, а функции изображения будут доступны на всех платформах.

Голосовой ввод позволяет вести двусторонний разговор

Новая голосовая функция позволяет вам разговаривать в разговоре с ChatGPT, который теперь может отвечать одним из пяти синтезированных голосов.

Вы можете зарегистрироваться в настройках мобильного приложения iOS и Android, чтобы включить голосовую связь.

По данным OpenAI, голосовая функция использует усовершенствованную модель преобразования текста в речь, обученную на образцах актеров озвучивания. Для распознавания речи он использует Whisper, речевую систему с открытым исходным кодом OpenAI.

Обсуждение изображений обеспечивает визуальный контекст

Теперь вы можете показать ChatGPT одно или несколько изображений, чтобы обеспечить визуальный контекст и сфокусировать разговор.

Например, публикация фотографии неисправного устройства может помочь ChatGPT диагностировать проблемы и предлагать исправления. На мобильных устройствах инструмент рисования позволяет обводить или указывать на определенные части изображения.

В функциях изображения используется мультимодальная версия моделей GPT-3.5 и GPT-4, настроенная для анализа визуальных данных. Перед развертыванием OpenAI тщательно протестировала возможности изображений на предмет рисков безопасности.

ЧИТАТЬ  Как показать или скрыть виджеты на определенных страницах WordPress

Постепенное внедрение с упором на безопасность

OpenAI отметила, что применяет постепенный подход к развертыванию этих функций.

Новая голосовая технология открывает творческие возможности, но также сопряжена с рисками, такими как выдача себя за общественных деятелей. Чтобы снизить риски, голосовая связь в настоящее время ограничена разговорным чатом.

Что касается изображений, OpenAI заявила, что ограничила способность ChatGPT напрямую анализировать людей на фотографиях и давать рекомендации против случаев использования с высоким уровнем риска без проверки.

В итоге

Новые голосовые и графические возможности ChatGPT предлагают пользователям более естественный способ взаимодействия с системой искусственного интеллекта.

Однако OpenAI применяет взвешенный подход к их развертыванию, ограничивая первоначальный доступ и функциональность из-за потенциальных рисков.

По мере расширения этих функций помните об ограничениях ChatGPT и избегайте приложений с высоким уровнем риска без проверки.


Рекомендованное изображение: Ahmed_Rizq/Shutterstock



Source link