OpenAI начала внедрять новые голосовые и графические функции для своего популярного чат-бота ChatGPT на базе искусственного интеллекта.
Эти новые возможности позволит вам вести более естественное общение с ChatGPT, разговаривая с ним и показывая ему изображения.
Это открывает больше способов использовать ChatGPT в повседневной жизни. Например, во время путешествия вы можете отправить в ChatGPT фотографию достопримечательности и поговорить о ней в режиме реального времени.
Точно так же дома вы можете сфотографировать содержимое своего холодильника и обсудить идеи еды или попросить пошаговый рецепт.
В ближайшие недели OpenAI предоставит эти функции пользователям Plus и Enterprise. Голосовые возможности будут доступны в мобильных приложениях, а функции изображения будут доступны на всех платформах.
Содержание
Голосовой ввод позволяет вести двусторонний разговор
Новая голосовая функция позволяет вам разговаривать в разговоре с ChatGPT, который теперь может отвечать одним из пяти синтезированных голосов.
Вы можете зарегистрироваться в настройках мобильного приложения iOS и Android, чтобы включить голосовую связь.
По данным OpenAI, голосовая функция использует усовершенствованную модель преобразования текста в речь, обученную на образцах актеров озвучивания. Для распознавания речи он использует Whisper, речевую систему с открытым исходным кодом OpenAI.
Обсуждение изображений обеспечивает визуальный контекст
Теперь вы можете показать ChatGPT одно или несколько изображений, чтобы обеспечить визуальный контекст и сфокусировать разговор.
Например, публикация фотографии неисправного устройства может помочь ChatGPT диагностировать проблемы и предлагать исправления. На мобильных устройствах инструмент рисования позволяет обводить или указывать на определенные части изображения.
В функциях изображения используется мультимодальная версия моделей GPT-3.5 и GPT-4, настроенная для анализа визуальных данных. Перед развертыванием OpenAI тщательно протестировала возможности изображений на предмет рисков безопасности.
Постепенное внедрение с упором на безопасность
OpenAI отметила, что применяет постепенный подход к развертыванию этих функций.
Новая голосовая технология открывает творческие возможности, но также сопряжена с рисками, такими как выдача себя за общественных деятелей. Чтобы снизить риски, голосовая связь в настоящее время ограничена разговорным чатом.
Что касается изображений, OpenAI заявила, что ограничила способность ChatGPT напрямую анализировать людей на фотографиях и давать рекомендации против случаев использования с высоким уровнем риска без проверки.
В итоге
Новые голосовые и графические возможности ChatGPT предлагают пользователям более естественный способ взаимодействия с системой искусственного интеллекта.
Однако OpenAI применяет взвешенный подход к их развертыванию, ограничивая первоначальный доступ и функциональность из-за потенциальных рисков.
По мере расширения этих функций помните об ограничениях ChatGPT и избегайте приложений с высоким уровнем риска без проверки.
Рекомендованное изображение: Ahmed_Rizq/Shutterstock