OpenAI снова произвел фурор в мире технологий благодаря своей последней инновации: GPT-4 с Vision или GPT-4V.
Видение GPT-4 для написания кода с учетом дизайна:
— Грег Брокман (@gdb) 27 сентября 2023 г.
GPT-4V основан на GPT-4 и включает в себя визуальные возможности, позволяющие модели анализировать изображения, предоставленные подписчиками ChatGPT Plus и Enterprise.
Будет доступно платным пользователям в течение следующих двух недель!
— Грег Брокман (@gdb) 27 сентября 2023 г.
Новая функция имеет большой потенциал, но также несет в себе некоторые риски для бизнеса.
Содержание
GPT-4 с примерами видения
По мере того, как все больше пользователей получают доступ к новой функции, они делятся примерами того, как работает GPT-4 с Vision.
GPT-4 с Vision может анализировать почерк.
Довольно круто. ИИ лучше меня расшифровывает почерк.
Профессор Брин спросил, может ли GPT-4 со зрением прочитать рукописную рукопись Роберта Бойля. Это хорошо получается!
Вероятно, это будет иметь большое значение для ряда научных областей, особенно потому, что ИИ может «рассуждать» о тексте. pic.twitter.com/78jYWfIhCY
— Итан Моллик (@emollick) 27 сентября 2023 г.
Он может создавать код для веб-сайта, используя рисунок на салфетке.
Невероятно, как люди используют GPT-4 с Vision.
pic.twitter.com/1O3AW7DJDr— Хушен Савани (@hushensavani) 27 сентября 2023 г.
Он может анализировать мемы.
Это абсолютно дико. Я совершенно потерял дар речи. pic.twitter.com/wGTAx1hFgS
— Пьетро Ширано (@skirano) 27 сентября 2023 г.
В дополнение к этим примерам я провел несколько простых тестов.
GPT-4 с Vision может писать описания продуктов для ваших страниц продаж и списков Amazon.
Это может помочь вам начать работу с базовым программированием для конкретного дизайна веб-сайта на основе скриншота.
Он может создавать креативные подписи в Instagram с предложениями хэштегов.
Он может написать статью на основе данных с веб-сайта или электронной книги, например, «Состояние SEO 2024».
Как и в случае со всем контентом, созданным искусственным интеллектом, важно проверять точность результатов GPT-4 с помощью Vision. Он по-прежнему вызывает галлюцинации и представляет другие риски.
OpenAI раскрывает потенциальные риски GPT-4V
OpenAI выпустила бумага описание потенциальных рисков, связанных с использованием GPT-4V, которые включают:
- Риски для конфиденциальности, связанные с идентификацией людей на изображениях или определением их местонахождения, могут повлиять на практику обработки данных и соблюдение требований компаний. В документе отмечается, что GPT-4V обладает некоторой способностью идентифицировать общественных деятелей и геолокировать изображения.
- Потенциальные предвзятости при анализе и интерпретации изображений могут негативно повлиять на различные демографические группы.
- Риски безопасности, связанные с предоставлением неточных или ненадежных медицинских рекомендаций, конкретных указаний по выполнению опасных задач или контента, разжигающего ненависть или насилие.
- Уязвимости кибербезопасности, такие как решение CAPTCHA или мультимодальный джейлбрейк.
Риски, связанные с моделью, привели к ограничениям, таким как отказ предлагать анализ изображений с людьми.
В целом, бренды, заинтересованные в использовании GPT-4V для маркетинга, должны оценить и снизить эти и другие риски использования генеративного ИИ, чтобы использовать технологию ответственно и избегать негативного воздействия на потребителей и репутацию бренда.
Первый партнер OpenAI подготовит входные изображения для «более широкой доступности»
OpenAI объявила, что модель GPT-4 с Vision станет основой Be My Eyes Virtual Volunteer, цифрового визуального помощника, предназначенного для слабовидящих.
Хотя технология все еще находится на стадии бета-тестирования, ее возможности заманчивы. Например, эта технология может помочь предприятиям повысить доступность обслуживания клиентов.
Будь моими глазами планы провести бета-тестирование этой функции с корпоративными клиентами, подчеркнув ее коммерческий потенциал за пределами основной аудитории.
Будущее GPT-4 с видением
Потенциал Приложения GPT-4 With Vision для бизнеса, маркетологов и специалистов по SEO может стать новаторским.
Тем не менее, всем пользователям следует сохранять осторожность из-за потенциальных проблем конфиденциальности, справедливости и кибербезопасности, создаваемых GPT-4 с Vision и другими моделями искусственного интеллекта.
В дополнение к возможности ввода изображений OpenAI повторно включил функцию «Просмотр с помощью Bing» для просмотра веб-страниц через ChatGPT.
Рекомендованное изображение: Tada Images/Shutterstock