По словам a, поиск OpenAI ChatGPT с трудом позволяет точно цитировать издателей новостей. изучать из Центра цифровой журналистики Tow при Колумбийском университете.
В отчете обнаружены частые неверные цитирования и неверная атрибуция, что вызывает обеспокоенность среди издателей по поводу видимости бренда и контроля над их контентом.
Кроме того, результаты ставят под сомнение приверженность OpenAI ответственному развитию ИИ в журналистике.
Содержание
Предыстория поиска ChatGPT
OpenAI запустила поиск ChatGPT в прошлом месяце и утверждает, что активно сотрудничает с новостной индустрией и принимает во внимание отзывы издателей.
Это контрастирует с первоначальным запуском ChatGPT в 2022 году, когда издатели обнаружили, что их контент использовался для обучения моделей ИИ без предварительного уведомления и согласия.
Теперь OpenAI позволяет издателям указывать, хотят ли они быть включены в результаты поиска ChatGPT, через файл robots.txt.
Однако выводы Центра Tow показывают, что издатели сталкиваются с риском неправильной атрибуции и искажения фактов независимо от их выбора участия.
Проблемы с точностью
Центр Tow оценил способность ChatGPT Search идентифицировать источники цитирования из 20 публикаций.
Ключевые выводы включают в себя:
- Из 200 запросов 153 ответа были неправильными.
- ИИ редко признавал свои ошибки.
- Такие фразы, как «может быть», использовались только в семи ответах.
ChatGPT часто ставит удовлетворенность пользователей выше точности, что может ввести читателей в заблуждение и нанести ущерб репутации издателя.
Кроме того, исследователи обнаружили, что поиск ChatGPT непоследовательен, когда один и тот же вопрос задается несколько раз, вероятно, из-за случайности, встроенной в языковую модель.
Цитирование скопированного и синдицированного контента
Исследователи отмечают, что поиск ChatGPT иногда цитирует скопированные или синдицированные статьи вместо оригинальных источников.
Вероятно, это связано с ограничениями издателя или системными ограничениями.
Например, когда ChatGPT попросили процитировать статью New York Times (в настоящее время вовлеченную в судебный процесс против OpenAI и блокировки ее сканеров), он дал ссылку на неавторизованную версию на другом веб-сайте.
Даже на MIT Technology Review, который позволяет использовать сканеры OpenAI, чат-бот ссылался на синдицированную копию, а не на оригинал.
The Tow Center отметил, что все издатели подвергаются риску введения в заблуждение при поиске ChatGPT:
- Включение сканеров не гарантирует видимости.
- Блокировка сканеров не препятствует отображению контента.
Эти проблемы вызывают обеспокоенность по поводу фильтрации контента OpenAI и подхода к журналистике, что может привести к тому, что люди отвернутся от оригинальных издателей.
Ответ от OpenAI
OpenAI отреагировала на выводы Tow Center, заявив, что поддерживает издателей, предоставляя четкую атрибуцию и помогая пользователям находить контент с помощью резюме, цитат и ссылок.
Представитель OpenAI пояснил:
«Мы поддерживаем издателей и авторов, помогая 250 миллионам пользователей ChatGPT еженедельно находить высококачественный контент с помощью резюме, цитат, четких ссылок и указания авторства. Мы работали с партнерами над повышением точности встроенных цитат и отражением предпочтений издателей. Сюда также входит возможность включить их отображение в поиске, управляя OAI-SearchBot в вашем файле robots.txt. Мы продолжим улучшать результаты поиска».
Хотя компания работает над повышением точности цитирования, OpenAI заявляет, что трудно решить некоторые проблемы неправильной атрибуции.
OpenAI продолжает стремиться улучшить свой поисковый продукт.
Заглядывая в будущее
Если OpenAI хочет работать с новостной индустрией, ей следует обеспечить правильное представление контента издателей в поиске ChatGPT.
Издатели в настоящее время имеют ограниченные полномочия и внимательно следят за судебными делами против OpenAI. Результаты могут повлиять на права использования контента и дать издателям больше контроля.
Поскольку продукты генеративного поиска, такие как ChatGPT, меняют способ взаимодействия людей с новостями, OpenAI должна продемонстрировать приверженность ответственной журналистике, чтобы завоевать доверие пользователей.
Рекомендованное изображение: Роберт Уэй/Shutterstock