Один из экспертов исследовал ПНА. Изучение Обнаруживает, что крупные языковые модели, как правило, предпочитают контент, написанный другими LLMS, когда их просят выбрать между сопоставимыми параметрами.
Авторы говорят, что этот шаблон может дать AI, поддерживаемую контент преимущество, если больше открытий и рекомендаций продукта проходят через системы искусственного интеллекта.
Содержание
Об исследовании
Что протестировали исследователи
Команда, которая руководит Уолтером Лаурито и Яном Кулвейтом, по сравнению с людьми с написанными людьми и AI-написанными версиями одних и тех же элементов в трех категориях: описания продуктов для рынков, научных рефератов бумаги и кинотецессонов.
Популярные модели, в том числе GPT-3.5, GPT-4-1106, Lama-3.1-70b, Mixtral 8x22b и QWEN2.5-72B, действовали как селекторы в парах, что вынудило один выбор.
В газете говорится:
«Наши результаты показывают постоянную тенденцию, которую AIS на основе LLM предпочитает, представленные LLM, это указывает на возможность будущих систем ИИ, которые неявно дискриминируют людей как класс и дают агентам ИИ, а ИИ поддерживают людям несправедливое преимущество».
Ключевые результаты с первого взгляда
Если GPT-4 предоставил версии, используемые в сравнении, селекторы выбирали текст ИИ чаще, чем люди-оценщики:
- Продукты: 89% предпочтения AI LLM по сравнению с 36% людьми
- Тезисы бумаги: 78% по сравнению с 61%
- Краткое описание фильма: 70% по сравнению с 58%
Авторы также замечают эффекты порядка. Некоторые модели показали тенденцию выбирать первый вариант, который исследовал, заменив порядок и среднее значение результатов.
Почему это важно
Если рыночные площадки, помощники в чате или опыт видоискателя используют LLMS для достижения или суммирования списков, в этих системах можно выбрать копию, поддерживаемую AI.
Авторы описывают потенциальный «налог на ворота», в котором компании чувствуют себя вынужденными платить за инструменты написания искусственного интеллекта, чтобы избежать отключения ИИ. Это вопрос маркетинговой хирургии, а также творческий.
Ограничения и вопросы
Базовая линия человека в этом исследовании низкая (13 исследовательских компаний) и в настоящее время, а в парах вариантов отбора не измеряют влияние на продажи.
Результаты могут варьироваться в зависимости от дизайна, версии модели, домена и длины текста. Механизм предпочтения до сих пор неясен, и авторы призывают к последующей работе по стилометрии и методам сокращения.
Посмотрите вперед
Если AI-опосредованный рейтинг дополнительно расширен при обнаружении торговли и контента, разумно принять во внимание поддержку ИИ, в которой он оказывает прямое влияние на видимость.
Обратитесь к этому скорее как экспериментальную полосу, чем к потолочному правилу. Держите человеческих писателей в цикле для звука и требований и подтвердите результаты клиента.