По данным исследования, инструменты искусственного интеллекта создают разные списки рекомендаций по брендам почти каждый раз, когда они отвечают на один и тот же вопрос. новый отчет от SparkToro.

Данные показали вероятность <1 из 100, что ChatGPT или ИИ Google в поиске (обзоры ИИ/режим ИИ) вернут один и тот же список брендов при повторных запусках одного и того же запроса.

Рэнд Фишкин, соучредитель SparkToro, провел исследование вместе с Патриком О’Доннеллом из Gumshoe.ai, стартапа по отслеживанию искусственного интеллекта. За ноябрь и декабрь команда запустила 2961 запрос в обзорах AI ChatGPT, Claude и Google Search (с использованием режима AI, когда обзоры не появлялись), используя сотни добровольцев.

Что нашли данные

Авторы протестировали 12 запросов с запросом рекомендаций по брендам в разных категориях, включая поварские ножи, наушники, онкологические больницы, консультантов по цифровому маркетингу и научно-фантастические романы.

Каждое приглашение запускалось 60–100 раз на каждой платформе. Почти каждый ответ был уникален по трем параметрам: список представленных брендов, порядок рекомендаций и количество возвращенных товаров.

Фишкин резюмировал основные выводы:

«Если вы сто раз запросите у инструмента искусственного интеллекта рекомендации по бренду/продукту, почти каждый ответ будет уникальным».

Клод продемонстрировал несколько более высокую последовательность в составлении одного и того же списка дважды, но с меньшей вероятностью выдал один и тот же порядок. Ни одна из платформ не приблизилась к определению надежной повторяемости, заданному авторами.

Проблема быстрой изменчивости

Авторы также исследовали, как пишут подсказки реальные пользователи. Когда 142 участникам было предложено написать свои собственные подсказки о наушниках для путешествующего члена семьи, почти ни одна подсказка не выглядела одинаково.

ЧИТАТЬ  Microsoft Advertising / Bing Ad Выручка выросла на 21%

Показатель семантического сходства этих написанных человеком подсказок составил 0,081. Фишкин сравнил отношения с:

«Курица Кунг Пао и арахисовое масло».

Подсказки разделяли основную цель, но не более того.

Несмотря на быстрое разнообразие, инструменты искусственного интеллекта вернули бренды из относительно последовательного набора критериев. Bose, Sony, Sennheiser и Apple фигурировали в 55–77% из 994 ответов на различные запросы о наушниках.

Что это означает для отслеживания видимости с помощью ИИ

Результаты ставят под сомнение ценность «рейтинговой позиции ИИ» как показателя. Фишкин писал: «Любой инструмент, который дает «рейтинговую позицию в сфере ИИ», — это полная чушь».

Однако данные показывают, что частота появления бренда во многих похожих подсказках более постоянна. В таких узких категориях, как поставщики облачных вычислений, в большинстве ответов фигурировали ведущие бренды. В более широких категориях, таких как научно-фантастические романы, результаты были более разрозненными.

Это согласуется с другими отчетами, которые мы рассмотрели. В декабре Ahrefs опубликовал данные, показывающие, что Google’s AI Mode и AI Reviews ссылаются на разные источники в 87% случаев по одному и тому же запросу. Этот отчет был посвящен другому вопросу: та же платформа, но с разными функциями. Эти данные SparkToro исследуют одну и ту же платформу и приглашение, но с разными запусками.

Картина этих исследований указывает в одном и том же направлении. Рекомендации ИИ, похоже, различаются на каждом уровне, независимо от того, сравниваете ли вы разные платформы, функции внутри платформы или повторяющиеся запросы к одной и той же функции.

Методические примечания

Исследование проводилось в партнерстве с компанией Gumshoe.ai, которая продает инструменты отслеживания ИИ. Фишкин рассказал об этом и отметил, что его исходная гипотеза заключалась в том, что отслеживание ИИ окажется «бессмысленным».

ЧИТАТЬ  Google не показывает сайты, на которых появилось полезное обновление контента, в обзорах ИИ

Команда опубликовала полную методологию и исходные данные на общедоступном мини-сайте. Респонденты опроса использовали свои обычные настройки инструментов ИИ без стандартизации, что, по словам авторов, было сделано намеренно, чтобы уловить вариации в реальном мире.

Отчет не является рецензируемым академическим исследованием. Фишкин признал методологические ограничения и призвал к более масштабной последующей работе.

Заглядывая в будущее

Авторы оставили открытыми вопросы о том, сколько запусков подсказок необходимо для получения надежных данных о видимости и дают ли вызовы API те же вариации, что и подсказки, заданные вручную.

Результаты показывают, что при оценке инструментов отслеживания ИИ вам следует попросить поставщиков продемонстрировать их методологию. Фишкин писал:

«Прежде чем тратить ни копейки на отслеживание видимости ИИ, убедитесь, что ваш провайдер отвечает на вопросы, которые мы здесь затронули, и показывает свои математические расчеты».


Рекомендованное изображение: NOMONARTS/Shutterstock



Source link