В сообществе много людей говорят, что реализация структурированных данных / схемы на ваших страницах поможет вам с видимостью поиска ИИ. Но немногие действительно проверяли это до сих пор. И эти несколько тестов показывают, что добавление структурированных данных / схемы не помогает с вашей видимостью в поиске искусственного интеллекта, по крайней мере, пока.
Первым, кто проверил это, был Марк Уильямс-Кук, который опубликовал LinkedIn Эксперимент, который он провел, где он опубликовал «визуальное объяснение того, почему ваш любимый LLM не использует схемы в своих основных данных обучения». Он объяснил, как, когда LLMS обрабатывает страницу, она на самом деле «разрушает» разметку схемы и, следовательно, не использует ее.
Он написал:
LLM работают по контенту «токенизированием». Это означает принятие общих последовательностей символов, найденных в тексте и манипулировать уникальным «токеном» для этого набора. Затем LLM принимает миллиарды образцов «окон» наборов этих токенов, чтобы создать прогноз о том, что будет дальше.
Изображение ниже-какая-то пример схема, в которой применяется изменение цвета, которая представляет, что набор символов является уникальным токеном, сделанным моделью GPT-4O.
Вы заметите, что схема «уничтожена». Например, схема «@type»: «организация» разбивается, поэтому существуют отдельные токены для «типа» и «организации», что означает, что с точки зрения токенизации обычные слова «тип» и «организация» не отличается от схемы.
Если схема была включена в эти учебные данные, все, что это сделало бы в реальности, так это сказать, что существует немного (вероятно, незначительная) вероятность токенов, таких как «@ Появление перед словом« содержание ».
Вот его скриншот:
Если это недостаточно для вас, Хулио С. Гевара также проверил это и написал о своем тесте на LinkedIn также. Он сказал: «Мы установили две страницы продукта того же выдуманного продукта, которые и Gemini, и CHATGPT никогда раньше не видели. На одной странице все содержание было видимым в HTML в виде текста + структурированных данных, на другой странице были только структурированные данные, а в остальном ничего не было видимым как текст (визуально пустое)».
Результат не показывает никакой пользы. Он писал: «Мы пробовали различные подсказки извлечения, сотни раз, чтобы увидеть, сможет ли LLMS вернуть информацию, такую как цена, цвета, номера SKU. Сюрприз, сюрприз: это работало только на странице с информацией, видимой в виде текста».
Его тест показывает, что LLMS даже не мог увидеть текст в структурированных данных.
Конечно, все это может измениться в будущем, но вот некоторые ранние тестирование сделано на этом.