Структурированные данные и схема не помогают с видимостью в поиске искусственного интеллекта • Продвижение Web 2.0

В сообществе много людей говорят, что реализация структурированных данных / схемы на ваших страницах поможет вам с видимостью поиска ИИ. Но немногие действительно проверяли это до сих пор. И эти несколько тестов показывают, что добавление структурированных данных / схемы не помогает с вашей видимостью в поиске искусственного интеллекта, по крайней мере, пока.

Первым, кто проверил это, был Марк Уильямс-Кук, который опубликовал LinkedIn Эксперимент, который он провел, где он опубликовал «визуальное объяснение того, почему ваш любимый LLM не использует схемы в своих основных данных обучения». Он объяснил, как, когда LLMS обрабатывает страницу, она на самом деле «разрушает» разметку схемы и, следовательно, не использует ее.

Он написал:

LLM работают по контенту «токенизированием». Это означает принятие общих последовательностей символов, найденных в тексте и манипулировать уникальным «токеном» для этого набора. Затем LLM принимает миллиарды образцов «окон» наборов этих токенов, чтобы создать прогноз о том, что будет дальше.

Изображение ниже-какая-то пример схема, в которой применяется изменение цвета, которая представляет, что набор символов является уникальным токеном, сделанным моделью GPT-4O.

Вы заметите, что схема «уничтожена». Например, схема «@type»: «организация» разбивается, поэтому существуют отдельные токены для «типа» и «организации», что означает, что с точки зрения токенизации обычные слова «тип» и «организация» не отличается от схемы.

Если схема была включена в эти учебные данные, все, что это сделало бы в реальности, так это сказать, что существует немного (вероятно, незначительная) вероятность токенов, таких как «@ Появление перед словом« содержание ».

Вот его скриншот:

Если это недостаточно для вас, Хулио С. Гевара также проверил это и написал о своем тесте на LinkedIn также. Он сказал: «Мы установили две страницы продукта того же выдуманного продукта, которые и Gemini, и CHATGPT никогда раньше не видели. На одной странице все содержание было видимым в HTML в виде текста + структурированных данных, на другой странице были только структурированные данные, а в остальном ничего не было видимым как текст (визуально пустое)».

ЧИТАТЬ Мощность сетевой интеллекта нагрузки

Результат не показывает никакой пользы. Он писал: «Мы пробовали различные подсказки извлечения, сотни раз, чтобы увидеть, сможет ли LLMS вернуть информацию, такую как цена, цвета, номера SKU. Сюрприз, сюрприз: это работало только на странице с информацией, видимой в виде текста».

Его тест показывает, что LLMS даже не мог увидеть текст в структурированных данных.

Конечно, все это может измениться в будущем, но вот некоторые ранние тестирование сделано на этом.

Обсуждение на форуме в Связанный ВПолем

Source link