Сообщение в LinkedIn поставило под сомнение идею о том, что структурированные данные Schema.org влияют на то, что выдает большая языковая модель. Очевидно, есть некоторые оптимизаторы, которые рекомендуют структурированные данные для лучшего ранжирования в поисковых системах с искусственным интеллектом.
Патрик Стокс написал в LinkedIn следующий пост:
«Я что-то пропустил? Почему оптимизаторы считают, что разметка схемы повлияет на результаты LLM?»
Патрик сказал «выход LLM» в контексте рекомендации по SEO, поэтому вполне вероятно, что это ссылка на поиск ChatGPT и другие поисковые системы AI. Получают ли поисковые системы ИИ свои данные из структурированных данных?
LLM обучаются на веб-текстах, книгах, правительственных отчетах, юридических документах и других текстовых данных (а также на других носителях), которые затем используются для создания резюме и ответов, но без плагиата учебных данных. Это означает, что бессмысленно думать, что оптимизация вашего веб-контента приведет к тому, что LLM сама будет отправлять рефералов на этот веб-сайт.
Поисковые системы искусственного интеллекта основаны на поисковых индексах (и графах знаний) посредством поисковой дополненной генерации (RAG). Сами индексы поисковых систем создаются на основе сканированных данных, а не структурированных данных Schema.
Например, Perplexity AI ранжирует просканированный веб-контент, используя модифицированную версию PageRank в своем поисковом индексе. Google и Bing сканируют текстовые данные и выполняют такие действия, как удаление дублированного контента, удаление стоп-слов и другие манипуляции с текстом, извлеченным из HTML, плюс не на каждой странице есть структурированные данные.
Фактически, Google использует только часть доступных структурированных данных Schema.org для определенных видов поиска и расширенных результатов, что, в свою очередь, ограничивает тип структурированных данных, которые используют издатели.
Кроме того, сканеры Bing и Google обрабатывают HTML, идентифицируют верхние и нижние колонтитулы и основной контент (из которого они извлекают текст для целей ранжирования). Зачем им это делать, если они собираются полагаться на структурированные данные Schema, верно?
Идея о том, что полезно использовать структурированные данные Schema.org для повышения рейтинга в поисковой системе ИИ, не основана на фактах, это всего лишь причудливые предположения. Или это может быть эффект «телефонной игры», когда один человек говорит что-то, а затем двадцать человек спустя это трансформируется во что-то совершенно другое.
Например, Джоно Олдерсон предположил, что структурированные данные могут стать стандартом, который поисковые системы ИИ могли бы использовать для лучшего понимания Интернета. Он не говорил, что поисковые системы ИИ в настоящее время используют его, он просто предлагал, чтобы поисковые системы ИИ рассмотрели возможность его принятия, и, возможно, этот пост превратился в полномасштабную теорию двадцать оптимизаторов поисковой оптимизации спустя двадцать лет.
К сожалению, в кругах SEO циркулирует множество необоснованных идей. На днях я увидел в социальных сетях заявление SEO о том, что локальный поиск Google не использует IP-адреса в ответ на поисковые запросы «рядом со мной». Все, что нужно было сделать, чтобы проверить эту идею, — это войти в VPN, выбрать географическое местоположение для своего IP-адреса и выполнить поисковый запрос «рядом со мной», и они увидят, что IP-адрес, используемый VPN, повлиял на «рядом со мной». » результаты поиска.
Снимок экрана запроса рядом со мной, зависящего от IP-адреса
Гугл даже публикует страницу поддержки там говорится, что они используют IP-адрес для персонализации результатов поиска, но есть люди, которые считают иначе, потому что некоторые SEO-специалисты провели корреляционное исследование, и когда нас спрашивают, мы возвращаемся к тому, что кто-то кричит, что Google лжет.
Поверите ли вы своим лживым глазам?
Структурированные данные Schema.Org и результаты поиска AI
«SEO-специалисты», рекомендующие издателям использовать структурированные данные Schema.org для данных обучения LLM, также не имеют смысла, поскольку данные обучения не цитируются в результатах LLM, а только для результатов, полученных из Интернета, которые сами по себе получены из поискового индекса, который от гусеницы. Как упоминалось ранее, издатели используют лишь часть доступных структурированных данных Schema.org, поскольку сам Google использует лишь небольшую их часть. Поэтому поисковой системе искусственного интеллекта нет смысла полагаться на структурированные данные для получения результатов.
Эксперт по поисковому маркетингу Кристофер Шин (англ.Профиль в LinkedInд) прокомментировал:
«Думаю то же самое после прочтения твоего поста, Патрик. Вот как я это интерпретирую на данный момент. Я думал, что LLM обычно генерируют ответы не из результатов поиска поисковых систем, а скорее из интерпретации данных. Верно? Но разметка данных схемы будет использоваться SER для отображения расширенных фрагментов и т. д., нет? Я думаю, что ключевой нюанс схемы и LLM заключается в том, что поисковые системы используют схему для результатов поиска, тогда как LLM использует интерпретацию данных, когда дело доходит до того, как схема влияет на LLM».
Такие люди, как Кристофер Шин и Патрик Стокс, вселяют в меня надежду, что прагматичное и разумное SEO все еще борется за то, чтобы преодолеть этот шум, и сообщение Патрика в LinkedIn является тому подтверждением.
Прагматичное SEO
Прагматичность — это делать что-то по разумным и реалистичным причинам, а не на мнениях, основанных на неполной информации и предположениях.
Говоря как человек, который занимается SEO практически с самого его зарождения, отсутствие продумывания вещей — вот почему оптимизаторы и издатели традиционно тратят время на нечетко определенные проблемы, крутят колеса на бесполезных действиях, таких как поверхностные сигналы EEAT и так далее и тому подобное. . Действительно удручающе указывать на документацию и официальные заявления и получать ответные заявления типа «Google лжет». Такое отношение заставляет человека «хотеть кричать».
Немного более прагматичного SEO, пожалуйста.