Отредактированное показания инженера Google’s Engenmer, опубликованное в Интернете Министерством юстиции США, предлагает заглядывание внутри систем ранжирования Google, предлагая идею о оценках качества Google и представляет собой таинственный сигнал популярности, который использует данные Chrome.

Документ предлагает высокий уровень и очень общий взгляд на рейтинг сигналов, давая представление о том, что делают алгоритмы, но не специфики.

Ручные сигналы

Например, он начинается с раздела о «ручной крафте» сигналов, в котором описывается общий процесс получения данных из оценщиков качества, кликов и т. Д. И применение математических и статистических формул для получения оценки ранжирования из трех видов сигналов. Ручная обработка средств масштабированных алгоритмов, которые настроены поисковыми инженерами. Это не значит, что они вручную ранжируют сайты.

Google ABC сигналы

В документе Министерства юстиции перечислены три вида сигналов, которые называются сигналами ABC и соответствуют следующему:

  • A — якоря (страницы, связанные с целевыми страницами),
  • B — Body (Условия запроса поиска в документе),
  • C — Нажмите (пользовательское время пребывания перед возвращением к SERP)

Заявление о сигналах ABC является обобщением одной части процесса ранжирования. Результаты результатов поиска гораздо более сложны и включают в себя сотни, если не тысячи дополнительных алгоритмов на каждом этапе процесса ранжирования, от индексации, анализа ссылок, анти-спамальных процессов, персонализации, повторного рейтинга и других процессов. Например, Лиз Рейд обсуждала системы базовой тематической тематики как часть алгоритма ранжирования, и Мартин Сплтт обсуждала аннотации как часть понимания веб -страниц.

Это то, что в документе говорится о сигналах ABC:

«Сигналы ABC являются ключевыми компонентами актуальности (или базовой оценки), что является определением Google о том, как документ имеет отношение к запросу.

T* (Актуальность) эффективно объединяет (по крайней мере) эти три сигнала относительно ручной обработкой. Google использует для оценки актуальности документа на основе терминов запроса ».

Документ предлагает представление о сложности ранжирования веб -страниц:

«Рейтинг разработки (особенно актуальность) включает решение многих сложных математических проблем. Для актуальности может быть команда инженеров, постоянно работающих над этими трудными проблемами в рамках данного проекта.

Причина, по которой подавляющее большинство сигналов создано вручную, заключается в том, что, если что-то сломает, Google знает, что исправить. Google хочет, чтобы их сигналы были полностью прозрачными, чтобы они могли снять их и улучшить их ».

Документ сравнивает их подход с ручным созданием с автоматическим подходом Microsoft, говоря, что, когда что-то ломается в Bing, гораздо сложнее устранить устранение неполадок, чем с подходом Google.

ЧИТАТЬ  Преимущества квалифицированных деловых телефонных звонков - C mon web

Взаимодействие между качеством страницы и актуальностью

Интересным моментом, выявленным поисковым инженером, качество страницы не зависит от запроса. Если страница определяется как высокое качество, заслуживает доверия, она считается надежным во всех связанных запросах, что подразумевается под статичным словом, оно не динамически пересчитано для каждого запроса. Тем не менее, в запросе есть сигналы, связанные с релевантностью, которые можно использовать для расчета окончательного рейтинга, что показывает, как актуальность играет решающую роль в определении того, что получает ранжирование.

Это то, что они сказали:

«Качество
Обычно статично по нескольким запросам и не связаны с определенным запросом.

Однако в некоторых случаях сигнал качества включает информацию из запроса в дополнение к статическому сигналу. Например, сайт может иметь высокое качество, но общая информация, поэтому запрос, интерпретированный как поиск очень узкой/технической информации, может использоваться для направления на более технический сайт качества, который является более техническим.

Q* (качество страницы (то есть понятие достоверности)) невероятно важно. Если конкуренты видят журналы, то у них есть понятие «авторитет» для данного сайта.

Оценка качества чрезвычайно важен даже сегодня. Качество страницы — это то, на что люди жалуются больше всего… »

ИИ дает причину жалобы на Google

Инженер заявляет, что люди жалуются на качество, но также говорит, что ИИ усугубляет ситуацию, усугубляя ее.

Он говорит о качестве страницы:

«В настоящее время люди все еще жалуются на качество, и ИИ усугубляет его.

Это было и продолжает оставаться большой работой, но могло быть легко обработанным, потому что Q в значительной степени статичен и в значительной степени связан с сайтом, а не с запросом ».

Edeeprank — способ понять рейтинги LLM

Гуглер перечисляет другие сигналы ранжирования, в том числе один, называемый Edeeprank, которая представляет собой систему на основе LLM, которая использует Bert, которая является моделью, связанной с языком.

ЧИТАТЬ  Теории о том, почему инструменты отслеживания Google показывают спокойную волатильность и погоду

Он объясняет:

«Edeeprank-это система LLM, которая использует Bert, Transformers. По сути, Edeeprank пытается взять сигналы на основе LLM и разложить их на компоненты, чтобы сделать их более прозрачными».

Эта часть о разложении сигналов LLM на компоненты, по-видимому, является ссылкой на то, чтобы сделать сигналы ранжирования на основе LLM более прозрачными, чтобы поисковые инженеры могли понять, почему LLM что-то ранжирует.

PageRank связан с алгоритмами ранжирования дистанции

PageRank — это оригинальные инновации Google, и с тех пор он был обновлен. Я написал об этом алгоритме шесть лет назад. Алгоритмы расстояния ссылки рассчитывают расстояние от авторитетных веб -сайтов для данной темы (называемой начальными сайтами) до других веб -сайтов в той же теме. Эти алгоритмы начинаются с набора семян авторитетных участков в данной теме, и сайты, которые находятся дальше от их соответствующего места семян, считаются менее заслуживающими доверия. Сайты, которые ближе к наборам семян, более вероятно, что являются более авторитетными и заслуживающими доверия.

Это то, что Гуглер сказал о PageRank:

«PageRank. Это единственный сигнал, относящийся к расстоянию от известного хорошего источника, и он используется в качестве входного показателя для оценки качества».

Читайте об этом виде алгоритма ранжирования ссылок: Алгоритмы ранжирования на расстоянии ссылки

Сигнал популярности на основе хромирования

Есть еще один сигнал, имя которого отредактировано, связанное с популярностью.

Вот загадочное описание:

«[redacted] (популярность) Сигнал, который использует хромированные данные ».

Возможна правдоподобная утверждение, что это подтверждает, что утечка API Chrome — это фактические факторы ранжирования. Тем не менее, многие SEO, включая меня, считают, что эти API являются инструментами для разработчиков, используемых Chrome, чтобы показать метрики производительности, такие как основные веб-жизненные возможности в интерфейсе Chrome Dev Tools.

ЧИТАТЬ  Поиск Google обнаруживает новые зарегистрированные домены для индексации

Я подозреваю, что это ссылка на сигнал популярности, о котором мы могли бы не знать.

Инженер Google относится к другой утечке документов, которые ссылаются на фактические «компоненты системы ранжирования Google», но у них недостаточно информации для обратной машины алгоритм.

Они объясняют:

«Была утечка документов Google, которые назвали определенные компоненты системы ранжирования Google, но документы не входят в специфику кривых и порогов.

Например
Одни только документы не дают вам достаточно деталей, чтобы выяснить это, но данные, вероятно, делают ».

Еда на вынос

В недавно выпущенном документе обобщены показатели Министерства юстиции США инженера Google, который предлагает общий план систем рейтинга Google. В нем обсуждается дизайн сигнала, созданный вручную, роль статических показателей качества страницы и таинственный сигнал популярности, полученный из данных хрома.

Он дает редкий взгляд на то, как спроектированы такие сигналы, как актуальность, достоверность, поведение кликов и прозрачность на основе LLM, и предлагает другой взгляд на то, как Google занимает веб-сайты.

Избранное изображение от Shutterstock/fran_kie



Source link