С учетом средств монополии Google в решении на днях у нас есть еще больше документов суда, упомянув больше об индексе поиска Google, Spam Score, The Pageank, качество страницы, клея и многого другого.
Все это добавлено ко всем документам Министерства юстиции, которые мы рассмотрели ранее и к этой утечке исследования, на которую Google в конечном итоге ответил. Вчера мы также рассмотрели бит Google Fastsearch на земле Близнецов, а также взаимодействия и данные современных пользователей.
Большинство из них были замечены Мари Хейнс, но я, возможно, копался немного глубже, чтобы снять больше ссылок, чем я обнаружил.
Я должен отметить, что, просто потому, что эти судебные документы имеют эти заявления, это не означает, что они используются в Google Research сегодня и что эти заявления также были даны не гербельщиками:
Содержание
Индекс поиска Google
Что хранится в индексе поиска Google? Идентификатор документа, карта URL, Homadatting, Spam Scores и т. Д.:
Супер интересная информация здесь о том, что хранится в индексе поиска Google.
— У каждого документа есть Disy
— В URL есть карта DOCIDE
— Каждый документ имеет набор сигналов, атрибутов или метаданных, определенные производные пользовательских данныхК ним относятся:
— Популярность, измеренная пользователем … pic.twitter.com/mlabmdu8r3— Мари Хейнс (@marie_haynes) 3 сентября 2025 года
Качество страниц спама против страницы
Google определяет, что сканировать не только на оценке спама, но и сигналы качества и популярности:
Ты не ползаешь? Это может быть связано с вашей оценкой спама.
Сигналы качества и популярности помогают Google определить частоту для ползания веб -страниц. pic.twitter.com/fn8wfgbvd
— Мари Хейнс (@marie_haynes) 3 сентября 2025 года
PageRank против веб -страницы
PageRank — это ключевой сигнал качества, который является компонентом оценки качества, но «большая часть качественного сигнала Google получена из самой веб -страницы».
Теперь это интересно!
PageRank — это ключевой сигнал качества, который является компонентом оценки качества.
Тем не менее, оказывается, что «большая часть качественного сигнала Google получена из самой веб -страницы». pic.twitter.com/3w6cbnix8c
— Мари Хейнс (@marie_haynes) 3 сентября 2025 года
Клей
Приклеивайте запрос и данные пользователя, чтобы помочь с сигналами и классификацией:
Glue — это журнал запросов, который собирает данные по запросу и взаимодействие пользователя с ответом.
Данные включают:
— Текст запроса, языка, местоположения пользователя и типа устройства
— Что появляется на SERP
— на котором пользователь нажал на посадку и как долго он остался … pic.twitter.com/mns1ptc4vq— Мари Хейнс (@marie_haynes) 3 сентября 2025 года
Классифицирован BE
Google A Rankembed Bert, которая является моделью классификации обучения, которая использует 70 дней исследовательских газет плюс оценки, полученные оценщиками качества человека:
Ооо, тогда это Ранки, теперь называемый Ранкимбед Берт.
Это модель классификации глубокого обучения, которая использует 70 дней исследовательских газет плюс оценки, полученные оценщиками качества человека.
Он имеет сильное понимание естественного языка, которое позволяет ему более эффективно идентифицировать лучшие документы … pic.twitter.com/oxjkkctryr
— Мари Хейнс (@marie_haynes) 3 сентября 2025 года
Что вы нашли в других PDF в суд?
Обсуждение на форуме в ХПолем