В соответствии с решением Google Monopoly Meredies с на днях у нас есть больше документов из суда, упомянувших больше о использовании пользовательских взаимодействий, пользовательских данных, данных Chrome и других.
Это все в дополнение ко всем документам Министерства юстиции, которые мы рассмотрели ранее, и эту большую утечку поиска, на которую Google в конечном итоге ответил. Вчера мы также рассмотрели бит Google Fastsearch на заземлении для Близнецов. Кроме того, ранее сегодня по индексу поиска Google, Spam Spare, PageRank, качеством страницы, клей и многое другое.
Большинство из них были замечены Мари Хейнс, но я выкопал, может быть, немного глубже, чтобы вытащить больше ссылок, которые я нашел.
Следует отметить, что только потому, что эти судебные документы имеют эти заявления, это не означает, что они используются в поиске Google сегодня, и эти заявления также были даны небуглерами:
Пользовательские данные
Упоминает «Пользовательские данные» в правящем pdf:
Пользовательские данные определяют, какие веб -сайты Google Crawls и как часто. pic.twitter.com/y7wudsrkqi
— Мари Хейнс (@marie_haynes) 3 сентября 2025 года
Вот больше упоминаний:
Страница 87:
Google использует пользовательские данные »[a]T на каждом этапе процесса поиска », от ползания и индексации до поиска и ранжирования. Пользовательские данные дополнительно помогают Google понять, какие рекламы привлекают внимание пользователей, позволяя ему лучше оценить качество рекламы и обслуживать более релевантные объявления в будущем. (обнаружение того, что данные пользователей« помогают адаптировать рекламу, которые поставляет Google к [them]”). Эти улучшения в качестве поиска и монетизации AD в конечном итоге приводят к более высоким доходам, поскольку превосходные результаты поиска привлекают дополнительных пользователей, а более целевые рекламы генерируют больше кликов.
Страница 87-88:
(1) Больше пользовательских данных позволяет GSE улучшить качество поиска, (2) лучшее качество поиска привлекает больше пользователей и улучшает монетизацию, (3) больше пользователей и лучшая монетизация привлекает больше рекламодателей, (4) больше рекламодателей означают более высокие доходы от рекламы, а (5) больше доходов от рекламы позволяет GSE для расходов на большее количество ресурсов на затраты на предоставление дорожного движения (IE, доходы) и инвестиции, которые можно обеспечить, что можно приобрести.
Страница 93-94:
Google включает пользовательские данные на каждом этапе процесса поиска. Как ясно показало результаты ответственности суда, обширная коллекция пользовательских данных Google не собрала общеизвестную пыль на серверах Google за последнее десятилетие. Прямо наоборот — Google постоянно развертывает пользовательские данные для, среди прочего, определить, какие веб -сайты ползти, в каком порядке и на какой частоте; построить и организовать свой индекс поиска, чтобы гарантировать, что он охватывает широкий спектр предметных веществ и источников (и, следовательно, разнообразных запросов); Улучшить «свежесть» результатов (то есть поднять их в курсе); создавать сигналы и модели, которые оценивают актуальность результатов и устанавливают их рейтинг; и запустите эксперименты с большими форматами для разработки новых функций. Google, (замечая, что запросы, выпущенные на мобильных устройствах, имеют тенденцию иметь «больше ориентированных на местоположение намерения», чем те, которые выпускаются на настольных устройствах, и, следовательно, «один из сигналов, который входит в поиск Google. («Google продолжает поддерживать значительные объемы данных — несмотря на расходы на их хранение — потому что его стоимость перевешивает эту стоимость».). По словам одной презентации Google: «Поиск может выглядеть как магия … но на самом деле речь идет о создании сигналов … для определения намерения пользователя и сопоставить его с соответствующими документами». Поскольку знания, полученные из данных пользователей, предоставляют «сильный прокси для намерений пользователей», такие данные поставляют «критический ввод» для GSE, включая Google.
Страница 129:
Google использует этот дополнительный объем запроса. Это «развернуть[ed] Пользовательские данные, среди прочего, заполните дополнительные веб-сайты, расширяйте индекс, переоценивают SERP и улучшили «свежесть» результатов (то есть, поднимайте их в актуальность) ».
Страница 150:
График знаний, однако, не является непосредственно полученным из пользовательских данных. Его основные данные поступают из -за переводов данных и трубопроводов, в том числе от третьих лиц.
Стр. 152:
Проще говоря, данные на стороне пользователя-это данные, которые Google собирает из спаривания пользовательского запроса и возвращаемого ответа. Его также можно рассматривать как данные о взаимодействии с пользователем или данные «клик и запрос». Примеры таких данных включают в себя веб -ссылку или вертикальную информацию, на которую нажимает пользователь, как долго пользователь колеблется по ссылке, и нажимает ли пользователь пользователь с веб -страницы и как быстро. Данные пользователя введите сырье, которое Google использует для улучшения служб поиска. («На каждом этапе процесса поиска пользовательские данные — это критический ввод, который напрямую улучшается [search] качество ».») (описывает «кормление в кликах и других вещах» в алгоритмы для улучшения результатов поиска).
Стр. 157:
Напомним, что Google обучает Navboost на 13 месяцев пользовательских данных, что является эквивалентом более 17 лет данных, полученных Bing. (Объяснение, что обучение за 13 месяцев пользовательских данных означает «запросы и клики», собранные от «всех пользователей» по всему миру); UPX0005 на -811 («Кеш -клей (13 месяцев)»).
Пользовательские взаимодействия
Упоминает «взаимодействие с пользователем» в правящем pdf:
Google говорит, что ключом к их улучшению является изучение того, с чем взаимодействуют пользователи.
«Обучение от этой отзывы пользователя, возможно, является центральным способом, которым веб -рейтинг улучшился в течение 15 лет».
«Каждый [user] Взаимодействие приводит нам еще один пример, еще один кусочек учебных данных: для… pic.twitter.com/hq1cstlpeh
— Мари Хейнс (@marie_haynes) 3 сентября 2025 года
Стр. 157:
Обмен набором данных, лежащий в основе статистических моделей клея, с другой стороны, представляет более сильный случай для включения в окончательное решение. Опять же, рассматриваемые данные-это в значительной степени необработанные данные пользователя, которые связывают запросы и результаты с взаимодействием с пользователями, такими как клики, паряки и другие аспекты пути пользователя на SERP и обратно. Это хлеб и масло преимущества масштаба Google.
Хромированные данные
Упоминает «хромированные данные» в правящем pdf:
В документе очень мало о том, как именно хромированные данные используются для ранжирования.
«Два экспоната предполагают, что популярность основана на« данных посещения хрома »и« количестве якорей »».
Это предложение прямо там можно обсудить в течение нескольких часов. 🤔 pic.twitter.com/s2rsa9hqfg
— Мари Хейнс (@marie_haynes) 3 сентября 2025 года
Стр. 143 -144:
Два экспоната предполагают, что популярность основана на «данных посещения хрома» и «количестве якорей», которое является мерой, которая количественно определяет количество связей между страницами и используется для содействия хорошо связанным документам. (Сигнал популярности (P*) «использует хромированные данные»). Первый, по-видимому, является типом данных о взаимодействии с пользователем, хотя и от посещений Chrome, а не через ключевые каналы распределения по умолчанию, но суд не может сказать больше, поскольку истцы не дали никаких показаний по этому вопросу. Суд не заставит обмен данными на основе неопределенной записи.
Что вы берете от них?
Обсуждение на форуме в ХПолем