DOJ v. Google-Дело № 20-CV-3010 (мнение о поправке)

Судебный документ показывает, что оценки от оценщиков качества человека являются Прямой и основополагающий вклад Для обучения основных моделей ранжирования Google.

Ключевые выводы

  • Оценки оценки качества человека являются прямым обучением Для основных моделей ранжирования Google (Rankembed, Rankembedbert).

  • Эти оценки есть основополагающие данныене периферийные обратную связь, в сочетании с запросом и нажимайте журналы.

  • Судебные показания показывают модели, обученные оценщиком Улучшенная производительность Google по запросам длинного хвостаПолем

  • Этот противоречит давней публичной позиции Google Эти оценки Rater служат только косвенными критериями.

Роль оценщиков качества человека

Министерство юстиции против Google ясно дает понять, что Оценщиры качества человека — не только внешние оценщики — Их суждения напрямую формируют самую основу систем ранжирования Google. Мнение показывает, что модели Ранкинга и Ранкембедберта, которые являются центральными в рейтинге Google на основе ИИ, обучаются Два основных источника данных: журналы поиска и оценки человеческого рейтингаПолем Это повышает вклад оценщиков от «руководства» до Данные прямого обученияПолем

Свидетельство вице-президента Google по поиску, доктору Панду Наяк, еще больше подчеркивает их влияние: модели с рейтингом, которые значительно Улучшенная способность Google обрабатывать сложные, длинные запросыгде языковое понимание важно.

Суд подчеркнул, что эти оценки образуют основополагающий набор данных В сочетании с журналами взаимодействия пользователя. Трубопровод данных для моделей Ранкембля явно полагается на Оценка веб -страниц оценщикамивнедряя свои суждения в системы машинного обучения, которые решают, как ранжируются миллиарды страниц.

ЧИТАТЬ  20-летнее ожидание Homeworld 3 почти подошло к концу

Это противоречит общественным коммуникациям Google, которые давно утверждают, что оценки Rater не влияют напрямую. Хотя технически верно на индивидуальном уровне страницы, мнение показывает, что в совокупности оценки оценки системные учебные входные данные Это определяет, как поисковая система учится ранжировать. Модели, построенные из этих данных, имеют »непосредственно внес свой вклад в качество Google над конкурентами”Подчеркивает, насколько центральный рейтер вводится для эволюции поиска Google.

Прямые данные обучения для ранжирования моделей

В документе явно указывается, что оценки оценщиков человека являются одним из двух первичных источников данных, используемых для обучения моделей ранки и Ранкабедберта. Они описаны как сложные системы, основанные на искусственном интеллекте, критические для качества поиска Google:

«Rankembed и его более поздняя итерационная щитка ранжируют модели, которые полагаются на два основных источника данных: % от 70 дней журналов поиска плюс баллы, генерируемые оценщиками человека и используемые Google для измерения качества органических результатов поиска.
Посмотреть в PDF

Повышение производительности по сложным вопросам

Влияние этих моделей, обученных оценщиком, является значительным, особенно в улучшении способности Google обрабатывать сложные и менее распространенные поиски. Свидетельство от вице -президента Google по поиску подтверждает:

«Ракембедберт снова стал одной из тех очень сильных вещей, и это особенно помогло с запросами длинных хвостов, где понимание языка гораздо важнее.
Посмотреть в PDF

Предоставление основополагающих данных для машинного обучения

В документе разъясняется, что оценки Rater — это не просто случайная обратная связь, но и Фундаментальный набор данных Для этих систем ИИ:

«Данные, лежащие в основе моделей, представляют собой комбинацию данных кликов и зачисления и оценки веб-страниц людьми.
Посмотреть в PDF

Это устанавливает человеческие суждения как Основной компонент используется для обучения моделей, как ранжировать результаты поиска.

ЧИТАТЬ  Как узнать, говорит ли человек правду: 13 главных признаков

Отклонение от прошлых заявлений Google

Вывод о том, что оценки Rater являются прямым обучением для модели основного ранжирования, такой как Rankembed Clasties и, возможно, Arding, возможно, отклоняется от духа давних публичных заявлений GoogleПолем

Общественная позиция Google

В течение многих лет Google последовательно заявлял, что оценки качественных показателей не влияют на рейтинг какого -либо отдельного веб -сайта. Официальное руководство компании описывает роль оценщиков как предоставление обратной связи, чтобы помочь «сравнить качество наших результатов» и «оценить изменения». Это часто интерпретировалось как означать, что их влияние косвенный — больше похожа на обратную связь, которая помогает инженерам настроить систему в целом, а не прямой сигнал ранжирования.

Отклонение выявлено в суде

Судебный документ разъясняет, что это влияние гораздо более прямой и системный чем ранее понятно. В то время как счет одного рейтера может не перемещать страницу вверх или вниз, Агрегированные оценки являются основополагающим набором данных используется для создания и обучения автоматизированной системы ранжирования, которая является основной частью алгоритма:

«Модели, обучаемые в рамках, обученные данным, непосредственно внесли свой вклад в качество компании по сравнению с конкурентами.
Посмотреть в PDF

По сути, заявления Google технически верны в том смысле, что ни один оценщик с оценкой непосредственно меняет рейтинг сайта. Но выводы суда показывают Прямая, системная ссылка где коллективное суждение оценщиков используется для обучения основных моделей ранжирования ИИ.

Эта роль гораздо более влиятельна, чем роль «обратной связи» или «сравнительного анализа», исторически подчеркнув.



Source link