Google опубликовал исследовательскую работу о новой модели искусственного интеллекта для обнаружения мошенничества в системе Google Ads, которая представляет собой значительное улучшение по сравнению с моделью, использовавшейся ранее. Что интересно, в исследовательском документе от 31 декабря 2025 года говорится, что используется новый ИИ, что приводит к повышению уровня обнаружения более чем на 40 процентных пунктов и точности 99,8% по определенным политикам.

ALF: Модель большого фонда рекламодателей

Новый ИИ называется ALF (модель большого фонда рекламодателя), подробности о которой были опубликованы 31 декабря 2025 года. ALF — это мультимодальная модель большого фонда, которая анализирует текст, изображения и видео, а также такие факторы, как возраст аккаунта, платежные реквизиты и исторические показатели эффективности.

Исследователи объясняют, что, хотя многие из этих факторов сами по себе не определяют учетную запись как потенциально проблемную, сравнение всех этих факторов позволяет лучше понять поведение и намерения рекламодателя.

Вы пишете:

«Ключевой задачей в этой экосистеме является точное и эффективное понимание намерений и поведения рекламодателей. Это понимание имеет решающее значение для нескольких важных приложений, включая сопоставление пользователей с рекламой и выявление мошенничества и нарушений политики».

Решение этой проблемы требует целостного подхода, который обрабатывает различные типы данных, включая структурированную информацию об учетной записи (например, возраст учетной записи, данные о выставлении счетов), мультимодальные рекламные носители (текст, изображения, видео) и содержимое целевой страницы.

Например, рекламодатель может иметь недавно созданную учетную запись, показывать текстовые и графические объявления известного крупного бренда и уже однажды отклонил платеж по кредитной карте. Хотя каждый элемент может безвредно существовать сам по себе, такое сочетание убедительно свидетельствует о мошеннической операции».

Исследователи решают три проблемы, которые предыдущие системы не смогли решить:

ЧИТАТЬ  Мы запускаем новую систему ИИ для ученых.

1. Гетерогенные и многомерные данные
Гетерогенные данные относятся к тому факту, что данные рекламодателя представлены в нескольких форматах, а не в одном типе. Сюда входят структурированные данные, такие как возраст аккаунта и тип платежа, а также неструктурированные данные, такие как творческие ресурсы, такие как изображения, текст и видео. Многомерные данные относятся к сотням или тысячам точек данных, связанных с каждым рекламодателем, в результате чего математическое представление каждого из них становится многомерным, что создает проблемы для традиционных моделей.

2. Неограниченное количество творческих ресурсов.
Рекламодатели могут иметь тысячи творческих ресурсов, таких как изображения, и скрывать один или два вредоносных ресурса среди тысяч безобидных ресурсов. Этот сценарий сокрушил предыдущую систему.

3. Надежность и достоверность на практике
Система должна быть способна генерировать надежные показатели уверенности в том, что компания имеет злонамеренные намерения, иначе ложное срабатывание может повлиять на невиновного рекламодателя. Следует ожидать, что система будет работать без необходимости постоянной перенастройки для обнаружения ошибок.

Конфиденциальность и безопасность

Хотя ALF анализирует конфиденциальные сигналы, такие как история счетов и данные учетной записи, исследователи подчеркивают, что система разработана с учетом строгих мер защиты данных. Прежде чем ИИ обработает данные, вся личная информация (PII) удаляется. Это гарантирует, что модель идентифицирует риски на основе моделей поведения, а не конфиденциальных личных данных.

Секретный соус: как обнаружить выбросы

Модель также использует метод под названием «Межвыборочное внимание» для улучшения возможностей обнаружения. Вместо того, чтобы анализировать отдельного рекламодателя в вакууме, ALF рассматривает «большие группы рекламодателей», чтобы сравнить их взаимодействие друг с другом. Это позволяет ИИ узнать, как выглядит нормальная активность в экосистеме, и более точно обнаруживать подозрительные выбросы, которые не соответствуют нормальному поведению.

ЧИТАТЬ  Не откладывайте — Prime Day скоро закончится, как и скидка 80 долларов на наш бюджетный проигрыватель Blu-ray 4K.

Alf превосходит производственные показатели

Исследователи объясняют, что их тесты показывают, что ALF превосходит хорошо настроенную производственную базу:

«Наши эксперименты показывают, что ALF значительно превосходит тщательно настроенную производственную базовую линию, при этом показывая хорошие результаты по общедоступным тестам. В производстве ALF обеспечивает значительный и одновременный прирост точности и отзыва, увеличивая отзыв более чем на 40 процентных пунктов по одной важной политике и повышая точность до 99,8% по другой».

Этот результат показывает, что ALF может добиться измеримого прогресса по множеству критериев оценки в реальных производственных условиях, а не только в автономной или эталонной среде.

В другом месте они упоминают компромиссы в скорости:

«Эффективность этого подхода была подтверждена на исключительно сильной производственной базе, которая, в свою очередь, стала результатом обширного поиска по различным архитектурам и гиперпараметрам, включая DNN, ансамбли, GBDT и логистическую регрессию с перекрестным исследованием функций».

Хотя задержка ALF выше из-за большего размера модели, она остается в пределах приемлемого диапазона для нашей производственной среды и может быть дополнительно оптимизирована с помощью аппаратных ускорителей. Эксперименты показывают, что ALF значительно превосходит базовый уровень при выполнении важных задач по обнаружению рисков. Такое увеличение производительности связано с уникальной способностью целостного моделирования встраивания контента, которую с трудом можно было использовать в более простых архитектурах. Этот компромисс оправдан его успешным развертыванием: ALF обрабатывает миллионы запросов каждый день».

Задержка — это время, необходимое системе для выдачи ответа после получения запроса. Данные исследователей показывают, что, хотя ALF увеличивает время отклика по сравнению с базовым уровнем, задержка остается приемлемой для производственного использования и уже работает в масштабе, обеспечивая при этом значительно лучшую производительность обнаружения мошенничества.

ЧИТАТЬ  Google Ads запускает новый инструмент, который поможет маркетологам наладить связь с поколением Z

Улучшенное обнаружение мошенничества

Исследователи говорят, что ALF теперь используется в системе безопасности Google Ads для выявления рекламодателей, нарушающих политику Google Ads. Нет никаких доказательств того, что система используется каким-либо другим образом, например, в поиске или бизнес-профилях Google. Тем не менее, они заявили, что будущая работа может быть сосредоточена на временных факторах («временная динамика») для выявления развивающихся закономерностей. Они также отметили, что это может быть полезно для моделирования аудитории и творческой оптимизации.

Прочтите оригинальную PDF-версию исследовательской работы:

ALF: Модель большого фонда рекламодателей для понимания мультимодальных рекламодателей

Рекомендованное изображение с Shutterstock/Войти

Source