В конце ноября 2023 года информационный сервис Хабра принял участие в #Reconfa — конференции «Реклама Яндекса». Это не формат для Хабра, но в этот раз на конференции обсуждалось использование ИИ и нейросетей, поэтому я решил сходить посмотреть. Об этом есть отдельная статья. Там мне удалось поймать директора по искусственному интеллекту (ИИ) компании «Яндекс Реклама» Алексея Штоколова. Я задал ему несколько вопросов об искусственном интеллекте и его использовании в рекламе. Разговор плавно перешёл в дискуссию о том, как быть тренером по искусственному интеллекту и возможности автоматизации рутинных задач. Хорошее чтение!
Как давно ИИ используется в рекламе Яндекса?
Нейронные сети и искусственный интеллект используются уже десять лет. Первые разработки, вероятно, были опубликованы в 2014 году. Мы запустили исследовательскую версию с использованием нейросети. В то же время мы начали использовать ИИ и нейронные сети в рекламе.
В целом поисковые и рекламные технологии взаимосвязаны. Основная задача — дать пользователю максимально релевантный ответ на его запрос. Многие технологии, используемые в поиске и рекламе, частично совпадают. Поэтому нейронные сети, как качественный прорыв в поисковой рекламе, были внедрены практически одновременно. Возможно, была небольшая разница в несколько месяцев, но это было в течение года.
Получается, что процессы использования ИИ в Яндекс Рекламе и Яндекс Поиске одинаковы?
Не совсем. В контекстной рекламе большая часть выбора осуществляется по профилю пользователя. Эта часть абсолютно уникальна: здесь перед нейросетями стоят более сложные задачи.
Участвуют ли в новых рекламных инструментах Яндекса новая нейросеть YandexArt и нейросеть YandexGPT? Насколько широко применяются эти инструменты?
YandexGPT — семейство шаблонов. Внутри Яндекса есть несколько итераций разработки. Внешне мы вносим большие серьезные изменения, которые действительно заметно влияют на качество, особенно в диалогах, например с голосовым помощником. Однако YandexGPT демонстрирует постоянные итеративные улучшения. Семейство этих шаблонов постоянно используется в интерфейсах Яндекс Директа, в основном для создания текста. Эти шаблоны предполагают варианты заголовков и текстов при создании объявлений, а в некоторых случаях с помощью искусственного интеллекта создается все объявление: заголовок, текст и изображение.
Основные инструменты ИИ для рекламы: первый — одна из версий YandexGPT, создающая текстовые описания на основе определенных параметров (определенный набор символов для крупного заголовка, объемное описание товара и т. д.), а второй, не связанный с ним. в ЯндексGPT, ЯндексАРТ. Эта нейронная сеть работает в приложении Masterpiece, которое создает изображения на основе текстовых описаний. Он используется для создания изображений для рекламы без использования фотографии или привлечения дизайнера.
Если посмотреть немного глубже, многие проблемы в Яндекс Рекламе уже давно решены с помощью нейронных сетей. Например, классическая DSSM (Модель глубокого семантического сходства) и БЕРТЕ (Представления двунаправленных энкодеров из трансформаторов). Все рекламные рейтинги основаны на нейронных сетях, но не на генеративных, а на более классических сетях. Они постоянно проходят обучение, и мы обновляем архитектуры каждые несколько месяцев.
Скажите, у вас спрашивают API тех версий нейросетей, которые вы используете в рекламе?
Если мы говорим о конкретной модели генерирующей сети для наших клиентов, то такого спроса не существует. Я объясню это немного подробнее здесь. Для продуктовых задач обучение нейронной сети проходит в два этапа. Первый — обучение базовой модели, второй — уточнение или дальнейшее обучение нейронной сети под конкретную задачу.
Мы предоставляем API только для основных технологий. Fintune — очень специфическая вещь; оно строго ограничено набором требований конкретной задачи. Предварительно обученная модель имеет определенный набор ограничений по определенным темам, более специфичным для нужд наших сервисов («Реклама Яндекса», «Бизнес Яндекса»). Предлагать эту модель под запросы клиентов нет смысла. Лучше всего придумать базовый шаблон и позволить клиенту сформировать его самостоятельно. Однако клиенты пока не получали запросы на оптимизированный API нейронных сетей.
Были ли датасеты ИИ обучены на основе ответов пользователей Яндекса Толока или также используются данные других сервисов?
Не совсем. Набор данных базовой модели состоит из больших объемов существующих данных, в том числе из открытых источников, но продолжим разговор о дополнительном обучении нейронной сети. Это этап тонкой настройки, требующий выставления оценок, поскольку обучение под учителем требует обучения на собственном примере. Разметка «Яндекс.Задачи» («ex.Яндекс Толоки») используется, но как один из шагов. К этому этапу также добавляется профессиональная маркировка. Это делается руками профессионалов, которые этим занимаются – ИИ-тренеров.
Тренеры ИИ — это в основном специалисты с отличным знанием русского языка и навыками проверки фактов. Но для обучения нейросетей под конкретный продукт нужны специалисты в конкретной области. Они должны быть хорошо знакомы с объемом примеров, которые они комментируют. Потому что с точки зрения качества разметки необходимы глубокие знания.
Соответственно, для задач рекламы требуются специалисты по маркетингу, а для задач минералогии — специалисты по минералам. Мы с коллегами недавно обсуждали, что некоторые знания об одних и тех же минералах невозможно найти просто в открытых источниках. Им очень нужен специалист, который это понимает, который сможет исследовать первоисточники и работать с ними на основе своего опыта. Маркетинг и реклама немного проще, потому что в Интернете больше информации, но, просто читая и просматривая обучающие видео и статьи, вы не станете экспертом по маркетингу. Кроме того, для качественных ответов от нейросети нужен специалист, который очень хорошо разбирается в маркетинге и хорошо понимает, какой вариант разметки правильный с точки зрения обучения нейронов нейросети.
У вас большая команда тренеров по искусственному интеллекту? Если я правильно понял из предыдущего ответа, базовая подготовка этого специалиста не связана с программированием?
Сначала отвечу на вторую часть вопроса. Тренеры ИИ не являются программистами; умение программировать – это скорее вспомогательный навык.
Что касается первой части, то обычно для наших задач нанимаются AI-тренеры для проектной работы. У нас есть задача научить нейросеть реагировать в определенной области. Мы обращаемся к специалистам в этой области. Для обучения большой модели нужны сотни крутых специалистов, которые смогут создать правильный ответ, простой и полезный для обывателя.
Правильно ли я понял, что эти специалисты могут и не быть тренерами по ИИ, но после работы смогут работать тренерами по ИИ?
Да, чаще всего это не готовый профессиональный тренер. Тренер ИИ — новая профессия. Человек должен уметь передавать свои знания. Они проходят инструктаж и обучение, учатся правильно интерпретировать инструкции, на которые они должны реагировать. Потому что сам ответ должен быть кратким, понятным и не должен содержать терминов, требующих пояснения. После тренинга тренер сдает микроэкзамен.
Ну, нужно понимать, что мы уже давно используем тегирование данных, как для улучшения качества поиска, так и для рекламы и для многих сервисов. Обычно 90% работы в машинном обучении связано не с самим машинным обучением, а с подготовкой данных.
Расскажите, как вы решаете рутинные задачи? Есть ли у вас платформа или люди, которые этим занимаются? Возможно ли, что однажды человек, не разбирающийся в предметной области, дал задачу нейросети, и она выдала ему готовое правильное решение?
У нас есть платформа ML. Но нужно понимать, что не все рутинные процессы автоматизированы. Для платформы ML вам необходимо собрать данные, подготовить теги, запустить процесс обучения, а затем принять метрики. В этой сфере самое сложное всегда то, что модель потом может попасть в производство и довольно быстро, потому что иногда люди тратят несколько месяцев на обучение, а еще через полгода не могут запустить ее в производство, потому что это тоже сложный процесс. . . Поэтому некоторые этапы автоматизированы.
Например, у нас есть этап сборки обучающих блоков, это определенный процесс. У нас есть система, которая готовит данные и делает это последовательно, потому что для многих моделей необходима «свежесть» данных. Эти процессы точно автоматизированы.
Еще несколько творческих задач выполняет специалист. Например, проектирование признаков, когда нужно понять, какие данные следует правильно добавить в модель. Такие вещи требуют классических подходов. Иногда процессы в этой сфере частично автоматизированы.
Однако большая часть работы все же ложится на специалиста, знакомого со спецификой задачи. Прежде всего, он должен понимать продукт, который производит. Невозможно, как бы нам ни хотелось этого сделать — мы отдали все данные в нейросеть, произошло волшебство и появилось хорошее готовое решение. Нейронная сеть решит проблему, но качество будет очень далеко от понятия «хорошее». Поэтому для обучения нейронных сетей вам нужны хорошо размеченные данные и эксперты в своей области.
В ходе обсуждения мне вспомнился лозунг: «Все новое — старое, хорошо забытое». » Я с ней не совсем согласен. В случае с тренерами ИИ оказалось, что нечто подобное люди делали еще до появления нейронных сетей. Однако было интересно наблюдать, как одна профессия практически трансформировалась в другую. Сейчас стоит поговорить с существующими инструкторами по искусственному интеллекту, чтобы увидеть внутреннюю работу обучения нейронных сетей. Что ж, мне также было интересно поговорить с людьми, которые используют нейронные сети не в бизнесе, а в науке. Потому что здесь модель ИИ не обучена на самых распространенных данных.