Гэри Иллиес из Google ответил на вопросы во время недавнего поиска Central Live Deep Dive в Азии о том, используют ли они новый метод извлечения многоветройных с помощью фиксированных кодировщиков (MUAVERA), а также если они используют модели графических фундаментов.
Содержание
Двигаться
Недавно Google объявил Muvera в посте в блоге и в исследовательской работе: метод, который улучшает поиск, превращая сложный многоветательный поиск в быстрый одно векторный поиск. Он сжимает наборы встроенных токенов в фиксированные векторы, которые близко приближаются к их первоначальному сходству. Это позволяет использовать оптимизированные методы поиска с одним вектором, чтобы быстро найти хороших кандидатов, а затем повторно оценить их, используя точное сходство с мультивектором. По сравнению с более старыми системами, такими как плед, Muvera быстрее, извлекает меньше кандидатов и все еще улучшает отзыв, что делает его практическим решением для крупномасштабного поиска.
Ключевыми моментами о Muvera являются:
- Muvera преобразует множественные наборы в фиксированные векторы с использованием фиксированных размерных кодировки (FDES), которые представляют собой одноветорные представления многоветательных наборов.
- Эти FDES (фиксированные размерные кодировки) соответствуют исходным многоветательным сравнениям достаточно достаточно, чтобы поддержать точное извлечение.
- В поисках Muvera используется MIPS (максимальный внутренний поиск продукта), установленную технику поиска, используемое при поиске, что облегчает развертывание в масштабе.
- Повторный реэнер: после использования быстрого одного вектора (MIPS) для быстрого сужения наиболее вероятных совпадений, Muvera переориентирует их, используя сходство Chamfer, более подробный метод сравнения с несколькими векторами. Этот последний шаг восстанавливает полную точность извлечения многоклереров, поэтому вы получаете как скорость, так и точность.
- Muvera может найти больше точно соответствующих документов с более низким временем обработки, чем современная базовая линия поиска (плед), с которой он сравнивал.
Google подтверждает, что они используют Muvera
Хосе Мануэль Моргал (LinkedIn Profile) связанный Его вопрос к Гэри Иллиесу из Google и его ответ состоял в том, чтобы в шутку спросить, что такое Муверга, а затем он подтвердил, что они используют ее версию:
Вот как вопрос и ответ были описаны Хосе:
«Статья была опубликована в Google Research о Muvera, и есть связанная статья. В настоящее время она в поисках?
Его ответ состоял в том, чтобы спросить меня, что такое Муверга, ха -ха, а затем он прокомментировал, что они используют что -то похожее на Муверу, но они не называют это так ».
Использует ли Google модели графика (GFMS)?
Google недавно опубликовал объявление о блоге о прорыве ИИ под названием «Модель графического фонда».
Модель Google Graph Foundation (GFM) — это тип искусственного интеллекта, который учится из реляционных баз данных, превращая их в графики, где строки становятся узлами, а соединения между таблицами становятся краями.
В отличие от более старых моделей (модели машинного обучения и нейронные сети графиков (GNNS)), которые работают только на одном наборе данных, GFMS могут обрабатывать новые базы данных с различными структурами и функциями, не перепроизводя новые данные. GFM используют большую модель искусственного интеллекта, чтобы узнать, как точки данных связаны между таблицами. Это позволяет GFM находить шаблоны, которые упускают обычные модели, и они работают намного лучше в таких задачах, как обнаружение спама в масштабированных системах Google. GFM являются большим шагом вперед, потому что они обеспечивают гибкость модели основы в сложных структурированных данных.
Модели графических фундаментов представляют собой заметное достижение, потому что их улучшения не являются постепенными. Они являются улучшением порядка матча, причем повышение производительности в 3 раза в средней точности.
Затем Хосе спросил Иллиес, использует ли Google модели Graph Foundation, и Гэри снова в шутку притворялся, не зная, о чем говорил Хосе.
Он рассказал вопрос и ответ:
«Статья была опубликована в Google Research о моделях Graph Foundation для данных, на этот раз нет бумаги, связанной с ней. В настоящее время она в поисках?
Его ответ был таким же, как и раньше, спросив меня, какие модели графических фундаментов для данных, и он думал, что это не в производстве. Он не знал, потому что нет связанных документов, а с другой стороны, он прокомментировал меня, что не контролировал то, что опубликовано в блоге Google Research ».
Гэри выразил свое мнение, что модель графического фонда в настоящее время не использовалась в поиске. На данный момент это лучшая информация, которую мы имеем.
Готова ли GFM к масштабируемому развертыванию?
Официальное объявление модели графического фонда говорится, что оно было проверено во внутренней задаче, обнаружение спама в рекламе, что убедительно предполагает, что использовались реальные внутренние системы и данные, а не только академические контрольные показатели или симуляции.
Вот что связано с объявлением Google:
«Работа в шкале Google означает, что обработка графиков миллиардов узлов и ребра, где наша среда JAX и масштабируемая инфраструктура TPU особенно сияет. Такие объемы данных поддаются обучению моделей общего пользования, поэтому мы исследовали наш GFM по нескольким внутренним задачам классификации, такими как обнаружение спама в ADS, которые включают в gros and connectional ortional sturation orpational contablies contables, ablyble -altiptiptiptiptipes, не имеют знаменитости. Различные таблицы и, следовательно, пропускают контекст, который может быть полезен для точных прогнозов.
Вынос
Гэри Иллиес из Google подтвердил, что в Google используется форма Muvera. Его ответ о GFM, казалось, был выражен как мнение, так что это несколько менее ясно, поскольку это связано с тем, что Гэри говорит, что он думает, что это не в производстве.
Избранное изображение от Shutterstock/Krakenimages.com