Google обновил свои модели голосового поиска, чтобы использовать технологию Speech-to-Retrival (S2R). Google сказал это позволяет ему «получать ответы прямо на ваш устный запрос без необходимости предварительного преобразования его в текст, что приводит к более быстрому и надежному поиску для всех».

Первоначально Google использовал решение для голосового поиска под названием автоматическое распознавание речи (ASR), чтобы превратить голосовой ввод в текстовый запрос, а затем искал документы, соответствующие этому текстовому запросу. В Google заявили, что «проблема этого подхода к каскадному моделированию заключается в том, что любые незначительные ошибки на этапе распознавания речи могут существенно изменить смысл запроса, приводя к неверным результатам».

Технология распознавания речи (S2R) решила эту проблему. В Google заявили: «По своей сути S2R — это технология, которая напрямую интерпретирует и извлекает информацию из устного запроса без промежуточного и потенциально ошибочного этапа создания идеальной текстовой расшифровки. Она представляет собой фундаментальный архитектурный и философский сдвиг в том, как машины обрабатывают человеческую речь».

Это было опубликовано в блоге Google Research, но сейчас используется в реальном мире. В Google написали: «Переход к голосовому поиску на базе S2R — это не теоретическое упражнение, а реальная реальность. В тесном сотрудничестве Google Research и Search эти продвинутые модели теперь обслуживают пользователей на нескольких языках, обеспечивая значительный скачок в точности по сравнению с обычными каскадными системами».

Подсказка Гагану:

Обсуждение на форуме Х.

ЧИТАТЬ  Представляем Google AI в программе «Люди также спрашивают»





Source link