Сегодня мы представляем TranslateGemma, новую коллекцию открытых моделей перевода, созданную на основе Gemma 3 и доступную с размерами параметров 4B, 12B и 27B. Он представляет собой значительный прогресс в области открытого перевода, помогая людям общаться на 55 языках, независимо от того, где они находятся и какое у них устройство.
Объединив знания наших самых передовых больших моделей в компактные, высокопроизводительные открытые модели, мы создали комплекс, эффективность которого не требует ущерба качеству.
Превосходные модели вдвое большего размера
Наиболее заметным результатом нашей технической оценки является эффективность этих моделей. Благодаря нашему специализированному процессу обучения модель 12B TranslateGemma превосходит тест Gemma 3 27B, измеренный с помощью MetricX в тесте WMT24++.
Для разработчиков это огромная победа. Добиться высокого качества перевода можно, используя менее половины настроек базовой модели. Такое повышение эффективности обеспечивает более высокую пропускную способность и меньшую задержку без ущерба для точности. Точно так же модель 4B конкурирует по производительности с более крупной базовой моделью 12B, что делает ее мощной моделью для мобильного вывода.
Мы протестировали TranslateGemma на наборе данных WMT24++, включающем 55 языков, охватывающих самые разные языковые семьи, включая языки с высоким, средним и низким уровнем ресурсов. TranslateGemma значительно снизила количество ошибок по сравнению с базовой моделью Gemma на всех языках, добившись улучшения качества и большей эффективности.

