1.5 Flash превосходно справляется с подведением итогов, приложениями для чата, субтитрами к изображениям и видео, извлечением данных из длинных документов и таблиц и многим другим. Это связано с тем, что 1.5 Pro обучал его посредством процесса, называемого «дистилляция», при котором наиболее важные знания и навыки из более крупной модели переносятся в меньшую, более эффективную модель.
Узнайте больше о 1.5 Flash на Страница технологий Geminiи узнайте о наличии и ценах версии 1.5 Flash. Более подробную информацию мы скоро поделимся в обновленном техническом отчете Gemini 1.5.
Значительное улучшение в версии 1.5 Pro.
За последние несколько месяцев мы значительно улучшили версию 1.5 Pro, нашу лучшую модель с точки зрения общей производительности при выполнении широкого круга задач.
Помимо расширения его всплывающего окна до 2 миллионов токенов, мы улучшили его генерацию кода, логическое рассуждение и планирование, многоходовой разговор, а также понимание аудио и изображений с помощью данных и алгоритмических достижений. Мы видим значительные улучшения по сравнению с государственными и внутренними показателями по каждой из этих задач.
Версия 1.5 Pro теперь может следовать все более сложным и тонким инструкциям, в том числе тем, которые определяют поведение на уровне продукта, включая роль, формат и стиль. Мы улучшили контроль над шаблонными ответами для конкретных случаев использования, таких как создание личности и стиля ответа агента чата или автоматизация рабочих процессов с помощью нескольких вызовов функций. И мы позволили пользователям управлять поведением модели, установив системные инструкции.
Мы добавили понимание звука в Близнецы API И Google ИИ-студия, поэтому 1.5 Pro теперь может анализировать изображение и звук для видео, загруженных в Google AI Studio. И сейчас мы интегрируем версию 1.5 Pro в продукты Google, включая Продвинутые Близнецы И в Рабочая среда Приложения.
Подробнее о версии 1.5 Pro можно узнать на сайте Страница технологий Gemini. Более подробная информация скоро будет доступна в нашем обновленном техническом отчете Gemini 1.5.
Gemini Nano включает мультимодальные входы
Gemini Nano выходит за рамки просто текстовых записей и включает в себя также изображения. Начиная с Pixel, приложения, использующие Gemini Nano с мультимодальностью, смогут понимать мир так, как это делают люди, не только через текст, но также через зрение, слух и устную речь.
Узнайте больше о Gemini 1.0 Nano для Android.