Примечание Сундара Пичаи, генерального директора Google и Alphabet:
Информация лежит в основе человеческого прогресса. Вот почему мы уже более 26 лет концентрируемся на нашей миссии — организовать мировую информацию и сделать ее доступной и полезной. И именно поэтому мы продолжаем расширять границы ИИ, чтобы организовать эту информацию на каждом входе и сделать ее доступной на любом выходе, чтобы она могла быть действительно полезной для вас.
Это было наше видение, когда мы представили Gemini 1.0 в декабре прошлого года. Gemini 1.0 и 1.5, первые модели, изначально задуманные как мультимодальные, принесли большие успехи в мультимодальности и длинном контексте для понимания информации, содержащейся в тексте, видео, изображениях, аудио и коде, а также в процессе обработки многого другого.
Сегодня миллионы разработчиков работают с Gemini. И это помогает нам заново изобретать все наши продукты – включая 7 с 2 миллиардами пользователей – и создавать новые. КарнетLM — отличный пример того, что мультимодальность и длинный контекст могут дать людям, и почему его так любят многие.
За последний год мы инвестировали в разработку большего количества моделей на основе агентов, что означает, что они смогут лучше понимать мир вокруг вас, продумывать несколько этапов и действовать от вашего имени и под вашим руководством.
Сегодня мы рады представить следующее поколение моделей, созданных для этой новой агентной эры: мы представляем Gemini 2.0, нашу самую функциональную модель. Благодаря новым достижениям в области мультимодальности, таким как собственный вывод изображения и звука, а также использованию собственных инструментов, это позволит нам создавать новые агенты ИИ, которые приблизят нас к нашему видению универсального помощника.
Сегодня мы передаем версию 2.0 в руки проверенных разработчиков и тестировщиков. И мы быстро работаем над его интеграцией в наши продукты, в первую очередь с Gemini и Поиском. С сегодняшнего дня наша экспериментальная модель Gemini 2.0 Flash будет доступна всем пользователям Gemini. Мы также запускаем новую функцию под названием Deep Research, которая использует расширенные возможности рассуждения и расширенного контекста, выступая в качестве помощника по исследованиям, изучая сложные темы и составляя отчеты от вашего имени. Сегодня он доступен в Gemini Advanced.
Ни один продукт не был преобразован искусственным интеллектом так сильно, как поиск. Наша информация об искусственном интеллекте теперь доступна 1 миллиарду человек, что позволяет им задавать совершенно новые типы вопросов, что быстро становится одной из наших самых популярных функций поиска. На следующем этапе мы интегрируем расширенные возможности рассуждения Gemini 2.0 с знаниями искусственного интеллекта для решения более сложных тем и многоэтапных вопросов, включая сложные математические уравнения, мультимодальные запросы и кодирование. На этой неделе мы начали ограниченное тестирование и расширим его масштабы в начале следующего года. И в следующем году мы продолжим предлагать предварительные версии ИИ в большем количестве стран и языков.
Достижения в области 2.0 поддерживаются многолетними инвестициями в наш дифференцированный комплексный подход к инновациям в области искусственного интеллекта. Он построен на специальном оборудовании, таком как Trillium, наши TPU шестого поколения. TPU обеспечивают 100% обучения и вывода Gemini 2.0, и сегодня Trillium общедоступный клиентам, чтобы они тоже могли строить с его помощью.
Если Gemini 1.0 был ориентирован на организацию и понимание информации, то Gemini 2.0 призван сделать ее гораздо более полезной. Мне не терпится увидеть, что принесет нам следующая эпоха.
-Сундар