На момент написания статьи Gemini AI от Google существует всего два месяца, и компания уже запускает модель следующего поколения под названием Gemini 1.5.
Анонсирующий пост вникает в суть и подробно объясняет все улучшения ИИ. Все это скорее технический вопрос, но главный вывод заключается в том, что Gemini 1.5 обеспечит «значительно улучшенную производительность». Это было достигнуто за счет реализации «Архитектуры смешанных экспертов» (или сокращенно MoE), в которой несколько моделей ИИ работают вместе в унисон. Внедрение этой структуры облегчило обучение близнецов и позволило быстрее, чем раньше, изучать сложные задачи.
Планируется внедрить обновление для всех трех основных версий AI, но единственная версия, выпущенная сегодня для раннего тестирования, — это Gemini 1.5 Pro.
Особенностью модели является то, что она имеет «контекстное окно объемом до 1 миллиона токенов». ТокеныВ контексте генеративного ИИ это мельчайшие фрагменты данных, которые LLM (большие языковые модели) используют «для обработки и генерации текста». Большие контекстные окна позволяют ИИ обрабатывать больше информации одновременно. А миллион токенов — это огромно, намного превосходящее производительность GPT-4 Turbo. Для сравнения, движок OpenAI имеет ограничение в 128 000 токенов контекстного окна.
Близнецы Про в действии
Учитывая все эти цифры, возникает вопрос: как выглядит Gemini 1.5 Pro в действии? Google создал несколько видеороликов, демонстрирующих возможности ИИ. Следует признать, что это довольно интересные вещи, поскольку они показывают, как обновленная модель может анализировать и суммировать большие объемы текста по запросу.
В примереОни представили Gemini 1.5 Pro более чем 400-страничный журнал лунной миссии Аполлона 11. Он показал, что ИИ может «понимать, рассуждать и идентифицировать» определенные детали в документе. Суфлер просит ИИ указать «странные моменты» во время миссии. Через 30 секунд Gemini 1.5 Pro удалось найти несколько шуток, которые астронавты отпустили в космосе, в том числе узнать, кто им рассказал и объяснил все инсинуации.
Эти аналитические возможности могут быть использованы и для других методов. В другой демо команда разработчиков подарила ИИ 44-минутный фильм Бастера Китона. Они загрузили черновой набросок бурлящей водонапорной башни, а затем попросили указать время сцены с водонапорной башней. Фактически, точное место было найдено через десять минут после начала фильма. Имейте в виду, что это было сделано без какого-либо объяснения самого рисунка или какого-либо текста, кроме вопроса. Gemini 1.5 Pro без какой-либо дополнительной помощи распознал, что это водонапорная башня.
Экспериментальная технология
Модель на данный момент недоступна для широкой публики. В настоящее время он предлагается через Google в качестве ранней предварительной версии для «разработчиков и корпоративных клиентов». ИИ-студия И Вертексный ИИ Платформы бесплатные. Компания предупреждает тестировщиков, что время задержки может быть длительным, поскольку это все еще экспериментальный тест. Однако есть планы по повышению скорости на этом маршруте.
Мы запросили у Google информацию о том, когда ожидать запуска Gemini 1.5 и Gemini 1.5 Ultra, а также более широкого выпуска этих моделей искусственного интеллекта следующего поколения. Эта история будет обновлена позже. А пока ознакомьтесь с обзором лучших генераторов ИИ-контента на 2024 год от TechRadar.