Благодаря обновлению следующего поколения ИИ Gemini от Google теперь может обрабатывать более крупные запросы. • Продвижение Web 2.0

На момент написания статьи Gemini AI от Google существует всего два месяца, и компания уже запускает модель следующего поколения под названием Gemini 1.5.

Анонсирующий пост вникает в суть и подробно объясняет все улучшения ИИ. Все это скорее технический вопрос, но главный вывод заключается в том, что Gemini 1.5 обеспечит «значительно улучшенную производительность». Это было достигнуто за счет реализации «Архитектуры смешанных экспертов» (или сокращенно MoE), в которой несколько моделей ИИ работают вместе в унисон. Внедрение этой структуры облегчило обучение близнецов и позволило быстрее, чем раньше, изучать сложные задачи.

Планируется внедрить обновление для всех трех основных версий AI, но единственная версия, выпущенная сегодня для раннего тестирования, — это Gemini 1.5 Pro.

Особенностью модели является то, что она имеет «контекстное окно объемом до 1 миллиона токенов». ТокеныВ контексте генеративного ИИ это мельчайшие фрагменты данных, которые LLM (большие языковые модели) используют «для обработки и генерации текста». Большие контекстные окна позволяют ИИ обрабатывать больше информации одновременно. А миллион токенов — это огромно, намного превосходящее производительность GPT-4 Turbo. Для сравнения, движок OpenAI имеет ограничение в 128 000 токенов контекстного окна.

Близнецы Про в действии

Учитывая все эти цифры, возникает вопрос: как выглядит Gemini 1.5 Pro в действии? Google создал несколько видеороликов, демонстрирующих возможности ИИ. Следует признать, что это довольно интересные вещи, поскольку они показывают, как обновленная модель может анализировать и суммировать большие объемы текста по запросу.

В примереОни представили Gemini 1.5 Pro более чем 400-страничный журнал лунной миссии Аполлона 11. Он показал, что ИИ может «понимать, рассуждать и идентифицировать» определенные детали в документе. Суфлер просит ИИ указать «странные моменты» во время миссии. Через 30 секунд Gemini 1.5 Pro удалось найти несколько шуток, которые астронавты отпустили в космосе, в том числе узнать, кто им рассказал и объяснил все инсинуации.

ЧИТАТЬ Видео: Google I/O, Marketing Live, режим искусственного интеллекта, обзоры искусственного интеллекта, реклама ИИ, волатильность поиска и многое другое

Эти аналитические возможности могут быть использованы и для других методов. В другой демо команда разработчиков подарила ИИ 44-минутный фильм Бастера Китона. Они загрузили черновой набросок бурлящей водонапорной башни, а затем попросили указать время сцены с водонапорной башней. Фактически, точное место было найдено через десять минут после начала фильма. Имейте в виду, что это было сделано без какого-либо объяснения самого рисунка или какого-либо текста, кроме вопроса. Gemini 1.5 Pro без какой-либо дополнительной помощи распознал, что это водонапорная башня.

Экспериментальная технология

Модель на данный момент недоступна для широкой публики. В настоящее время он предлагается через Google в качестве ранней предварительной версии для «разработчиков и корпоративных клиентов». ИИ-студия И Вертексный ИИ Платформы бесплатные. Компания предупреждает тестировщиков, что время задержки может быть длительным, поскольку это все еще экспериментальный тест. Однако есть планы по повышению скорости на этом маршруте.

Мы запросили у Google информацию о том, когда ожидать запуска Gemini 1.5 и Gemini 1.5 Ultra, а также более широкого выпуска этих моделей искусственного интеллекта следующего поколения. Эта история будет обновлена позже. А пока ознакомьтесь с обзором лучших генераторов ИИ-контента на 2024 год от TechRadar.

Вам также может понравиться

Source