Google подвергается критике за демо-версию после долгожданного релиза Gemini • Продвижение Web 2.0

Вскоре после того, как распространилась новость о том, что Google откладывает запуск своей долгожданной модели искусственного интеллекта под названием Gemini, Google объявила об этом.

В рамках релиза они опубликовали демоверсию, демонстрирующую впечатляющие – совершенно невероятные – возможности Gemini. Ну, вы знаете, что говорят о том, что все слишком хорошо, чтобы быть правдой.

Давайте разберемся, что пошло не так с демо-версией и чем она отличается от OpenAI.

Что такое Google Gemini?

Конкурируя с GPT-4 от OpenAI, Gemini представляет собой мультимодальную модель искусственного интеллекта, что означает, что она может обрабатывать ввод текста, изображений, аудио и кода.

(Долгое время ChatGPT был унимодальным и обрабатывал только текст, пока в этом году он не перешел на мультимодальность.)

Gemini выпускается в трех версиях:

Нано: Это наименее мощная версия Gemini, предназначенная для работы на мобильных устройствах, таких как телефоны и планшеты. Он лучше всего подходит для простых повседневных задач, таких как обобщение аудиофайла и написание копии для электронного письма.
Плюсы: Эта версия может решать более сложные задачи, такие как языковой перевод и идеи маркетинговых кампаний. Это версия, которая теперь поддерживает инструменты Google AI, такие как Bard и Google Assistant.
Ультра: Самая большая и мощная версия Gemini с доступом к большим наборам данных и вычислительной мощностью для выполнения таких задач, как решение научных задач и создание передовых приложений искусственного интеллекта.

Ultra пока недоступен для потребителей, его внедрение запланировано на начало 2024 года, поскольку Google проводит окончательные тесты, чтобы убедиться в его безопасности для коммерческого использования. Gemini Nano будет использоваться в телефоне Google Pixel 8 Pro со встроенными возможностями искусственного интеллекта.

ЧИТАТЬ Google тестирует мини-панели знаний

Gemini Pro, с другой стороны, будет использоваться в таких инструментах Google, как Bard, начиная с сегодняшнего дня, и доступен через API через Google AI Studio и Google Cloud Vertex AI.

Ввела ли демоверсия Google Gemini в заблуждение?

Google опубликовал шестиминутную демонстрацию на YouTube, демонстрирующую языковые навыки Близнецов, создание игр, логику и пространственное мышление, культурное понимание и многое другое.

Если вы посмотрите видео, то легко впечатлиться.

Близнецы способны узнать утку по простому рисунку, понять хитрый трюк и решить визуальные головоломки — и это лишь некоторые из задач.

Но, заработав более 2 миллионов просмотров, Отчет Блумберга выяснилось, что видео было вырезано и склеено, что преувеличило выступление Gemini.

Google поделился заявлением об отказе от ответственности в начале видео: «Для целей этой демонстрации задержка была уменьшена, а вывод Gemini был сокращен для краткости».

Однако Bloomberg отмечает, что они упустили некоторые важные детали:

Видео не было сделано в режиме реального времени или с помощью голосового вывода, что говорит о том, что разговоры не будут такими плавными, как показано в демо.
В видео использована модель Gemini Ultra, которая пока недоступна для широкой публики.

Фактически Gemini обрабатывала вводимые данные в демо-версии с помощью неподвижных изображений и письменных вопросов.

Это как когда ты показываешь все лучшие трюки собаки.

Вы делитесь видео по тексту, и все впечатляются. Но когда все закончили, они видят, что на самом деле требуется целая куча угощений, похлопываний, терпения и повторения 100 раз, чтобы увидеть этот трюк в действии.

Давайте проведем параллельное сравнение.

В этом 8-секундном ролике мы видим, как человек жестикулирует, как будто он играет в игру, используемую для разрешения всех дружеских споров. Близнецы отвечают: «Я знаю, что ты делаешь. Вы играете в камень-ножницы-бумагу.«

ЧИТАТЬ Только 12% IU, упомянутых на URL -адрес

Близнецы демо

Источник изображения

Но то, что на самом деле произошло за кулисами, включает в себя гораздо больше схем.

В реальной демонстрации пользователь отправлял каждый жест руки отдельно и просил Gemini описать то, что он видел.

демо-версия Google Gemini

Источник изображения

После этого пользователь объединил все три изображения, снова спросил Близнецов и добавил большую подсказку.

демо-версия Google Gemini

Хотя то, как Близнецы способны обрабатывать изображения и понимать контекст, по-прежнему впечатляет, видео преуменьшает, насколько много контроля требуется Близнецам для генерации правильного ответа.

Хотя это вызвало много критики со стороны Google, некоторые отмечают, что компании нередко используют редактирование для создания более цельных, идеалистических вариантов использования в своих демонстрациях.

Близнецы против. ГПТ-4

На данный момент GPT-4, созданная OpenAI, является самой мощной моделью искусственного интеллекта на рынке. С тех пор Google и другие игроки в области ИИ усердно работают над созданием модели, которая сможет его превзойти.

Google впервые дразнил Gemini в сентябре, намекая, что он победит GPT-4 и технически доставит его.

Gemini превосходит GPT-4 по ряду тестов, установленных исследователями искусственного интеллекта.

Близнецы против. гпт-4

Источник изображения

Однако статья Bloomberg указывает на нечто важное.

Для модели, запуск которой занял так много времени, тот факт, что она лишь незначительно лучше, чем GPT-4, не является той большой победой, к которой стремился Google.

OpenAI выпустила GPT-4 в марте. Теперь Google выпускает Gemini, который превосходит его по производительности, но лишь на несколько процентных пунктов.

Так сколько же времени понадобится OpenAI, чтобы выпустить еще большую и лучшую версию? Судя по прошлому году, это, вероятно, ненадолго.

На данный момент Gemini кажется лучшим вариантом, но это будет ясно только в начале 2024 года, когда появится Ultra.

ЧИТАТЬ Google сначала тестирует кнопку «Сервисы» в результатах локального поиска и поиска на карте.

Source