Google хочет, чтобы вы знали, что Flash Gemini 2.0 должна быть вашим предпочтительным ботом для чата KI. Модель имеет большую скорость, больший мозг и более здравый смысл, чем ее предшественник, Zwdler 1 Flash. После создания Gemini Flash 2.0 против Chatgpt в воздухе я решил посмотреть, как сравнивалась новая любимая модель Google с его старшим братом.
Как и в предыдущем матче, я установил дуэль с несколькими задачами, которые имеют общие возможности, которые кто -то мог бы использовать Близнецов, включая меня. Может ли Gemini 2.0 Flash дать лучшие советы, чтобы улучшить мою жизнь, объяснить сложную тему, которую я мало знаю о том, как я могу ее понять, или выпустить ответ на сложную логическую проблему и объяснить рассуждения? Так прошел тест.
Содержание
Продуктивные решения
Если есть одна вещь, которая должна быть в состоянии дать полезный совет. Не только общие советы, но и исправлены и сразу же полезные идеи. Поэтому я задал обе версии один и тот же вопрос: «Я хочу быть более продуктивным, но также имею лучший баланс между работой и личной жизнью. Какие изменения я должен внести в свою рутину?»
Gemini 2.0 был заметно быстрее, даже если это было всего на одну или две секунды быстрее. Что касается фактического содержания, то оба имели хороший совет. Модель 1.5 разорвала четыре больших идеи с знаком списка, в то время как 2.0 решил более длинный список из 10 идей, которые были объяснены в коротких параграфах.
Мне понравились некоторые из более конкретных предложений от 1,5, таких как принцип Парето, но также 1,5 казалось большим повторением первоначальной концепции, в то время как 2.0 чувствовал, что у меня есть более нюансированные жизненные советы. Если бы друг попросил у меня совета по этой теме, я бы определенно заявил о ответе 2.0S.
Что не так с Wi-Fi?
Большая часть того, что делает помощника ИИ полезным, — это не только то, насколько он знает, но и то, насколько хорошо он может объяснить вещи, так как это на самом деле щелкает. Хорошее объяснение — это не только перечисление фактов. Речь идет о чувстве интуитивного понятия. Для этого теста я хотел посмотреть, как обе версии Близнецов сокращают техническую тему таким образом, чтобы это было актуально для повседневной жизни. Я спросил: «Объясните, как работает Wi-Fi, но в некотором смысле для того, кто просто хочет знать, почему ваш интернет медленный».
Gemini 1.5 прошел сравнение Wi-Fi с радио, что является скорее описанием, чем аналогия, которая предполагала. Маршрутизатор, чтобы назвать диджея, также является маршрутом, хотя совет был, по крайней мере, последовательным для улучшения сигнала.
Gemini 2.0 использовал более сложную метафору с системой водоснабжения с такими устройствами, как растения, которые получают воду. ИИ расширил метафору, чтобы объяснить, что вызывает проблемы, например, слишком много «растений» для доступной воды и забитых труб, представляют проблемы поставщика. Сравнение «интерференция спринклера» было намного слабее, но, как и в случае с версией 1.5, Gemini 2.0 имел практические советы по улучшению сигнала Wi-Fi. Хотя это было намного дольше, ответ 2.0 был немного быстрее.
Логическая бомба
Для последнего теста я хотел посмотреть, насколько хорошо обе версии имеют дело с логикой и аргументами. Модели ИИ должны быть хорошими в головоломках, но речь идет не только о том, чтобы правильно сделать ответ, но и о том, можете ли вы объяснить, почему ответ верен таким образом, что на самом деле имеет смысл. Я дал им классическую загадку: «У вас есть две веревки. Каждому нужно ровно час, чтобы гореть, но они не горит с постоянной скоростью. Как вы измеряете ровно 45 минут?»
Технически обе модели дали правильный ответ, как измерить время, но примерно как можно больше в пределах ограничений головоломки и правильного. Ответ Gemini 2.0 короче, упорядочен таким образом, что это легче понять, и объясняет его ясно, несмотря на свою краткость. Ответ Gemini 1.5 требовал более тщательного анализа, и шаги казались немного неуместными. Фраза также сбивала с толку, особенно если она проливает свет на оставшуюся веревку «на одном конце», когда это означало конец, что в настоящее время не освещается.
Для такого ответа Gemini 2.0 было замечательно лучше, чтобы решить этот тип логической головоломки.
Gemini 2.0 для скорости и ясности
После тестирования входных запросов различия между Flash Gemini 1.5 и Flash Gemini 2.0 были ясны. Хотя 1.5 не обязательно были бесполезны, он, казалось, боролся со специфичностью и проводил полезные сравнения. То же самое относится и к логическому краху. Если бы это было использовано для компьютерного кода, вам придется много убирать для функционирующей программы.
Flash Gemini 2.0 была не только быстрее, но и более креативным в своих ответах. Казалось, гораздо более образные аналогии и сравнения и гораздо более ясны, чтобы объяснить свою собственную логику. Это не значит, что это идеально. Аналогия воды развалилась, и консультация по продуктивности могла бы использовать конкретные примеры или идеи.
Это означает, что это было очень быстро и смог прояснить эти проблемы с небольшим разговором вперед и назад. Flash Gemini 2.0 — не последний, идеальный помощник искусственного интеллекта, но это определенно шаг в правильном направлении для Google, поскольку он пытается превзойти себя и конкурентов, таких как Чатт.