На этой неделе публикация Openai на GPT-4.5 для подписчиков CHATGPT Plus сразу же попробовала меня, хотя у меня много скептицизма. Были сообщения о Openaai (и других разработчиках), которые боролись за улучшение больших улучшений своих моделей, которые мы видели ранее. И текущая стандартная модель GPT-4O в большинстве случаев довольно хороша. И если вам нужен всеобъемлющий отчет, есть глубокая исследовательская функция.
Openaai утверждает, что GPT-4.5 имеет высокий эмоциональный интеллект и дифференцированное понимание того, что они говорят. Описание компании нарисовало картину обеих моделей как надежных друзей, но GPT-4.5 будет тем, от которой они ожидают книги по стихотворению в свой день рождения. Поэтому я решил проверить 4.5 против 4o с несколькими запросами ввода, которые мог бы предоставить каждый случайный пользователь CHATT.
Содержание
Ai -poesia
С этой аналогией в моей голове я решил начать с поэтического вызова. Я спросил обе модели «Можете ли вы написать мне короткое стихотворение о дождливом дне в Нью -Йорке и сфотографировать это?» Казалось справедливым, что поэт в большинстве людей смотрел в окно дождя в оживленном городе.
GPT-4.5 расположен слева, а GPT-4O находится справа. Они удивительно похожи. Я лично думаю, что GPT-4.5 проделал немного лучшую работу с подобными идеями. Это не только внешний вид дождя, но и ощущение серого неба, луж и движения между каплями дождя. В слепом испытании трех случайных друзей двое из трех, а третий сказал, что они предпочитают только схему рифмы от GPT-4O.
Обе модели использовали Dall-E 3 на картинках, но GPT-4.5 выглядит гораздо более реалистично. Я на самом деле предпочитаю импрессионистское освещение попытки GPT-4OS, но оба довольно хорошо делают идею стихотворения.
Оскар понимание
С самым молодым Оскаром я пошел с забавным вопросом о пустяках с более сложным, субъективным наблюдением: «Кто выиграл лучшую актрису Оскар в 2023 году и что подчеркнуло ее выступление?»
У обоих был правильный ответ на Мишель Йео для «Все везде одновременно», но у GPT-4.5 было действительно хорошее объяснение того, почему их выступление было развернуто зрителями. Она сообщила о ее выступлении и упомянула, как Йео был первым азиатом, выигравшим этот Оскар. В ответе GPT-4O было много таких же ударов, но он пошел на странное эссе и пронумерованный формат списка, который был прочитал, когда вопрос был простым запросом на мнение. Ответ GPT-4.5 был больше похож на настоящего человека, хотя тот, кто очень заинтересован в этом фильме и Yeoh в качестве исполнителя.
Простой повар
В конце концов, я поставил модели против вечной ежедневной борьбы с этой просьбой: «Я скучно от пасты. Можете ли вы предложить простой ужин с простым ужином, который отличается, но не сложно?»
Я не знаю, какое кулинарное вдохновение я ожидал, но GPT-4.5 ударил по ногтям на голове с медово-грилочным лососью с жареным брокколи. Вы можете видеть, что это очень простой, короткий рецепт и кажется простым и быстрым. GPT-4O пошел с чесночными креветками и жареными овощами. Это не плохая идея для еды (хотя мне пришлось бы лично изменить белок), но вы можете видеть, что только для подготовки требуется несколько кастрюлей для приготовления, и список ингредиентов даже не вписывается в ту же комнату, что и весь рецепт GPT-4.5. Я спросил о простых и не сложных, я бы сказал, что GPT-4.5 доставил гораздо лучше.
Глубокие мысли
GPT 4.5 дает атмосферу, которая не может быть замечена в подсказке в командной строке по сравнению с GPT-4O. Но очень тонко поглощать эти эмоциональные оттенки. Без прямого сравнения вы никогда не узнаете, что есть разница.
GPT-4O эффективен, точен и практичен в своих ответах, и его стихи полностью достаточны. Я бы не сказал, что на свободном уровне она использует, по крайней мере, в настоящее время нет доступа к GPT-4.5. Это может измениться со временем, поскольку GPT-4.5 по-прежнему является предварительным просмотром исследований и не является полным, не полным и снаружи. Я буду продолжать экспериментировать с обоими и посмотреть, существуют ли типы запросов входных запросов, в которых новая модель определенно лучше, но в настоящее время я бы сказал, что вы не беспокоитесь о том, какую модель вы используете, если вы не планируете еду и не имеете много времени для подготовки.