Anpropic только что выпустила новую модель под названием Claude 3.7 Sonnet, и, хотя меня всегда интересует последние функции искусственного интеллекта, это был новый «расширенный» режим, который действительно привлек мой взгляд. Это напомнило мне о том, как Openaai впервые дебютировал в своей модели O1 для Chatgpt. Он предложил возможность получить доступ к O1, не выходя из окна с моделью CatGPT 4O. Вы можете ввести «/разум», а бот KI Chat будет использовать O1 вместо этого. Сейчас он излишне, хотя он все еще работает в приложении. Независимо от того, что более глубокий, более структурированный аргумент обоих заставил меня увидеть, как они пойдут друг на друга.
Расширенный режим Claude 3.7 разработан как гибридный инструмент аргументации, с помощью которого пользователи могут переключить быстрые, связанные с разговором ответы и входящее постепенное решение проблем. Требуется время, чтобы проанализировать вашу подсказку, прежде чем вы дадите свой ответ. Это делает его отличным для математики, кодирования и логики. Вы даже можете установить баланс между скоростью и глубиной. Антрические позиции, чтобы сделать ИИ более полезным для реальных применений, которые требуют более плотных методологических решений проблем, в отличие от реакций на поверхностном уровне.
Доступ к Claude 3.7 требует подписки для Claude Pro. Поэтому я решил использовать демонстрацию в следующем видео в качестве теста. Чтобы оспорить расширенный способ мышления, Антропик попросил ИИ проанализировать и объяснить популярную, винтажную головоломку правдоподобия, которая известна как проблема Монти Холл. Это обманчиво сложный вопрос, который многие люди бродят, даже те, кто хорошо смотрит на математику.
Настройка проста: вы находитесь в игровом шоу и попросили выбрать одну из трех дверей. За вами стоит машина; Позади других, коз. Из настроения Антропик решил пойти с крабами вместо коз, но принцип такой же. После того, как вы сделали свой выбор, хозяин, который знает, что стоит за каждой дверью, открывает один из оставшихся двух, чтобы показать козу (или краб). Теперь у вас есть выбор: оставайтесь с исходным выбором или переключитесь на последнюю неоткрытую дверь. Большинство людей предполагают, что это не имеет значения, но с контрастностью, переход на самом деле дает им шанс выиграть 2/3, в то время как у них есть только 1/3 вероятности своего первого выбора.
Решения об убийстве
С расширенным мышлением, Клод 3.7 преследовал измеренный, почти академический подход для объяснения проблемы. Вместо того, чтобы просто указать правильный ответ, она тщательно определила основную логику в нескольких шагах, подчеркнув, почему вероятности после хоста раскрывают краба. Это также не только объясняется в сухой математике. Клод прошел гипотетические сценарии и продемонстрировал, как вероятности оказались повторяющиеся попытки, и упростило понимание, почему переключение всегда лучше движения. Ответ не был поспешно; Мне казалось, что профессор медленно и намеренно проводил меня через него, чтобы я действительно понял, почему общая интуиция была неправильной.
CHATGPT O1 предложил лишь большую часть разбивки и хорошо объяснил проблему. На самом деле это объясняется в нескольких формах и стилях. Вместе с фундаментальной вероятностью он также прошел теорию игр, повествовательные взгляды, психологический опыт и даже экономический срыв. Если вообще это было немного ошеломляющим.
Геймплей
Тем не менее, это не все, что могло бы сделать расширенное мышление Клода. Как вы можете видеть в видео, Клод может даже превратить версию проблемы Монти Холла в игру, в которую они могут играть прямо в окне. Попытка в той же командной строке с Chatgpt O1 не сделала то же самое. Вместо этого Chatgpt написал сценарий HTML для моделирования проблемы, которую я мог бы сохранить и открыть в своем браузере. Как вы можете видеть ниже, но предприняли несколько дополнительных шагов.
Несмотря на то, что почти наверняка существуют небольшие различия в качестве, в зависимости от типа кода или математики, над которым вы работаете, как расширенное мышление Клода, так и модель чата O1 предлагают прочные, аналитические подходы для логических проблем. Я вижу преимущество в том, что время и глубина рассуждений адаптированы, которые предлагает Клод. Это означает, что, если у вас нет слишком много времени и не производите много контента от мышления.
Способность создавать проблему в качестве симуляции в чате гораздо более замечательна. Это делает Клод более гибким и мощным, даже если фактическое моделирование, вероятно, использует очень похожий код на HTML, написанный CHATGPT.