Openaai показал своего первого агента искусственного интеллекта, оператора на прошлой неделе, но уже потертого конкурента, который предлагает инструмент для ИИ под названием «Использование браузера», который может выполнять задачи онлайн для вас. Этот агент компьютерного США (CUA) может писать, поиск, щелкнуть и копировать информацию с веб-сайтов без необходимости касаться мыши или клавиатуры и без подписания Chatt-Pro в 200 долларов в месяц.
Использование браузера на самом деле бесплатное, по крайней мере, если вы готовы и можете играть с кодом API в течение некоторого времени. Я не очень кодирован, но я думал, что Найв, я достаточно знал о том, как GitHub использует версию API. Я часами решил, что документация, изменения в настройках и примеры необходимы более глубокая степень знаний по кодированию, чем я, не говоря уже о обычном человеке, который просматривает в Интернете.
К счастью, браузер сделал для меня только облачную версию, в которой используется модель GPT-4O, принадлежащая OpenAI. Он делит много тяжелого технического подъема и попадает в более знакомый формат чата без дополнительной работы. Он имеет свои ограничения и стоит 30 долларов США, но после моего некомпетентного хаоса API это было похоже на сделку. И даже в этой (все еще явно незаконченной) форме вам все равно придется атаковать некоторые усилия по техническим запросам и договориться о том, как работает ИИ. Наиболее ограничительным аспектом является то, что вы можете только пройти подсказку, прежде чем вам придется начать новое взаимодействие. Несмотря на текстовое поле, вы не можете ответить на то, что делает ИИ, и усовершенствовать ваш запрос.
Купить ai
Со всем, что настроено, я применил вставку браузера с несколькими реальными тестами. Сначала была задача сравнения цен. Я вошел в подсказку: «Перейдите в Amazon, Best Buy и Walmart и ищите один.
Он хорошо справился, хотя он не нашел скрытые скидки или ваучеры. Тем не менее, тот факт, что я смог автоматизировать отслеживание цен на нескольких веб -сайтах, был довольно захватывающим. Тем не менее, постоянная проблема для такого агента возникает, когда веб -сайт хочет проверить, что они люди. У использования браузеров есть кнопка, с которой вы хотите, когда хотите, но вы также привлекли свое внимание, если вам это нужно. Вы можете доказать свое человечество, а затем поразить свое резюме, чтобы ИИ мог снова опередить.
Летать
Затем последовало задание по планированию путешествий с командной строкой: «Поиск обратного рейса из Нью -Йорка в Лондон 15 декабря 2025 года в British Air.
Использование браузера поставлено и проезжает полет из British Airways за 750 долларов США с временем отправления и другими соответствующими деталями. Это может быть невероятно полезно для людей, которые бронируют много поездок, особенно если вы автоматизируете его, чтобы регулярно искать цены.
Fale Weather Ai Friend
Наконец я проверил прогноз и планирование погоды с помощью командной строки: «Проверьте 7 -дневный прогноз погоды из Нью -Йорка на Weather.com и суммируйте температурные тенденции, дождь и все предупреждения о шторме, а затем предложить, как это сделать для этого одетый. «»
Погода является одним из самых популярных использования для голосовых помощников. Поэтому я хотел посмотреть, как ИИ справился с более сложной просьбой в этом смысле. Было очень хорошо не только извлекать информацию из прогноза, но и предложить, в какие дни я должен носить легкое пальто, и в какие дни я должен «изолировать с теплым пальто и шарфом, так как он прохладный с низкими дождями становится».
Силовой тур
Основное различие между ними — доступность. Использование браузера похоже на швейцарский армейский нож для разработчиков. У него есть гибкость, чтобы сделать практически все в браузере, но вам нужно знать, как использовать инструменты. Вы можете погрузиться в код, оптимизировать его и формировать свои потребности. Если функция отсутствует, она ничего не мешает добавлять ее. Использование браузеров, использование с открытым исходным кодом, также имеет активное сообщество разработчиков, которое постоянно совершенствует его. Это означает, что если вы сталкиваетесь с проблемами, есть дискуссии на форуме и GitHub, в которых вы, вероятно, можете найти ответы.
Оператор Openas, с другой стороны, похож на настройку дворецкого. Это много для вас делает, но в пределах определенных ограничений. Сила оператора — это интеграция в более широкую экосистему AI Open и предлагает ему доступ к проприетарным моделям, которые могут принимать более дифференцированные решения. Тем не менее, они включены в структуру цен на OpenAI и варианты ограниченной адаптации.
Использование браузера не идеально. Даже его облачная версия требует небольшого терпения. Вы должны тщательно создать свои запросы ввода, подготовиться к устранению неполадок и иногда начинать с фронта. Облачная версия может компенсировать некоторые из них позже, но в настоящее время ограничения, которые они не могут работать или реагировать в разговоре, устанавливают свой иначе гибкий характер.
И скорость также может быть разочаровывающей. Посмотрите видео моего второго теста. Это четырехкратная скорость фактического процесса.
На данный момент использование браузеров лучше всего подходит для людей, которые любят Tinker, таких как разработчики, исследователи и уроды автоматизации, которые бесполезны, чтобы испачкать руки. Если вы готовы попробовать, вы получите мощный, гибкий инструмент, который стоит намного дешевле, чем конкуренция.
Однако, если вы предпочитаете не проводить борьбу на выходных с помощью файлов конфигурации, оператор может быть более прощающим вариантом. В любом случае, веб -автоматизация готова к буму.