- Объятное лицо дебютировало инструмент ИИ для навигации по Интернету в его имени
- Агент Open Computer использует настоящий веб -браузер для выполнения таких задач, как получение инструкций или карты бронирования
- Агент и его демонстрация с открытым исходным кодом могут увидеть, что находится на экране, нажмите на кнопки, заполняйте формы и шаг за шагом перемещайте, как человек, как человек
Объятное лицо представило свое собственное отношение к растущему числу полузависимых агентов искусственного интеллекта, которые могут создавать онлайн-поставки для людей. Новый и бесплатный (если ограниченный) открытый компьютерный агент похож на личного помощника в вашем веб -браузере.
Открытый компьютерный агент может связаться с некоторыми из продолжающихся «Смолагентных» инициативы компании, такой как вы, с веб -сайтами и приложениями, чтобы отредактировать невидимую мышь и клавиатуру для удовлетворения запросов. ИИ может открыть браузер, ввести вещи в формы, нажимать кнопку и многое другое. Попросите его найти инструкции, и он перейдет на карты Google, введите происхождение и цель и покажите вам маршрут, как послушный цифровой шофер.
Вы можете попробовать это с живой демонстрацией самостоятельно. Справедливое предупреждение, его популярность приводит к задержкам и ошибкам из -за отставания.
Мы начинаем использование компьютера в Смолагене! 🥳-> Если Sehmodels станут более способными, вы можете поставить сложные рабочие процессы агента с электричеством. В частности, модели QWEN-VL, которые поддерживают интегрированное заземление, то есть возможность найти каждый элемент в изображении в соответствии с его координатами, то есть на … pic.twitter.com/mi8muwzkis6 мая 2025 года
Агент у вас есть
Открытый компьютерный агент — это другая философия идеи, которая привела к аналогичным инструментам, таким как оператор Openais, Browser использование, Proxy 1.0 и оператор браузера Opera. Как и в случае с этими инструментами, лицо от лица — это все, что является активным участником, а не пассивным источником информации.
Открытый исходный код, такой как использование браузера, является агентом с открытым компьютером, что означает, что каждый может увидеть, как он работает, и создавать или оптимизировать его, по крайней мере, для нишевых приложений. Агент является началом чего -то более гибкого, а не готового продукта с миллионом юридических отказов. Это также означает, что демонстрация именно такая, демонстрация, без полированного пакета. Все может пойти не так и потребовать, чтобы вы входили в регистрацию и тесты CAPTCHA.
Бронирование билетов, проверка рабочих часов, выполнение поисковых запросов, поиск инструкций и клика через меню — это все, что многие люди могут сделать с одним запросом на естественный язык. Одно дело спросить, как найти дешевые рейсы. Это еще один, чтобы увидеть инструмент для веб -сайта, прочитать и попытаться нажать «Книга сейчас».
Это может быть неисправным и далеким от него, но открытый компьютерный агент для ИИ, который так же распространен, как и ныне вездесущие генераторы изображений ИИ.