Auto-GPT — это революционная технология, которая раскрывает новые возможности ChatGPT, позволяя ему выполнять задачи самостоятельно, создавая собственные подсказки для выполнения работы.
Ажиотаж вокруг Auto-GPT недавно превзошел сам ChatGPT, занимая первое место в Твиттере несколько дней подряд.
Содержание
Что такое Auto-GPT?
Auto-GPT — это экспериментальный интерфейс с открытым исходным кодом для GPT-4 и GPT-3.5, который обеспечивает самостоятельное (автономное) выполнение задач.
Нужно только предоставить список задач, которые необходимо выполнить, и Auto-GPT их выполнит.
В отличие от ChatGPT, который требует многочисленных подробных подсказок, Auto-GPT генерирует свои собственные подсказки для достижения поставленных целей.
При необходимости Auto-GPT будет получать доступ к веб-сайтам и поисковым системам для сбора данных для выполнения задач.
Что делает его способность собирать внешние данные экстраординарной, так это то, что Auto-GPT самостоятельно оценивает и может проверять точность собранных данных и отбрасывать то, что неверно или не соответствует стандартам, и порождать новую подзадачу для сбора более качественных данных.
Благодаря этой способности самостоятельно генерировать подсказки для выполнения задач его называют автономным агентом ИИ.
Официальный Страница GitHub для Auto-GPT описывает это так:
«Auto-GPT — это экспериментальное приложение с открытым исходным кодом, демонстрирующее возможности языковой модели GPT-4.
Эта программа, управляемая GPT-4, объединяет «мысли» LLM для автономного достижения любой поставленной цели.
Как один из первых примеров полностью автономной работы GPT-4, Auto-GPT раздвигает границы возможного с помощью ИИ».
Чтобы использовать Auto-GPT, необходимо сначала создать платный аккаунт в OpenAI.
После создания платной учетной записи следующим шагом будет получение API OpenAI который подключит Auto-GPT к вашей учетной записи доступа OpenAI и выставит вам счет за любые суммы, которые вы используете.
API означает интерфейс прикладного программирования.
Это технология, позволяющая программному обеспечению безопасно взаимодействовать с другим программным обеспечением.
API позволяет Auto-GPT взаимодействовать с OpenAI GPT-4 и ChatGPT.
OpenAI объясняет, как работает их API:
«API OpenAI можно применять практически к любой задаче, связанной с пониманием или созданием естественного языка, кода или изображений.
Мы предлагаем спектр моделей с разным уровнем мощности, подходящих для разных задач, а также возможность тонкой настройки собственных пользовательских моделей.
Эти модели можно использовать для всего: от генерации контента до семантического поиска и классификации.
…API основан на наборе моделей с различными возможностями и ценовыми категориями.
GPT-4 — наша последняя и самая мощная модель.
GPT-3.5-Turbo — это модель, которая поддерживает ChatGPT и оптимизирована для разговорных форматов».
Владельцы учетных записей OpenAI могут установить жесткие ограничения на то, сколько OpenAI будет взимать плату, и когда предел будет достигнут, служба перестанет работать.
Пользователи также могут установить мягкий лимит, который будет отправлять уведомления по электронной почте, чтобы предупредить владельца учетной записи, когда установленный лимит будет достигнут.
Ценообразование основано на сборе за единицу измерения, называемую токеном.
Токен можно рассматривать как измерение слов.
OpenAI определяет токены так:
«Для английского текста 1 токен составляет примерно 4 символа или 0,75 слова».
Количество слов (токенов), отправляемых через API в виде подсказки, и количество токенов (слов), содержащихся в выводе, используются для расчета стоимости использования.
Сто токенов стоят доли копейки, 0,002 доллара США.
Примеры того, что может сделать Auto-GPT
Некто по имени Джон Миллер (@botzero_net) поделился в Твиттере умным примером того, что может сделать Auto-GPT.
Он твитнул:
«Цель ИИ:
Напишите генеративную арт-подсказку Midjourney, которая создаст шедевр, вызывающий страх у людей».
Миллер поделился подсказкой и полученным изображением, которое было автоматически создано Auto-GPT:
4/7
Сгенерированное AutoGPT приглашение:
Блуждая по разрушающемуся старинному замку, вы замечаете, что картины на стенах словно меняются на глазах. Сначала вы отмахиваетесь от этого как от игры света или собственного воображения. Но присмотревшись, понимаешь… pic.twitter.com/GYcDY25vAd— Джон Миллер (@botzero_net) 15 апреля 2023 г.
Еще одним примером использования Auto-GPT в Twitter является создание обзорной статьи.
Вау.. все еще не убеждены в агентах ИИ? Это может изменить ваше мнение…
Я представился поддельной обувной компанией и дал AutoGPT простую цель:
– Проведите исследование рынка водонепроницаемой обуви.
— Получите 5 лучших конкурентов и дайте мне отчет об их плюсах и минусахВот как это было: pic.twitter.com/mFttG4PXrk
— Салли (@SullyOmarr) 9 апреля 2023 г.
@SullyOmarr написал в твиттере, что произошло дальше:
«Во-первых: мы отправились прямо в Google, чтобы найти 5 лучших обзоров водонепроницаемой обуви.
Как только он нашел ссылки, он создал себе вопросы, такие как
- «Каковы плюсы и минусы каждой обуви»
- «Каковы плюсы и минусы каждой пятерки водонепроницаемых туфель»
- «5 лучших водонепроницаемых туфель для мужчин»»
Затем он задокументировал последующий анализ:
«Он продолжал анализировать различные сайты, комбинируя гугление и обновление своих запросов, пока не был доволен результатами.
Вот пример, когда он думал «критически».
Он знал, что некоторые обзоры могут быть предвзятыми, поэтому ему пришлось проверить рецензента».
Агент Auto-GPT породил подагентов, которым было поручено анализировать веб-сайты, которые использовались для исследований, и когда агент ИИ застрял, он нашел путь вперед без какой-либо посторонней помощи.
Наконец, он завершил задачу, создав многопараграфный анализ пяти туфель, перечислив плюсы и минусы каждой, а также введение и заключение.
Поразительно, но весь процесс исследования, анализа и создания занял всего восемь минут и десять центов использования GPT-4.
Результат?
Довольно подробный отчет о 5 лучших компаниях по производству водонепроницаемой обуви с указанием их плюсов и минусов, а также хорошим подведением итогов отчета.
О, и это заняло всего 8 минут по цене 10 центов.
Это тоже был довольно простой пример. Полностью неоптимизированный. pic.twitter.com/MZHvmf6tRP
— Салли (@SullyOmarr) 9 апреля 2023 г.
Как работает Auto-GPT?
Основная функция, которая поддерживает Auto-GPT, — это возможность использовать ChatGPT для независимого создания подсказок для планирования выполнения задачи, а затем для создания дополнительных подсказок для завершения этой задачи.
Если агент ИИ обнаружит, что не может выполнить задачу, он создаст новые подсказки, чтобы выяснить, как действовать дальше.
Auto-GPT — это агент искусственного интеллекта с автоматическими подсказками, который устраняет необходимость в творческих и подробных подсказках. Все, что ему нужно, это набор целей для выполнения задачи.
Он будет генерировать необходимые подсказки для выполнения задачи.
Можно сказать, что это качество Auto-GPT делает GPT-4 и ChatGPT еще более мощными и поразительно способными.
Один из секретов работы Auto-GPT заключается в том, что он может создавать подзадачи для каждой цели, разбивая каждую задачу на несколько шагов.
Управление памятью дает Auto-GPT возможность сохранять важные данные на короткий и длительный срок, чтобы не приходилось повторять шаги, хранить данные для обработки и вести текущий список того, что он делает.
На странице GitHub для Auto-GPT перечислены следующие важные функции, благодаря которым Auto-GPT работает:
- «Доступ в Интернет для поиска и сбора информации
- Доступ к популярным сайтам и платформам
- Управление долговременной и кратковременной памятью
- Хранение и обобщение файлов с помощью GPT-3.5
- Экземпляры GPT-4 для генерации текста».
Что нужно для работы Auto-GPT?
Auto-GPT не имеет простого пользовательского интерфейса, как многие программы для потребителей.
Но не позволяйте этому быть обескураживающим, потому что каждый может использовать его.
Есть два требования для использования Auto-GPT:
На странице Auto-GPT GitHub перечислены три среды на выбор:
- VSCode + devcontainer: он был настроен в папке .devcontainer и может использоваться напрямую.
- Докер
- Python 3.10 или новее
Страница GitHub также содержит ссылки на руководство по установка питона на виндовс.
Другие автономные агенты ИИ
Auto-GPT — не единственный автономный агент ИИ, есть еще один, называемый BabyAGI, который представляет собой скрипт на Python.
BabyAGI
Страница GitHub описывает это:
«Этот скрипт Python является примером системы управления задачами на базе ИИ. Система использует API OpenAI и Pinecone для создания, определения приоритетов и выполнения задач. Основная идея этой системы заключается в том, что она создает задачи на основе результатов предыдущих задач и заранее определенной цели.
Затем сценарий использует возможности обработки естественного языка (NLP) OpenAI для создания новых задач на основе цели и Pinecone для хранения и извлечения результатов задачи для контекста.
Это урезанная версия оригинального управляемого задачами автономного агента (28 марта 2023 г.)».
Если все это звучит сложно, у не-разработчиков все еще есть способ использовать агенты ИИ, такие как Auto-GPT и BabyAGI.
Простые способы запуска AI-агента
Темпы инноваций в области искусственного интеллекта невероятно высоки, и всего за две недели разработчики создали альтернативные способы запуска Auto-GPT с удобными интерфейсами.
Эти интерфейсы настолько новые, что в настоящее время находятся в экспериментальном или бета-режиме, но работают очень хорошо.
Cognosys.ai
Cognosys.ai — новый пользовательский веб-интерфейс агента ИИ. Вам по-прежнему нужен ключ API OpenAI для использования веб-интерфейса Cognosys.ai.
После того, как у вас есть ключ API OpenAI, следующим шагом будет вход с вашим идентификатором Google или создание логина и пароля.
Теперь использовать агента ИИ так же просто, как заполнить форму и посмотреть, как машина выполняет задачу.
Агент.gpt
Другой простой в использовании интерфейс называется AgentGPT, который находится в бета-версии. AgentGPT работает аналогично Cognosys.ai.
AgentGPT описывает себя так:
«AgentGPT позволяет настраивать и развертывать автономные агенты ИИ.
Назовите свой собственный ИИ, и пусть он приступит к любой мыслимой цели. Он будет пытаться достичь цели, думая о задачах, выполняя их и извлекая уроки из результатов ?
Эта платформа в настоящее время находится в стадии бета-тестирования, в настоящее время мы работаем над:
- Долгосрочная память
- Просмотр веб-страниц
- Взаимодействие с сайтами и людьми»
А твит от создателей AgentGPT углубляется в детали:
«Он работает с использованием моделей для создания списка задач, а затем итеративно выполняет задачи, оценивая, завершены ли задачи или требуют дальнейших поддействий.
В будущем у нас будет долговременная память через @pinecone, и мы дадим моделям возможность запрашивать информацию в Интернете…»
Божественный ИИ
Один из последних интерфейсов агента ИИ называется Godmode.
Чтобы использовать его, сначала создается задача. Интерфейс отвечает подсказками для использования, которые определяют задачу.
Выбор одной из подсказок запускает агент ИИ, который начинает свою работу.
Godmode требует входа в систему с помощью учетной записи Google, GitHub или Twitter.
Использование Godmode в настоящее время не требует ключа API OpenAI для работы, но его использование добавит мощность GPT-4 к выходным данным Godmode.
Автономные агенты ИИ
Некоторые люди сходят с ума по поводу ChatGPT.
Но автономные агенты ИИ, такие как Auto-GPT, показывают, что продукты OpenAI могут делать гораздо больше.
Прорыв в области автономных агентов искусственного интеллекта является совершенно новым и находится на переднем крае. Их производят разработчики, а не такие крупные компании, как OpenAI и Google.
Эти технологии все еще находятся на стадии экспериментов и бета-тестирования, но некоторые из них достаточно зрелые, чтобы выполнять удивительные задачи на уровне, ожидаемом от человека.
Такие технологии, как Auto-GPT, позволяют легко представить точку, в которой работодатели могут нанять одного человека для назначения задач агентам ИИ для выполнения работы пяти сотрудников.
Нетрудно представить себе время, когда работодатели смогут обойтись без надзирателя-человека и просто выпустить агента ИИ для управления агентами ИИ.
Избранное изображение Shutterstock/studiostoks