Сегодня у NVIDIA обнародован Эврика, агент искусственного интеллекта для обучения роботов, использующий возможности OpenAI GPT-4. Этот новаторский агент обещает изменить способ обучения роботов, предоставив им возможность решать сложные задачи с повышенной точностью и автономностью.

Уникальный подход Eureka предполагает автономное создание алгоритмов вознаграждения для обучения роботов. Возможно, немного пугающий, но, тем не менее, впечатляющий, этот метод позволил роботам научиться множеству задач, включая, например, открытие шкафов и манипулирование ножницами. В общей сложности роботы были обучены почти 30 различным задачам с помощью Eureka, что демонстрирует ее огромный потенциал.

Ранее в этом году в сообществе искусственного интеллекта появились такие агенты, как Auto-GPT и BabyAGI. Теперь Eureka развивает эту тенденцию, и ее интеграция с GPT-4 подчеркивает приверженность Nvidia исследованиям искусственного интеллекта.

GPT-4: движущая сила Эврики

Интегрируя генеративное обучение и обучение с подкреплением, Eureka решает проблемы, которые уже давно преследуют сектор искусственного интеллекта. В частности, традиционное обучение с подкреплением часто имело проблемы с дизайном вознаграждений. Анима Анандкумар, старший директор Nvidia по исследованиям искусственного интеллекта, подчеркивает прорыв в дизайне вознаграждений, заявляя: «Эврика — это первый шаг на пути к разработке новых алгоритмов, которые объединяют методы генеративного обучения и обучения с подкреплением для решения сложных задач».

Сообщается, что программы вознаграждения Eureka, которые облегчают обучение роботов методом проб и ошибок, превосходят программы, написанные человеком, более чем в 80% задач. По словам команды Nvidia, это привело к увеличению производительности роботов более чем на 50%. Эти результаты обусловлены тем, что агент ИИ использует GPT-4 OpenAI и генеративный ИИ для создания программного кода, вознаграждая роботов во время обучения с подкреплением.

Используя моделирование с ускорением графического процессора в Isaac Gym от Nvidia, Eureka может эффективно оценивать качество многочисленных кандидатов на вознаграждение, оптимизируя обучение. ИИ постоянно совершенствуется, направляя различных роботов, от ловких рук до двуногих роботов, в выполнении разнообразных задач.

ЧИТАТЬ  Украшение вашей гостиной: необходимая мебель - Rêves de Déco

Говоря о ловкости, старший научный сотрудник Nvidia Линси «Джим» Фан подчеркнул сочетание Eureka GPT-4 и технологий моделирования с графическим ускорением Nvidia. Фан заявил: «Мы верим, что Eureka обеспечит ловкое управление роботами и предоставит художникам новый способ создания физически реалистичной анимации».

Исследование команды бумага предоставляет дополнительную информацию об Eureka, например, о том, как она использует эволюционные процессы для оптимизации кода вознаграждения.

Сочетание Nvidia больших языковых моделей с технологиями моделирования с ускорением на графическом процессоре в Eureka подчеркивает видение компании будущего искусственного интеллекта. В зависимости от точки зрения, с обучающими роботами Eureka, способными превзойти людей, возможности могут быть безграничными или, возможно, это конец.

Максвелл Уильям

Максвелл Уильям, опытный криптожурналист и специалист по контент-стратегии, внес значительный вклад в развитие ведущих отраслевых платформ, таких как Cointelegraph, OKX Insights и Decrypt, объединяя сложные крипто-рассказы в содержательные статьи, которые находят отклик у широкой читательской аудитории.



Source link