- Роботы по-прежнему быстро выходят из строя, если их вывести из предсказуемой производственной среды.
- Microsoft Rho-alpha напрямую связывает понимание языка с управлением движениями роботов
- Тактильное восприятие играет центральную роль в устранении разрыва между программным обеспечением и физическим действием.
Роботы уже давно надежно работают в жестко контролируемых промышленных средах с предсказуемыми условиями и ограниченными вариациями, но за их пределами они часто испытывают трудности.
Чтобы решить эту проблему, Microsoft объявила Ро Альфапервая модель робототехники, основанная на серии языков видения Phi, утверждает, что роботам нужны лучшие способы видеть и понимать инструкции.
Компания считает, что системы могут работать за пределами сборочных конвейеров, реагируя на меняющиеся условия, а не следуя жестким сценариям.
Для чего создавался Ро-альфа
Microsoft связывает это с так называемым физическим ИИ, где ожидается, что модели программного обеспечения будут направлять машины в менее структурированных ситуациях.
Он сочетает в себе язык, восприятие и действие, уменьшая зависимость от фиксированных производственных линий или инструкций.
Rho-alpha переводит команды на естественном языке в сигналы управления роботом и фокусируется на задачах бимануального манипулирования, которые требуют координации между двумя руками робота и детального управления.
Microsoft характеризует систему как расширение типичных подходов VLA за счет расширения как перцептивных, так и обучающих входных данных.
«Появление моделей «Видение-Язык-Действие» (VLA) для физических систем позволяет системам воспринимать, думать и действовать все более автономно вместе с людьми в средах, которые гораздо менее структурированы», — сказала Эшли Льоренс, корпоративный вице-президент и управляющий директор Microsoft Research Accelerator.
Помимо зрительного восприятия, Rho-Alpha также включает в себя тактильное восприятие, а также другие способы восприятия, такие как обнаружение силы, которое находится в постоянной разработке.
Эти проектные решения предполагают попытку сократить разрыв между симулируемым интеллектом и физическим взаимодействием, но их эффективность все еще оценивается.
Центральная часть подхода Microsoft опирается на моделирование для обработки ограниченных крупномасштабных робототехнических данных, особенно данных, связанных с прикосновением.
Обучение с внутренним подкреплением создает синтетические траектории Nvidia Isaac Sim, а затем в сочетании с физическими демонстрациями из коммерческих и открытых наборов данных.
«Создание базовых моделей, способных рассуждать и действовать, требует преодоления нехватки разнообразных реальных данных», — сказал Дипу Талла, вице-президент по робототехнике и периферийному искусственному интеллекту в Nvidia.
«Используя NVIDIA Isaac Sim в Azure для создания физически точных синтетических наборов данных, Microsoft Research ускоряет разработку универсальных моделей, таких как Rho-alpha, которые могут решать сложные задачи манипулирования».
Microsoft также уделяет большое внимание корректирующему вмешательству человека во время развертывания, позволяя операторам вмешиваться с помощью устройств телеуправления и предоставлять обратную связь, на которой система может учиться с течением времени.
Этот цикл обучения сочетает в себе моделирование, реальные данные и корректировки, вносимые человеком, что отражает растущую зависимость от инструментов искусственного интеллекта для компенсации скудных наборов встроенных данных.
Профессор Абхишек Гупта, доцент Вашингтонского университета, сказал: «Хотя получение обучающих данных посредством телеуправления роботизированными системами стало стандартной практикой, существует множество ситуаций, когда телеуправление непрактично или невозможно».
«Мы работаем с Microsoft Research, чтобы обогатить наборы данных перед обучением, собранные с физических роботов, различными синтетическими демонстрациями, используя комбинацию моделирования и обучения с подкреплением».
Следите за TechRadar в Новостях Google. И Добавьте нас в качестве предпочтительного источника чтобы получать новости, обзоры и мнения наших экспертов в своих лентах. Обязательно нажмите кнопку «Подписаться»!
И ты, конечно, тоже можешь Следите за TechRadar в TikTok за новостями, обзорами, распаковками в видео-форме и получайте от нас регулярные обновления WhatsApp к.

