Eureka! La recherche NVIDIA a permis une percée dans l’apprentissage des robots, ce qui leur permettra de mieux interpréter leur environnement

Un nouvel agent IA développé par NVIDIA Research qui peut enseigner aux robots des compétences complexes a formé une main robotique à effectuer des astuces de spinning de stylo rapides – pour la première fois aussi bien qu’un humain peut. La prestidigitation étonnante, mise en valeur dans la vidéo ci-dessus, est une des près de 30 tâches que les robots ont appris à accomplir avec expertise grâce à Eureka, qui écritautonomement des algorithmes de récompense pour former les bots. Eureka a également appris aux robots comment ouvrir des tiroirs et des armoires, lancer et attraper des balles, et manipuler des ciseaux, entre autres tâches. La recherche Eureka, publiée aujourd’hui, comprend un article et les algorithmes IA du projet, que les développeurs peuvent expérimenter en utilisant NVIDIA Isaac Gym, une application de référence de simulation de physique pour la recherche d’apprentissage par renforcement. Isaac Gym est construit sur NVIDIA Omniverse, une plateforme de développement pour construire des outils et des applications 3D basés sur le framework OpenUSD. Eureka est elle-même alimentée par le modèle de langage GPT-4 Large. « L’apprentissage par renforcement a permis d’impressionnants gains au cours des 10 dernières années, et pourtant de nombreux défis existent encore, tels que la conception de récompenses, qui reste un processus d’essai et d’erreur », a déclaré Anima Anandkumar, directrice principale de la recherche en IA chez NVIDIA et auteure de l’article Eureka. « Eureka est une première étape vers le développement de nouveaux algorithmes intégrant des méthodes d’apprentissage génératif et par renforcement pour résoudre des tâches difficiles. »

Share the Post: