Eureka ! La recherche NVIDIA a permis une percée en matière d’apprentissage robotique.

Un nouvel agent d’IA développé par NVIDIA Research qui peut enseigner aux robots des compétences complexes a entraîné une main robotique à effectuer des tours de prestidigitation rapides – pour la première fois aussi bien qu’un humain peut. La prestidigitation étonnante, mise en valeur dans la vidéo ci-dessus, est l’une des près de 30 tâches que les robots ont appris à accomplir avec expertise grâce à Eureka, qui écrit autonomement des algorithmes de récompense pour former des bots. Eureka a également appris aux robots comment ouvrir des tiroirs et des armoires, lancer et attraper des balles, et manipuler des ciseaux, entre autres tâches. La recherche Eureka, publiée aujourd’hui, comprend un article et les algorithmes d’IA du projet, que les développeurs peuvent expérimenter avec NVIDIA Isaac Gym, une application de référence de simulation de physique pour la recherche d’apprentissage par renforcement. Isaac Gym est construit sur NVIDIA Omniverse, une plateforme de développement pour la construction d’outils et d’applications 3D basés sur le framework OpenUSD. Eureka elle-même est alimentée par le modèle de langage GPT-4 large. «L’apprentissage par renforcement a permis des gains impressionnants au cours de la dernière décennie, et pourtant de nombreux défis existent toujours, tels que la conception de récompenses, qui reste un processus d’essai et d’erreur», a déclaré Anima Anandkumar, directrice principale de la recherche en IA chez NVIDIA et auteur de l’article Eureka. «Eureka est une première étape vers le développement de nouveaux algorithmes qui intègrent des méthodes d’apprentissage par génération et d’apprentissage par renforcement pour résoudre des tâches difficiles.»

Share the Post: