« Eureka! La recherche NVIDIA fait une percée qui ouvre de nouvelles perspectives dans l’apprentissage des robots »

Un nouvel agent IA développé par NVIDIA Research qui peut enseigner aux robots des compétences complexes a entraîné une main robotique à effectuer des tours de stylo rapides – pour la première fois aussi bien qu’un être humain peut. La prestidigitation étonnante, mise en valeur dans la vidéo ci-dessus, est l’une des près de 30 tâches que les robots ont apprises à accomplir avec expertise grâce à Eureka, qui écrit autonomement des algorithmes de récompense pour former des bots. Eureka a également appris aux robots comment ouvrir des tiroirs et des armoires, lancer et attraper des balles et manipuler des ciseaux, entre autres tâches. La recherche Eureka, publiée aujourd’hui, comprend un article et les algorithmes IA du projet, que les développeurs peuvent expérimenter en utilisant NVIDIA Isaac Gym, une application de référence de simulation physique pour la recherche d’apprentissage par renforcement. Isaac Gym est construit sur NVIDIA Omniverse, une plateforme de développement permettant de créer des outils et des applications 3D basés sur le framework OpenUSD. Eureka est elle-même alimentée par le grand modèle de langage GPT-4. « L’apprentissage par renforcement a permis d’impressionnants succès au cours de la dernière décennie, et pourtant de nombreux challenges existent encore, tels que la conception de récompenses, qui reste un processus d’essais et d’erreurs », a déclaré Anima Anandkumar, directrice principale de la recherche en IA chez NVIDIA et auteur de l’article Eureka. « Eureka est une première étape vers le développement de nouveaux algorithmes intégrant des méthodes d’apprentissage génératif et par renforcement pour résoudre des tâches difficiles. »

Share the Post: