« Eureka! Une percée de NVIDIA Research transforme l’apprentissage des robots »

Un nouvel agent d’apprentissage automatique (IA) développé par NVIDIA Research qui peut enseigner aux robots des compétences complexes a entraîné une main robotique à effectuer des tours de prestidigitation rapides, pour la première fois aussi bien qu’un humain. La prestidigitation étonnante présentée dans la vidéo ci-dessus est l’une des près de 30 tâches que les robots ont apprises à accomplir avec expertise grâce à Eureka, qui écrit autonomement des algorithmes de récompense pour former les robots. Eureka a également appris aux robots comment ouvrir des tiroirs et des armoires, lancer et attraper des balles et manipuler des ciseaux, entre autres tâches. La recherche Eureka, publiée aujourd’hui, comprend un article et les algorithmes d’IA du projet, que les développeurs peuvent expérimenter avec l’aide de NVIDIA Isaac Gym, une application de référence de simulation de physique pour la recherche d’apprentissage par renforcement. Isaac Gym est construit sur NVIDIA Omniverse, une plateforme de développement permettant de créer des outils et des applications 3D basés sur le framework OpenUSD. Eureka lui-même est alimenté par le modèle de langage GPT-4. «L’apprentissage par renforcement a permis d’obtenir des gains impressionnants au cours de la dernière décennie, et pourtant de nombreux défis subsistent, tels que la conception de récompenses, qui reste un processus d’essais et d’erreurs», a déclaré Anima Anandkumar, directrice principale de la recherche en IA chez NVIDIA et auteur de l’article Eureka. «Eureka est une première étape vers le développement de nouveaux algorithmes intégrant des méthodes d’apprentissage par génération et d’apprentissage par renforcement pour résoudre des tâches difficiles.»

Share the Post: