Jan Leike d’OpenAI s’efforce de s’assurer que l’intelligence artificielle surpuissante reste de notre côté.

OpenAI, le créateur de ChatGPT, pense être sur le point de transformer notre monde avec de puissants systèmes d’IA. Au minimum, il pense que ceux-ci vont fondamentalement changer la manière dont nous travaillons et vivons. Au maximum, cela pourrait rendre notre monde méconnaissable du jour au lendemain. Pour que cela se passe bien, plutôt que de se passer de manière catastrophique, OpenAI a créé ce qu’il appelle l’équipe de superalignement, qui tente de comprendre comment faire en sorte que l’IA surhumaine fasse ce que nous voulons, au lieu de faire sa propre chose. Le responsable de l’équipe est Jan Leike, un chercheur en apprentissage automatique qui a travaillé chez DeepMind de Google avant de rejoindre OpenAI. Son équipe est en course contre la montre : l’objectif est de trouver comment aligner les puissants systèmes d’IA avant que des systèmes d’IA puissants et désalignés ne soient développés. (Un système d’IA est « aligné » s’il essaie de faire ce que les humains veulent, et « désaligné » s’il essaie de faire d’autres choses en dehors de notre contrôle. Une grande question sans réponse est de savoir dans quelle mesure nous pouvons savoir ce que font réellement nos systèmes d’IA.) « Je pense que l’alignement est réalisable », a déclaré Leike à Rob Wiblin dans le podcast 80 000 Hours en août. « Je pense que nous pouvons réellement faire beaucoup de progrès si nous nous y concentrons et que nous y mettons des efforts… Honnêtement, on a vraiment l’impression d’avoir une véritable voie d’attaque sur le problème, sur laquelle nous pouvons itérer, vers laquelle nous pouvons réellement avancer. Et je pense que cela a de grandes chances de fonctionner, en fait. Et c’est vraiment incroyable, et c’est vraiment excitant. C’est comme si nous avions ce problème difficile dont nous parlons depuis des années et des années, et maintenant nous avons une réelle chance de le résoudre. « 

Share the Post: