Jan Leike d’OpenAI s’efforce de faire en sorte que l’intelligence artificielle surpuissante reste de notre côté.

OpenAI, le créateur de ChatGPT, croit qu’il est sur le point de transformer notre monde avec de puissants systèmes d’IA. Au minimum, il pense que ces systèmes changeront fondamentalement notre façon de travailler et de vivre. Au maximum, cela pourrait rendre notre monde méconnaissable du jour au lendemain. Pour que cela se déroule bien, au lieu d’être catastrophique, OpenAI a créé ce qu’il appelle l’équipe de superalignement, qui cherche à comprendre comment faire en sorte que l’IA surhumaine fasse ce que nous voulons, au lieu de faire sa propre chose. Le responsable de l’équipe est Jan Leike, un chercheur en apprentissage automatique qui a travaillé chez DeepMind de Google avant de rejoindre OpenAI. Son équipe est en course contre la montre : l’objectif est de trouver comment aligner les puissants systèmes d’IA avant que des systèmes d’IA puissants non alignés ne soient développés. (Un système d’IA est « aligné » s’il essaie de faire les choses que les humains veulent, et « non aligné » s’il essaie de faire d’autres choses hors de notre contrôle. Une grande question sans réponse est de savoir dans quelle mesure nous pouvons savoir ce que nos systèmes d’IA essaient de faire du tout.) « Je pense que l’alignement est gérable », a déclaré Leike à Rob Wiblin dans le podcast 80,000 Heures en août. « Je pense que nous pouvons réellement progresser si nous nous concentrons dessus et y mettons des efforts. … Honnêtement, on a vraiment l’impression d’avoir une véritable stratégie d’attaque du problème que nous pouvons réellement itérer, vers laquelle nous pouvons réellement avancer. Et je pense que cela a de fortes chances de fonctionner, en fait. Et c’est vraiment incroyable et passionnant. C’est comme si nous avions ce problème difficile dont nous parlons depuis des années et des années, et maintenant nous avons une réelle chance de le résoudre. »

Share the Post: