Jan Leike d’OpenAI cherche à s’assurer que l’IA superintelligente reste de notre côté.

OpenAI, le créateur de ChatGPT, croit qu’il est sur le point de transformer notre monde avec de puissants systèmes d’IA. Au minimum, il pense que ceux-ci changeront fondamentalement notre façon de travailler et de vivre. Au maximum, cela pourrait rendre notre monde méconnaissable du jour au lendemain. Pour que cela se déroule bien, au lieu d’être catastrophiquement mauvais, OpenAI a créé ce qu’il appelle l’équipe de superalignement, qui tente de comprendre comment faire en sorte que l’IA superhumaine fasse ce que nous voulons, au lieu de faire sa propre chose. Le responsable de l’équipe est Jan Leike, un chercheur en apprentissage automatique qui a travaillé chez DeepMind, avant de rejoindre OpenAI. Son équipe est dans une course contre la montre : l’objectif est de savoir comment aligner les puissants systèmes d’IA avant que des systèmes d’IA puissants non alignés ne soient développés. (Un système d’IA est « aligné » s’il essaie de faire ce que les humains veulent, et « non aligné » s’il essaie de faire d’autres choses hors de notre contrôle. Une grande question sans réponse est de savoir dans quelle mesure nous pouvons dire ce que nos systèmes d’IA essaient de faire.) « Je pense que l’alignement est réalisable », a déclaré Leike à Rob Wiblin lors du podcast 80,000 Hours en août. « Je pense que nous pouvons vraiment faire beaucoup de progrès si nous nous concentrons dessus et y mettons des efforts. … Honnêtement, cela donne vraiment l’impression que nous avons une véritable approche du problème sur laquelle nous pouvons itérer, vers laquelle nous pouvons vraiment progresser. Et je pense que cela a de fortes chances de fonctionner, en fait. Et c’est vraiment incroyable, et c’est vraiment excitant. C’est comme si nous avions ce problème complexe dont nous parlons depuis des années et des années, et maintenant nous avons une vraie chance de le résoudre. »

Share the Post: