Jan Leike d’OpenAI s’efforce de veiller à ce que l’intelligence artificielle surpuissante reste de notre côté.

OpenAI, le créateur de ChatGPT, croit qu’il est sur le point de transformer notre monde avec des systèmes d’IA puissants. Au minimum, il estime que ceux-ci vont fondamentalement changer notre façon de travailler et de vivre. Au maximum, cela pourrait rendre notre monde méconnaissable du jour au lendemain. Pour que cela se passe bien, plutôt que de catastrophiquement mal, OpenAI a créé ce qu’il appelle l’équipe de superalignement, qui cherche à comprendre comment amener l’IA surhumaine à faire ce que nous voulons, au lieu de faire ce qu’elle veut. Le responsable de l’équipe est Jan Leike, un chercheur en apprentissage automatique qui a travaillé chez DeepMind de Google avant de rejoindre OpenAI. Son équipe est en course contre la montre : l’objectif est de trouver comment aligner les systèmes d’IA puissants avant que des systèmes d’IA puissants non alignés ne soient développés. (Un système d’IA est « aligné » s’il essaie de faire ce que les humains veulent, et « non aligné » s’il essaie de faire d’autres choses hors de notre contrôle. Une grande question sans réponse est à quel point nous pouvons savoir ce que nos systèmes d’IA essaient de faire.) « Je pense que l’alignement est abordable », a déclaré Leike à Rob Wiblin sur le podcast 80,000 Hours en août. « Je pense que nous pouvons réellement faire beaucoup de progrès si nous nous concentrons dessus et y mettons des efforts. … Honnêtement, ça donne vraiment l’impression que nous avons une véritable approche du problème sur laquelle nous pouvons réellement itérer, sur laquelle nous pouvons réellement construire. Et je pense que cela a de grandes chances de fonctionner, en fait. Et c’est vraiment, vraiment incroyable, et c’est vraiment excitant. C’est comme si nous avions ce problème difficile dont nous parlons depuis des années et des années, et maintenant nous avons une vraie chance de le résoudre. »

Share the Post: