Jan Leike d’OpenAI essaie de s’assurer que l’IA superintelligente reste de notre côté.

OpenAI, le créateur de ChatGPT, croit qu’il est sur le point de transformer notre monde avec des systèmes d’IA puissants. Au minimum, il pense que cela changera fondamentalement la façon dont nous travaillons et vivons. Au maximum, cela pourrait rendre notre monde méconnaissable du jour au lendemain. Pour que cela se passe bien, au lieu de mal finir catastrophiquement, OpenAI a créé ce qu’il appelle l’équipe de superalignement, qui essaie de comprendre comment faire fonctionner une IA surhumaine de la manière dont nous le voulons, au lieu de faire ce qu’elle veut. L’équipe est dirigée par Jan Leike, un chercheur en apprentissage machine qui a travaillé chez DeepMind de Google avant de rejoindre OpenAI. Son équipe est en course contre la montre : l’objectif est de comprendre comment aligner les puissants systèmes d’IA avant que des systèmes d’IA puissants et mal alignés ne soient développés. (Un système d’IA est «aligné» s’il essaie de faire les choses que les humains veulent, et «mal aligné» s’il essaie de faire d’autres choses en dehors de notre contrôle. Une grande question non résolue est de savoir à quel point nous pouvons savoir ce que nos systèmes d’IA essaient de faire.) «Je pense que l’alignement est abordable», a déclaré Leike à Rob Wiblin lors d’un podcast de 80 000 heures en août. «Je pense que nous pouvons réellement faire beaucoup de progrès si nous nous y concentrons et y mettons des efforts. … Honnêtement, cela ressemble vraiment à ce que nous avons une vraie approche du problème sur laquelle nous pouvons itérer, nous pouvons réellement construire. Et je pense que c’est assez probable que cela fonctionne, en fait. Et c’est vraiment sauvage, et c’est vraiment excitant. C’est comme si nous avions ce problème difficile dont nous parlons depuis des années et des années, et maintenant nous avons une vraie chance de le résoudre. »

Share the Post: