Jan Leike d’OpenAI s’efforce de s’assurer que l’IA superintelligente reste de notre côté.

OpenAI, l’auteur de ChatGPT, croit qu’il est sur le point de transformer notre monde avec des systèmes d’IA puissants. Au minimum, ces derniers changeront fondamentalement la façon dont nous travaillons et vivons. Au maximum, ils pourraient rendre notre monde méconnaissable du jour au lendemain. Pour réussir cela, au lieu de réussir catastrophiquement mal, OpenAI a créé ce qu’il appelle l’équipe de superalignement, qui essaie de comprendre comment faire de l’IA surhumaine ce que nous voulons, au lieu de faire sa propre chose. Le chef de l’équipe est Jan Leike, un chercheur en apprentissage machine qui a travaillé chez DeepMind de Google avant de rejoindre OpenAI. Son équipe est en compétition contre la montre : l’objectif est de comprendre comment aligner les puissants systèmes d’IA avant que les puissants systèmes d’IA non alignés ne soient développés. (Un système d’IA est «aligné» s’il essaie de faire ce que les humains veulent, et «non aligné» s’il essaie de faire autre chose en dehors de notre contrôle. Une grande question en suspens est de savoir à quel point nous pouvons comprendre ce que nos systèmes d’IA essaient de faire.) «Je pense que l’alignement est abordable», a déclaré Leike à Rob Wiblin lors d’un podcast de 80 000 heures en août. «Je pense que nous pouvons réellement progresser si nous nous y concentrons et y mettons de l’effort. … Honnêtement, cela ressemble vraiment à un véritable angle d’attaque sur le problème auquel nous pouvons itérer, nous pouvons construire vers lui. Et je pense que c’est assez probable que cela fonctionne, en fait. Et c’est vraiment, vraiment sauvage, et c’est vraiment excitant. C’est comme si nous avions ce problème difficile dont nous parlons depuis des années et des années, et maintenant nous avons une véritable chance de le résoudre. »

Share the Post: