Jan Leike d’OpenAI s’efforce de s’assurer que l’IA super intelligente reste de notre côté.

OpenAI, qui fabrique ChatGPT, est convaincue qu’elle est sur le point de transformer notre monde avec des systèmes d’IA puissants. Au minimum, elle pense que cela changera fondamentalement la façon dont nous travaillons et vivons. Au maximum, cela pourrait rendre notre monde méconnaissable du jour au lendemain. Pour que cela se passe bien, au lieu de mal catastrophiquement, OpenAI a créé ce qu’elle appelle l’équipe de superalignement, qui essaie de comprendre comment faire en sorte que des IA surhumaines fassent ce que nous voulons, au lieu de faire ce qu’elles veulent. La chef d’équipe est Jan Leike, une chercheuse en apprentissage machine qui a travaillé chez DeepMind de Google avant de rejoindre OpenAI. Son équipe est en course contre la montre : l’objectif est de comprendre comment aligner les puissants systèmes d’IA avant que des systèmes d’IA puissants et non alignés ne soient développés. (Un système d’IA est « aligné » s’il essaie de faire ce que les humains veulent, et « non aligné » s’il essaie de faire autre chose en dehors de notre contrôle. Une grande question sans réponse est de savoir à quel point nous pouvons bien comprendre ce que nos systèmes d’IA essaient de faire.) «Je pense que l’alignement est abordable», a déclaré Jan Leike à Rob Wiblin lors d’un podcast de 80 000 heures en août. «Je pense que nous pouvons en fait faire beaucoup de progrès si nous nous y concentrons et y mettons des efforts. … Honnêtement, cela ressemble vraiment à ce que nous avons une véritable ouverture sur le problème sur laquelle nous pouvons réellement itérer, nous pouvons réellement construire. Et je pense que c’est assez probable que cela fonctionne, en fait. Et c’est vraiment, vraiment sauvage, et c’est vraiment excitant. C’est comme si nous avions ce problème difficile dont nous parlons depuis des années et des années, et maintenant nous avons une chance réelle de le résoudre. »

Share the Post: