Jan Leike d’OpenAI s’efforce de s’assurer que l’IA super intelligente reste de notre côté.

OpenAI, l’auteur de ChatGPT, croit qu’il est sur le point de transformer notre monde avec de puissants systèmes d’IA. Au minimum, il pense que cela changera fondamentalement la façon dont nous travaillons et vivons. Au maximum, cela pourrait rendre notre monde méconnaissable overnight. Pour que cela se passe bien, au lieu de catastrophiquement mal, OpenAI a créé ce qu’il appelle l’équipe superalignée, qui essaie de comprendre comment faire fonctionner les systèmes d’IA surhumains de la manière dont nous le souhaitons, au lieu de faire ce qu’ils veulent. Le responsable de l’équipe est Jan Leike, un chercheur en apprentissage automatique qui a travaillé chez DeepMind de Google avant de rejoindre OpenAI. Son équipe est en course contre la montre : l’objectif est de comprendre comment aligner les puissants systèmes d’IA avant que des systèmes d’IA puissants et non alignés ne soient développés. (Un système d’IA est «aligné» s’il essaie de faire les choses que les humains veulent, et «non aligné» s’il essaie de faire d’autres choses que nous ne contrôlons pas. Une grande question sans réponse est de savoir à quel point nous pouvons bien comprendre ce que nos systèmes d’IA essaient de faire.) «Je pense que l’alignement est abordable», a déclaré Leike à Rob Wiblin dans le podcast 80,000 Hours en août. «Je pense que nous pouvons réellement faire beaucoup de progrès si nous nous y concentrons et y mettons de l’effort. … Honnêtement, cela ressemble vraiment à un vrai angle d’attaque sur le problème sur lequel nous pouvons réellement itérer, nous pouvons réellement nous y construire. Et je pense que c’est assez probable que cela fonctionne, en fait. Et c’est vraiment, vraiment sauvage, et c’est vraiment excitant. C’est comme si nous avions ce problème difficile dont nous parlons depuis des années et des années, et maintenant nous avons une vraie chance de le résoudre. »

Share the Post: