Jan Leike d’OpenAI s’efforce de s’assurer que l’IA superintelligente demeure de notre côté.

OpenAI, l’auteur de ChatGPT, croit qu’il est sur le point de transformer notre monde avec des systèmes d’IA puissants. Au minimum, il pense que cela changera fondamentalement la façon dont nous travaillons et vivons. Au maximum, cela pourrait rendre notre monde méconnaissable du jour au lendemain. Pour que cela se passe bien, au lieu de mal catastrophiquement, OpenAI a créé ce qu’il appelle l’équipe de superalignement, qui essaie de comprendre comment faire fonctionner correctement les systèmes d’IA surhumains, au lieu de les laisser faire ce qu’ils veulent. Le chef de l’équipe est Jan Leike, un chercheur en apprentissage machine qui a travaillé chez DeepMind de Google avant de rejoindre OpenAI. Son équipe est en compétition contre la montre : l’objectif est de comprendre comment aligner les puissants systèmes d’IA avant que les puissants systèmes d’IA mal alignés ne soient développés. (Un système d’IA est «aligné» s’il essaie de faire les choses que les humains veulent, et «mal aligné» s’il essaie de faire autre chose hors de notre contrôle. Une grande question reste sans réponse : à quel point pouvons-nous dire ce que nos systèmes d’IA essaient de faire en premier lieu?) «Je pense que l’alignement est réalisable», a déclaré Leike à Rob Wiblin dans l’émission de podcasts 80,000 Hours en août. «Je pense que nous pouvons réellement faire beaucoup de progrès si nous nous y concentrons et y mettons des efforts. … Honnêtement, cela ressemble vraiment à un vrai angle d’attaque du problème sur lequel nous pouvons réellement itérer, nous pouvons réellement nous y construire. Et je pense que c’est assez probable que cela fonctionne, en fait. Et c’est vraiment très sauvage, et c’est vraiment excitant. C’est comme si nous avions ce problème difficile dont nous parlons depuis des années, et maintenant nous avons une vraie chance de le résoudre. »

Share the Post: