Si l’IA rend le test de Turing obsolète, qu’est-ce qui pourrait être mieux à la place?

Si une machine ou un programme IA parvient à égaler ou à surpasser l’intelligence humaine, cela signifie-t-il qu’elle peut parfaitement simuler les êtres humains ? Si oui, que dire alors de la raisonnement – notre capacité d’appliquer la logique et de réfléchir rationnellement avant de prendre des décisions ? Comment pourrions-nous même identifier si un programme IA est capable de raisonner ? Pour tenter de répondre à cette question, une équipe de chercheurs a proposé un nouveau cadre qui fonctionne comme une étude psychologique pour le logiciel. « Ce test traite un programme ‘intelligent’ comme s’il s’agissait d’un participant à une étude psychologique et comporte trois étapes : (a) tester le programme dans une série d’expériences visant à examiner ses inférences, (b) tester sa compréhension de sa propre façon de raisonner, et (c) examiner, si possible, l’aptitude cognitive du code source du programme », expliquent les chercheurs. Ils suggèrent que les méthodes standard d’évaluation de l’intelligence d’une machine, telles que le test de Turing, ne peuvent vous dire si la machine est bonne à traiter les informations et à imiter les réactions humaines. Les générations actuelles de programmes IA, tels que LaMDA de Google et ChatGPT d’OpenAI, par exemple, ont réussi à passer le test de Turing, mais les résultats du test n’impliquent pas que ces programmes puissent penser et raisonner comme les êtres humains. C’est pourquoi le test de Turing n’est peut-être plus pertinent, et il y a un besoin de nouvelles méthodes d’évaluation qui pourraient évaluer efficacement l’intelligence des machines, selon les chercheurs. Ils affirment que leur cadre pourrait être une alternative au test de Turing. « Nous proposons de remplacer le test de Turing par un test plus ciblé et plus fondamental pour répondre à la question : les programmes raisonnent-ils de la même façon que les êtres humains ? » Les auteurs de l’étude argumentent. Au cours du test de Turing, les évaluateurs jouent différents jeux impliquant une communication basée sur le texte avec des êtres humains réels et des programmes IA (machines ou chatbots). Il s’agit d’un test aveugle, de sorte que les évaluateurs ne savent pas s’ils communiquent par texto avec un être humain ou un chatbot. Si les programmes IA réussissent à générer des réponses similaires à celles des êtres humains – à un point tel que les évaluateurs ont du mal à distinguer entre l’être humain et le programme IA – on considère que l’IA a réussi. Cependant, étant donné que le test de Turing repose sur une interprétation subjective, ces résultats sont également subjectifs.

Share the Post: