Si l’IA rend le test de Turing obsolète, qu’est-ce qui pourrait être mieux?

Si une machine ou un programme IA parvient à égaler ou à surpasser l’intelligence humaine, cela signifie-t-il qu’elle peut parfaitement simuler les êtres humains? Si c’est le cas, que dire de la raisonnement – notre capacité d’appliquer la logique et de réfléchir rationnellement avant de prendre des décisions? Comment pourrions-nous même identifier si un programme IA peut raisonner? Pour essayer de répondre à cette question, une équipe de chercheurs a proposé un nouveau cadre qui fonctionne comme une étude psychologique pour le logiciel. «Ce test traite un programme «intelligent» comme s’il était un participant à une étude psychologique et comporte trois étapes: (a) tester le programme dans un ensemble d’expériences qui examinent ses inférences, (b) tester sa compréhension de sa propre logique de raisonnement, et (c) examiner, si possible, l’aptitude cognitive du code source du programme», expliquent les chercheurs. Ils suggèrent que les méthodes standard d’évaluation de l’intelligence d’une machine, telles que le test de Turing, ne peuvent vous dire si la machine est bonne pour traiter les informations et imiter les réactions humaines. Les générations actuelles de programmes IA, tels que LaMDA de Google et ChatGPT d’OpenAI, par exemple, ont approché le test de Turing, mais les résultats du test ne impliquent pas que ces programmes puissent penser et raisonner comme les êtres humains. C’est pourquoi le test de Turing n’est peut-être plus pertinent, et il y a un besoin de nouvelles méthodes d’évaluation qui puissent effectivement évaluer l’intelligence des machines, selon les chercheurs. Ils prétendent que leur cadre pourrait être une alternative au test de Turing. «Nous proposons de remplacer le test de Turing par un test plus ciblé et plus fondamental pour répondre à la question: les programmes raisonnent-ils de la même manière que les êtres humains?», Estiment les auteurs de l’étude. Lors du test de Turing, les évaluateurs jouent à différents jeux impliquant des communications basées sur le texte avec des êtres humains et des programmes IA (machines ou chatbots) réels. Il s’agit d’un test aveugle, de sorte que les évaluateurs ne savent pas s’ils communiquent par texto avec un être humain ou un chatbot. Si les programmes IA réussissent à générer des réponses semblables à celles des êtres humains – à tel point que les évaluateurs ont du mal à faire la distinction entre l’être humain et le programme IA – on considère que l’IA a réussi. Cependant, étant donné que le test de Turing repose sur une interprétation subjective, ces résultats sont également subjectifs.

Share the Post: