Si l’IA rend le test de Turing obsolète, qu’est-ce qui pourrait être mieux?

Si une machine ou un programme IA égale ou dépasse l’intelligence humaine, cela signifie-t-il qu’elle peut simuler parfaitement les êtres humains? Si oui, que se passe-t-il pour la raisonnement – notre capacité d’appliquer la logique et de penser rationnellement avant de prendre des décisions? Comment pourrions-nous même identifier si un programme IA peut raisonner? Pour essayer de répondre à cette question, une équipe de chercheurs a proposé un nouveau cadre qui fonctionne comme une étude psychologique pour le logiciel. «Ce test traite un programme «intelligent» comme s’il s’agissait d’un participant à une étude psychologique et comporte trois étapes: (a) tester le programme dans une série d’expériences visant à examiner ses inférences, (b) tester sa compréhension de sa propre manière de raisonner, et (c) examiner, si possible, l’adéquation cognitive du code source du programme», indiquent les chercheurs. Ils suggèrent que les méthodes standard d’évaluation de l’intelligence d’une machine, telles que le test de Turing, ne peuvent vous dire si la machine est bonne pour traiter les informations et imiter les réponses humaines. Les générations actuelles de programmes IA, tels que LaMDA de Google et ChatGPT d’OpenAI, par exemple, ont réussi à passer le test de Turing, mais les résultats du test ne impliquent pas que ces programmes puissent penser et raisonner comme les êtres humains. C’est pourquoi le test de Turing n’est peut-être plus pertinent, et il y a un besoin de nouvelles méthodes d’évaluation qui pourraient évaluer efficacement l’intelligence des machines, selon les chercheurs. Ils affirment que leur cadre pourrait être une alternative au test de Turing. «Nous proposons de remplacer le test de Turing par un test plus ciblé et plus fondamental pour répondre à la question: les programmes raisonnent-ils de la même manière que les êtres humains?», Estiment les auteurs de l’étude. Lors du test de Turing, les évaluateurs jouent différents jeux impliquant des communications basées sur le texte avec des êtres humains et des programmes IA (machines ou chatbots) réels. C’est un test aveugle, donc les évaluateurs ne savent pas s’ils textotent avec un être humain ou un chatbot. Si les programmes IA réussissent à générer des réponses ressemblant aux êtres humains – à un point tel que les évaluateurs ont du mal à distinguer entre l’être humain et le programme IA -, on considère que l’IA a réussi. Cependant, étant donné que le test de Turing repose sur une interprétation subjective, ces résultats sont également subjectifs.

Share the Post: