Le nouveau modèle o1 d’OpenAI est plus lent, volontairement.

OpenAI a dévoilé son dernier modèle d’intelligence artificielle appelé o1, qui, selon la société, peut effectuer des tâches de raisonnement complexe de manière plus efficace que ses prédécesseurs. La sortie intervient alors qu’OpenAI est confrontée à une concurrence croissante dans la course au développement de systèmes d’IA plus sophistiqués. O1 a été formé pour « passer plus de temps à réfléchir aux problèmes avant de répondre, un peu comme le ferait une personne », a déclaré OpenAI sur son site Web. « Grâce à l’entraînement, [les modèles] apprennent à affiner leur processus de réflexion, à essayer différentes stratégies et à reconnaître leurs erreurs. » OpenAI imagine que le nouveau modèle sera utilisé par les chercheurs en santé pour annoter les données de séquençage cellulaire, par les physiciens pour générer des formules mathématiques et par les développeurs de logiciels. Les systèmes d’IA actuels sont essentiellement des versions plus sophistiquées de l’autocomplétion, générant des réponses par des statistiques au lieu de réellement « réfléchir » à une question, ce qui signifie qu’ils sont moins « intelligents » qu’ils ne le paraissent. Lorsque Engadget a essayé de faire résoudre au ChatGPT et à d’autres chatbots IA le jeu du New York Times Spelling Bee, par exemple, ils se sont embrouillés et ont produit des résultats absurdes. Avec o1, la société affirme qu’elle « remet le compteur à 1 » avec un nouveau type de modèle d’IA conçu pour réellement s’engager dans la résolution de problèmes complexes et la réflexion logique. Dans un article de blog détaillant le nouveau modèle, OpenAI a déclaré qu’il se comportait de manière similaire à des étudiants en doctorat sur des tâches de référence difficiles en physique, chimie et biologie, et excellait en mathématiques et en codage. Par exemple, son modèle phare actuel, GPT-4o, n’a résolu correctement que 13 % des problèmes dans un examen de qualification pour l’Olympiade Internationale de Mathématiques, contre 83 % pour o1. Cependant, le nouveau modèle ne comprend pas des fonctionnalités telles que la navigation sur le Web ou la capacité de télécharger des fichiers et des images. Et, selon The Verge, il est significativement plus lent pour traiter les requêtes par rapport à GPT-4o. Malgré avoir plus de temps pour réfléchir à ses résultats, o1 n’a pas résolu le problème des « hallucinations » – un terme désignant les modèles d’IA inventant des informations. « Nous ne pouvons pas dire que nous avons résolu les hallucinations », a déclaré Bob McGrew, le directeur de la recherche en chef de l’entreprise, à The Verge.

Share the Post: