J’ai opposé le Sonnet 3.5 de Claude aux tests de codage de l’IA ChatGPT – et il a échoué de manière créative.

La semaine dernière, j’ai reçu un e-mail d’Anthropic annonçant que Claude 3.5 Sonnet était disponible. Selon la société d’IA, « Claude 3.5 Sonnet élève la barre de l’industrie en termes d’intelligence, surpassant les modèles concurrents et Claude 3 Opus sur une large gamme d’évaluations ». La société a ajouté : « Claude 3.5 Sonnet est idéal pour des tâches complexes telles que la génération de code ». J’ai décidé de vérifier si c’était vrai. De plus : Comment utiliser ChatGPT pour créer une application. Je vais soumettre le nouveau modèle Claude 3.5 Sonnet à mon ensemble standard de tests de codage – des tests que j’ai effectués contre une large gamme d’IAs avec une variété de résultats. Souhaitez-vous suivre avec vos propres tests ? Dirigez votre navigateur vers Comment je teste la capacité de codage d’un chatbot AI – et vous aussi, qui contient tous les tests standard que j’applique, des explications sur leur fonctionnement et ce qu’il faut rechercher dans les résultats. D’accord, plongeons dans les résultats de chaque test et voyons comment ils se comparent aux tests précédents utilisant Microsoft Copilot, Meta AI, Meta Code Llama, Google Gemini Advanced et ChatGPT.

Share the Post: