« Le roi est mort » – Claude 3 dépasse GPT-4 sur l’arène des chatbots pour la première fois.

Le mardi, le modèle de langage de grande taille Claude 3 Opus d’Anthropic a surpassé pour la première fois le GPT-4 d’OpenAI (qui alimente ChatGPT) sur Chatbot Arena, un leaderboard crowdsourcé populaire utilisé par les chercheurs en intelligence artificielle pour évaluer les capacités relatives des modèles de langage IA. « Le roi est mort », a tweeté le développeur de logiciels Nick Dobos dans un post comparant le GPT-4 Turbo et le Claude 3 Opus qui fait le tour des réseaux sociaux. « RIP GPT-4. » Depuis que le GPT-4 a été inclus dans Chatbot Arena vers le 10 mai 2023 (le leaderboard a été lancé le 3 mai de cette année-là), des variations du GPT-4 ont régulièrement été en tête du classement jusqu’à présent, donc sa défaite dans l’Arena est un moment notable dans l’histoire relativement courte des modèles de langage IA. Un des modèles plus petits d’Anthropic, Haiku, a également attiré l’attention par ses performances sur le leaderboard. « Pour la première fois, les meilleurs modèles disponibles – Opus pour les tâches avancées, Haiku pour le coût et l’efficacité – proviennent d’un fournisseur qui n’est pas OpenAI », a déclaré Simon Willison, chercheur IA indépendant, à Ars Technica. « C’est rassurant – nous bénéficions tous d’une diversité de principaux fournisseurs dans cet espace. Mais le GPT-4 a maintenant plus d’un an, et il a fallu cette année à quelqu’un d’autre pour rattraper son retard. » Chatbot Arena est géré par Large Model Systems Organization (LMSYS ORG), une organisation de recherche dédiée aux modèles ouverts qui fonctionne en collaboration entre les étudiants et le corps professoral de l’Université de Californie, à Berkeley, UC San Diego, et l’Université Carnegie Mellon. Nous avons expliqué le fonctionnement du site en décembre, mais en bref, Chatbot Arena présente à un utilisateur visitant le site une boîte de chat et deux fenêtres affichant la sortie de deux LLM non étiquetés. La tâche de l’utilisateur est de noter quelle sortie est meilleure en fonction des critères que l’utilisateur juge les plus appropriés. À travers des milliers de ces comparaisons subjectives, Chatbot Arena calcule les « meilleurs » modèles en agrégat et alimente le classement, en le mettant à jour au fil du temps.

Share the Post:

Informatique à Haguenau

Informatique à Haguenau : Solutions complètes pour tous vos besoins informatiques La ville de Haguenau, idéalement située en Alsace, est

Qu’est-ce qu’Apify et comment peut-il aider votre entreprise ?

Qu’est-ce qu’Apify et comment peut-il aider votre entreprise ? Dans le monde du web scraping et de l’automatisation des tâches,

Goose : L’agent IA local qui automatise les tâches d’ingénierie

Goose : L’agent IA local qui automatise les tâches d’ingénierie Dans le monde numérique, les développeurs peuvent perdre en productivité

DeepSeek : Une Nouvelle Ère pour l’Intelligence Artificielle et la Recherche en Ligne

L’intelligence artificielle évolue rapidement, et de nouvelles plateformes émergent pour révolutionner divers secteurs. L’une des innovations les plus prometteuses est

Équilibrer la Numérisation et la Sobriété Numérique dans la Formation Professionnelle : Solutions Actuelles et Besoins Émergents

La formation professionnelle tout au long de la vie (FTLV) connaît une transformation significative dans le contexte actuel de numérisation

Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle

Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle Introduction L’intelligence artificielle (IA)

Donnez vie à vos histoires avec Epidemic Sound

Dans le monde numérique d’aujourd’hui, le contenu visuel est roi. Mais qu’est-ce qui transforme une bonne vidéo en une expérience

KLING AI : Le Studio Créatif de Nouvelle Génération Alimenté par l’IA

Dans le monde en constante évolution de la création de contenu numérique, une nouvelle étoile brille de mille feux :