Au fur et à mesure que de plus en plus de générateurs d’images IA entrent sur le marché, chacun avec ses avantages distincts, l’évaluation de leur efficacité devient impérative. C’est là qu’intervient « Text-to-Image Arena » d’Artificial Analysis, fournissant un point de référence pour déterminer la qualité globale des différents modèles d’IA.
Sur cette plateforme unique, deux images non identifiées produites à partir du même prompt sont montrées aux utilisateurs. Il incombe aux utilisateurs de choisir celle qu’ils considèrent de qualité supérieure, en fonction de facteurs tels que l’absence d’artefacts et la fidélité du prompt. Les résultats générés sont ensuite organisés dans un classement.
Fait intéressant, un modèle mystère connu sous le nom de Red Panda occupe actuellement la première place, surpassant les leaders du secteur tels que DALLE 3, Stable Diffusion 3 Large, Midjourney v6, et FLUX.1 [pro]. L’identité des créateurs de Red Panda reste non révélée, laissant supposer que le modèle subit des tests anonymes dans l’Aréna en prévision d’un éventuel lancement public, une pratique courante dans l’industrie.
Red Panda présente un impressionnant taux de victoire en arène de 72% et un score Elo en arène de 1172, soit 40 points de plus que son concurrent le plus proche, FLUX 1.1 [pro] de Black Forest Labs, la force motrice derrière le générateur d’images Grok hébergé sur X.
Pour s’immerger dans l’effervescence autour de Red Panda, les utilisateurs sont encouragés à participer au « Text-to-Image Arena » et à participer au processus de sélection.