Pourquoi Nvidia et AMD se critiquent mutuellement sur les performances en IA ?

Toute fois que nous abordons des benchmarks et allégations de performances fournies par les vendeurs, elles sont toujours accompagnées d’un avertissement pour les prendre avec des pincettes. C’est parce que les vendeurs ne sont pas dans l’habitude de souligner où leurs puces ou leurs produits sont en retard par rapport à la concurrence, de sorte que les résultats sont généralement sélectionnés avec soin, réglés et optimisés pour les présenter sous leur meilleur jour. Ces comparaisons ne suscitent généralement pas de réaction de la part des concurrents des puces d’AMD, mais dans le cas des nouvelles cartes graphiques MI300X, Nvidia a jugé nécessaire de s’exprimer. Dans un message publié la semaine dernière, le spécialiste des accélérateurs a rejeté l’exactitude et la pertinence des benchmarks d’AMD. Vendredi, AMD avait répondu en partageant un nouvel ensemble de chiffres optimisés, affirmant un avantage en termes de performance même en tenant compte des bibliothèques logicielles optimisées de Nvidia et de son support pour une précision inférieure. Au cours de l’événement de lancement d’AMD plus tôt cette semaine, le fabricant de puces a affirmé que son MI300X – c’est la variante de la puce GPU – était capable d’atteindre 40% de latence en inférence sur le modèle Llama 2 de 70 milliards de paramètres de Meta.

Share the Post: