Pourquoi Nvidia et AMD se chamaillent-ils pour des prétentions de performances en IA ?

Les analyses Chaque fois que nous écrivons à propos de bancs de tests fournis par les fournisseurs et de leurs allégations de performances, ils sont accompagnés d’un avertissement pour les prendre avec des pincettes. C’est parce que les fournisseurs ne sont pas dans l’habitude de mettre en avant les endroits où leurs puces ou leurs produits sont en dessous de la concurrence, de sorte que les résultats sont généralement sélectionnés avec soin, ajustés et optimisés pour les présenter sous leur meilleur jour. Ces comparaisons ne suscitent généralement pas de réaction de la part des concurrents des puces d’AMD, mais dans le cas des nouvelles cartes graphiques MI300X d’AMD, Nvidia a estimé nécessaire de s’exprimer. Dans un message sur son blog la semaine dernière, le spécialiste des accélérateurs a rejeté la précision et la pertinence des benchmarks d’AMD. Vendredi, AMD a répondu en partageant un nouvel ensemble de chiffres optimisés, alléguant un avantage en termes de performances même lorsque l’on tient compte des bibliothèques logicielles optimisées et du support de précision inférieure de Nvidia. Lors de l’événement de lancement d’AMD plus tôt cette semaine, le fabricant de puces a affirmé que sa MI300X – c’est-à-dire la variante de la puce GPU – était capable d’obtenir une latence 40 % inférieure à celle de l’H100 lors de l’inférence du modèle Llama 2 de 70 milliards de paramètres de Meta.

Share the Post: