Pourquoi Nvidia et AMD se traitent mutuellement de prétentions de performances en IA

Toute fois que nous écrivons à propos de comparatifs de performances fournis par les vendeurs, ils sont accompagnés d’un avertissement pour les prendre avec des pincettes. Cela est dû au fait que les vendeurs n’ont pas pour habitude de mettre en évidence les endroits où leurs puces ou leurs produits sont en retard sur la concurrence, de sorte que les résultats sont généralement sélectionnés, ajustés et optimisés pour les présenter sous leur meilleur jour. Ces comparaisons ne suscitent généralement pas de réaction de la part des concurrents, mais dans le cas des nouvelles cartes graphiques MI300X d’AMD, Nvidia a estimé nécessaire de s’exprimer. Dans un article de blog la semaine dernière, le spécialiste des accélérateurs a rejeté l’exactitude et la pertinence des benchmarks d’AMD. Vendredi, AMD a répondu en partageant un nouvel ensemble de chiffres optimisés, affirmant un avantage en termes de performances même lorsque l’on tient compte des bibliothèques logicielles optimisées et du support de précision inférieure par Nvidia. Lors de l’événement de lancement d’AMD plus tôt cette semaine, le fabricant de puces a affirmé que son MI300X – c’est la variante de la puce GPU – était capable d’obtenir une latence 40 % plus faible que le H100 lors de l’inférence du modèle Llama 2 70 milliards de paramètres de Meta.

Share the Post: