Pourquoi Nvidia et AMD se grillent mutuellement sur les revendications de performances en matière d’IA

Toute fois que nous écrivons à propos de comparaisons de performances fournies par les vendeurs et de leurs allégations, elles sont accompagnées d’un avertissement pour les prendre avec des pincettes. C’est parce que les vendeurs ont pour habitude de ne pas souligner les endroits où leurs puces ou leurs produits sont inférieurs à la concurrence, de sorte que les résultats sont généralement sélectionnés, ajustés et optimisés pour les présenter sous le meilleur jour possible. Ces comparaisons ne suscitent généralement pas de réponse de la part des concurrents des puces, mais dans le cas des nouvelles cartes graphiques MI300X d’AMD, Nvidia a estimé nécessaire de s’exprimer. Dans un article de blog la semaine dernière, le spécialiste des accélérateurs a rejeté l’exactitude et la pertinence des comparaisons d’AMD. Vendredi, AMD a répondu en partageant un nouvel ensemble de chiffres optimisés, alléguant une avance en termes de performances même lorsque les bibliothèques logicielles optimisées et le support de précision inférieure de Nvidia sont pris en compte. Au cours de l’événement de lancement d’AMD plus tôt cette semaine, le fabricant de puces a affirmé que sa MI300X – c’est la variante de la puce GPU – était capable d’atteindre 40% de latence en moins que le H100 lors de l’inférence du modèle de 70 milliards de paramètres Llama 2 de Meta.

Share the Post: