Pourquoi Nvidia et AMD se chamaillent-ils pour des revendications de performances en matière d’IA?

Toute fois que nous écrivons à propos des comparaisons fournies par les fournisseurs et les allégations de rendement, elles sont accompagnées d’un avertissement pour les prendre avec des grains de sel. C’est parce que les fournisseurs ne sont pas dans l’habitude de mettre en évidence les endroits où leurs puces ou leurs produits sont inférieurs à ceux de la concurrence, de sorte que les résultats sont généralement sélectionnés, ajustés et optimisés pour les présenter sous leur meilleur jour possible. Ces comparaisons ne suscitent généralement pas de réaction de la part des concurrents, mais dans le cas des nouvelles cartes graphiques MI300X d’AMD, Nvidia a estimé nécessaire de s’exprimer. Dans un billet de blog publié la semaine dernière, le spécialiste des accélérateurs a rejeté la précision et la pertinence des comparaisons d’AMD. Vendredi, AMD a répondu en partageant un nouvel ensemble de chiffres optimisés, alléguant un avantage en termes de performance même lorsque l’on tient compte des bibliothèques logicielles optimisées et du support de précision inférieure de Nvidia. Au cours de l’événement de lancement d’AMD plus tôt cette semaine, le fabricant de puces a affirmé que sa MI300X – c’est la variante de la puce de la carte graphique – était capable d’obtenir une latence inférieure de 40 % par rapport à la H100 lors de l’inférence du modèle Llama 2 de 70 milliards de paramètres de Meta.

Share the Post: