Pourquoi Nvidia et AMD se chamaillent-ils sur les performances en matière d’IA ?

Toute fois que nous écrivons au sujet des performances des fournisseurs et des allégations de rendement, elles sont accompagnées d’un avertissement pour les prendre avec des pincettes. C’est parce que les fournisseurs ne sont pas dans l’habitude de mettre en évidence les endroits où leurs puces ou leurs produits sont inférieurs à la concurrence, de sorte que les résultats sont généralement soigneusement sélectionnés, ajustés et optimisés pour les présenter sous la meilleure lumière possible. Ces comparaisons ne suscitent généralement pas de réaction de la part des concurrents des puces, mais dans le cas des nouvelles cartes graphiques MI300X d’AMD, Nvidia a jugé nécessaire de s’exprimer. Dans un message blogue la semaine dernière, le spécialiste des accélérateurs a rejeté l’exactitude et la pertinence des benchmarks d’AMD. Vendredi, AMD a répondu en partageant un ensemble de chiffres optimisés, affirmant avoir un avantage en termes de performances, même en tenant compte des bibliothèques logicielles optimisées et du support de précision inférieure de Nvidia. Au cours de l’événement de lancement d’AMD plus tôt cette semaine, le fabricant de puces a affirmé que sa MI300X – c’est la variante GPU du chip – était capable d’atteindre 40% de latence inférieure à celle de la H100 lors de l’inférence du modèle de 70 milliards de paramètres Llama 2 de Meta.

Share the Post: