Pourquoi Nvidia et AMD se critiquent mutuellement sur les performances en matière d’IA

Toute fois que nous écrivons à propos des mesures fournies par les fournisseurs et les allégations de performances, elles sont accompagnées d’un avertissement pour les prendre avec des pincettes. C’est parce que les fournisseurs ne sont pas dans l’habitude de souligner les endroits où leurs puces ou leurs produits sont en dessous de la concurrence, de sorte que les résultats sont généralement sélectionnés avec soin, ajustés et optimisés pour les présenter sous leur meilleur jour. Ces comparaisons ne suscitent généralement pas de réaction de la part des concurrents des puces, mais dans le cas des nouvelles cartes graphiques MI300X d’AMD, Nvidia a estimé nécessaire de s’exprimer. Dans un message publié la semaine dernière, le spécialiste des accélérateurs a rejeté l’exactitude et la pertinence des mesures d’AMD. Vendredi, AMD a répondu en partageant un nouvel ensemble de chiffres optimisés, alléguant un avantage en termes de performances même lorsque l’on tient compte des bibliothèques logicielles optimisées de Nvidia et du support de précision inférieure. Au cours de l’événement de lancement d’AMD plus tôt cette semaine, le fabricant de puces a affirmé que son MI300X – c’est la variante de la puce GPU – était capable d’offrir une latence inférieure de 40% par rapport à l’H100 lors de l’inférence du modèle de 70 milliards de paramètres Llama 2 de Meta.

Share the Post: