« Pourquoi Nvidia et AMD se font cuire mutuellement sur les affirmations de performances en matière d’IA »

Toute fois que nous écrivons à propos de bancs de tests et de revendications de performances fournis par les fournisseurs, ils sont accompagnés d’un avertissement pour les prendre avec des pincettes. C’est parce que les fournisseurs ne sont pas dans l’habitude de souligner où leurs puces ou leurs produits sont en deçà de la concurrence, de sorte que les résultats sont généralement sélectionnés avec soin, réglés et optimisés pour les présenter sous la meilleure lumière possible. Ces comparaisons ne suscitent généralement pas de réaction de la part des concurrents des puces, mais dans le cas des nouvelles cartes graphiques MI300X d’AMD, Nvidia a estimé nécessaire de s’exprimer. Dans un article de blog la semaine dernière, le spécialiste du matériel a rejeté l’exactitude et la pertinence des benchmarks d’AMD. Vendredi, AMD a répondu en partageant un nouvel ensemble de chiffres optimisés, revendiquant un avantage en termes de performances même en tenant compte des bibliothèques logicielles optimisées et du support de précision inférieure par Nvidia. Au cours de l’événement de lancement d’AMD plus tôt cette semaine, le fabricant de puces a affirmé que son MI300X – c’est la variante de la puce GPU – était capable d’inference de modèles de 70 milliards de paramètres de Meta Llama 2 avec une latence de 40% inférieure à celle de H100.

Share the Post: