Pourquoi Nvidia et AMD se déchirent-ils sur les performances en matière d’IA ?

N’importe quand nous écrivons à propos de bancs de tests et de revendications de performances fournis par les fournisseurs, ils sont accompagnés d’un avertissement pour les prendre avec des pincettes. C’est parce que les fournisseurs ne sont pas dans l’habitude de souligner où leurs puces ou leurs produits sont en deçà de la concurrence, de sorte que les résultats sont généralement sélectionnés, réglés et optimisés pour être présentés sous leur meilleur jour. Ces comparaisons ne suscitent généralement pas de réponse de la part des concurrents des puces d’AMD, mais dans le cas des nouvelles cartes graphiques MI300X d’AMD, Nvidia a estimé nécessaire de s’exprimer. Dans un article de blog la semaine dernière, le spécialiste des accélérateurs a rejeté l’exactitude et la pertinence des benchmarks d’AMD. Vendredi, AMD a répondu en partageant un nouvel ensemble de chiffres optimisés, revendiquant un avantage en termes de performance même lorsque l’on tient compte des bibliothèques logicielles optimisées et du support de précision inférieure de Nvidia. Lors de l’événement de lancement d’AMD plus tôt cette semaine, le fabricant de puces a affirmé que son MI300X – c’est la variante de la puce GPU – était capable d’obtenir une latence de 40% inférieure à celle du H100 lors de l’inférence du modèle de 70 milliards de paramètres Llama 2 de Meta.

Share the Post: