Pourquoi Nvidia et AMD s’écharpent-ils sur les performances en matière d’IA ?

Toute fois que nous écrivons à propos de bancs de tests fournis par les fournisseurs et les allégations de rendement, ils sont accompagnés d’un avertissement pour les prendre avec des pincettes. C’est parce que les fournisseurs n’ont pas pour habitude de mettre en évidence les endroits où leurs puces ou leurs produits sont en deçà de la concurrence, de sorte que les résultats sont généralement sélectionnés, ajustés et optimisés pour les présenter sous le meilleur jour possible. Ces comparaisons ne suscitent généralement pas de réaction de la part des concurrents des puces d’AMD, mais dans le cas des nouvelles cartes graphiques MI300X d’AMD, Nvidia a estimé nécessaire de s’exprimer. Dans un article de blog la semaine dernière, le spécialiste des accélérateurs a rejeté l’exactitude et la pertinence des bancs de test d’AMD. Vendredi, AMD a répondu en partageant un nouvel ensemble de données optimisées, alléguant une avance en termes de performances même en tenant compte des bibliothèques logicielles optimisées de Nvidia et du support de précision inférieure. Lors de l’événement de lancement d’AMD plus tôt cette semaine, le fabricant de puces a affirmé que son MI300X – c’est la variante de la puce GPU – était capable d’atteindre 40% de latence en inférence du modèle Llama 2 de 70 milliards de paramètres de Meta.

Share the Post: