Pourquoi Nvidia et AMD s’enflamment-ils l’un contre l’autre sur les performances en IA ?

Toute fois que nous écrivons à propos de benchmarks et de allégations de rendement fournis par les fournisseurs, ils sont accompagnés d’un avertissement pour les prendre avec une grain de sel. C’est parce que les fournisseurs ne sont pas dans l’habitude de faire remarquer où leurs puces ou leurs produits sont en deçà de la concurrence, donc les résultats sont généralement sélectionnés avec soin, ajustés et optimisés pour présenter les résultats sous leur meilleur jour possible. Ces comparaisons ne suscitent généralement pas de réaction de la part des concurrents des puces, mais dans le cas des nouvelles GPUs MI300X d’AMD, Nvidia a jugé nécessaire de s’exprimer. Dans un article de blog la semaine dernière, le spécialiste des accélérateurs a rejeté l’exactitude et la pertinence des benchmarks d’AMD. Vendredi, AMD a répondu en partageant un nouvel ensemble de chiffres optimisés, affirmant avoir un avantage en termes de performance, même en tenant compte des bibliothèques logicielles optimisées de Nvidia et du support pour une précision inférieure. Lors de l’événement de lancement d’AMD plus tôt cette semaine, le fabricant de puces a affirmé que son MI300X – c’est la variante de GPU du chipset – était capable d’atteindre 40% de latence en inférencetant le modèle de 70 milliards de paramètres de Meta Llama 2.

Share the Post: