Pourquoi Nvidia et AMD se critiquent-ils mutuellement sur les performances en IA ?

Toute fois que nous parlons de tests fournis par les vendeurs et de leurs allégations de performances, ils sont accompagnés d’un avertissement indiquant qu’il faut les prendre avec des pincettes. En effet, les vendeurs n’ont pas pour habitude de souligner où leurs puces ou leurs produits sont en dessous de la concurrence, de sorte que les résultats sont généralement sélectionnés, ajustés et optimisés pour les présenter sous les meilleurs auspices possibles. Ces comparaisons ne suscitent habituellement pas de réaction de la part des concurrents des puces d’AMD, mais dans le cas des nouvelles cartes graphiques MI300X d’AMD, Nvidia a jugé nécessaire de réagir. La semaine dernière, dans un billet de blog, le spécialiste des accélérateurs a rejeté l’exactitude et la pertinence des tests d’AMD. Vendredi, AMD a répondu en partageant un nouvel ensemble de données optimisées, alléguant une avance en termes de performances même lorsque l’on tient compte des bibliothèques optimisées et du support de Nvidia pour une précision inférieure. Lors de l’événement de lancement d’AMD plus tôt cette semaine, le fabricant de puces a affirmé que son MI300X – c’est la variante de la puce graphique – était capable d’obtenir une latence 40 % inférieure à celle du H100 lors de l’inférence du modèle Llama 2 à 70 milliards de paramètres de Meta.

Share the Post: