Voici la traduction en français :
« Malgré les fanfaronnades d’AMD et d’Intel, Nvidia reste sans conteste le principal fournisseur d’infrastructures d’IA. Avec le lancement aujourd’hui de l’architecture GPU Blackwell lors du discours d’ouverture du GTC du PDG Jensen Huang, il vise à étendre son avance technique – tant en termes de performances que de consommation d’énergie. Au vu de l’ascension fulgurante de Nvidia à la suite de l’essor de l’IA générative, les enjeux n’ont jamais été aussi importants. Mais du moins sur le papier, Blackwell – le successeur de la vénérable génération Hopper de Nvidia – est prometteur. En termes de FLOPS bruts, les puces haut de gamme Blackwell du géant des GPU sont environ 5 fois plus rapides. Bien sûr, le diable se cache dans les détails, et l’obtention de ces performances dépendra fortement de plusieurs facteurs. Alors que Nvidia affirme que la nouvelle puce atteindra 20 pétaFLOPS, cela ne sera possible qu’en utilisant son nouveau type de données en virgule flottante sur 4 bits et en optant pour des serveurs refroidis par liquide. En examinant les performances FP8 de génération en génération, la puce n’est que 2,5 fois plus rapide que la H100. À l’heure où ces lignes sont écrites, Blackwell se compose de trois parties : le B100, le B200 et le Superchip Grace-Blackwell (GB200). Il est probable qu’il y aura d’autres GPU Blackwell à un moment donné – comme le B40 déjà évoqué, qui utilisera une autre matrice, ou plutôt des matrices – mais pour l’instant, les trois puces partagent le même silicium. Le GPU Nvidia Blackwell alimentant les accélérateurs B100, B200 et GB200 comporte une paire de matrices de calcul limitées par le réticule qui communiquent entre elles via une interconnexion NVLink-HBI à 10 To/s. Cliquez pour agrandir. »