L’année nouvelle s’annonce déjà comme l’une des plus importantes en termes de silicium de datacenter que nous ayons vues depuis un certain temps. Tous les principaux fabricants de puces ont prévu de rafraîchir leurs lignes de processeurs et / ou de GPUs au cours des douze prochains mois. Nvidia a prévu une foule de nouveaux accélérateurs, d’architectures GPU et de matériel de réseau pour 2024. Intel lancera sans doute ses Xeons les plus convaincants depuis des années, accompagnés de nouveaux processeurs Habana Gaudi AI. En attendant, AMD, surfe sur son lancement de la série MI300, prévoit de mettre sur le marché ses processeurs Epyc de 5e génération. Dans un ordre quelconque, plongeons-nous dans quelques-uns des plus gros lancements de puces de datacenter à venir en 2024. Oh, et si vous pensez que nous en avons oublié un, faites-le nous savoir dans les commentaires ou par e-mail. Parmi les premières nouvelles puces à arriver sur le marché en 2024, il y aura les accélérateurs H200 de Nvidia. La GPU est essentiellement un rafraîchissement de la célèbre H100. Vous pourriez vous attendre que la dernière puce offre une amélioration des performances par rapport à son aînée, mais ce ne sera pas le cas de manière conventionnelle. Fouillez dans la fiche technique et vous verrez que les performances en virgule flottante sont identiques à celles de l’H100. Au lieu de cela, l’amélioration des performances de la puce – Nvidia prétend jusqu’à un doublement de la perf pour les LLMs, y compris Llama 70B – est due aux stacks de mémoire HBM3e de la puce.
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle Introduction L’intelligence artificielle (IA)