L’année nouvelle s’annonce déjà comme l’une des plus importantes en termes de puces pour centre de données que nous ayons vues depuis un certain temps. Tous les principaux fabricants de puces s’apprêtent à rafraîchir leurs lignes de processeurs et / ou de processeurs graphiques au cours des douze prochains mois. Nvidia a prévu une foule de nouveaux accélérateurs, d’architectures de GPUs et de matériel de réseautage pour 2024. Intel lancera sans doute ses Xeons les plus convaincants depuis des années, aux côtés de nouveaux processeurs Habana Gaudi AI. En attendant, AMD, surfe sur sa gamme MI300, prévoit de mettre sur le marché ses processeurs Epyc de 5e génération. Sans ordre particulier, concentrons-nous sur quelques-unes des plus importantes lancements de puces pour centre de données à venir en 2024. Oh, et si vous pensez que nous en avons oublié un, faites-le nous savoir dans les commentaires ou par e-mail. Parmi les premières nouvelles puces à arriver sur le marché en 2024, figureront les accélérateurs H200 de Nvidia. Le GPU est essentiellement une mise à jour du vénérable H100. Vous pourriez vous attendre à ce que la dernière puce offre une amélioration des performances par rapport à son aînée, mais ce ne sera pas le cas dans le sens conventionnel. Fouillez dans la fiche technique et vous verrez que les performances en virgule flottante sont identiques à celles du H100. Au lieu de cela, la performance de la puce – Nvidia prétend jusqu’à doubler les performances pour les LLMs, y compris Llama 70B – est due aux stacks de mémoire HBM3e de la puce.
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle Introduction L’intelligence artificielle (IA)