Comme la loi de Moore ralentissait considérablement, les puces, en particulier celles utilisées dans l’IA et le calcul haute performance (HPC), ont progressivement chauffé. En 2023, nous avons vu l’arrivée de cartes accélératrices dans la gamme kilowatt avec l’arrivée des superpuces GH200 de Nvidia. Nous savions depuis longtemps que ces puces seraient chaudes – Nvidia nous tease avec ce CPU-GPU franken-chip depuis près de deux ans maintenant. Ce que nous ne savions pas jusqu’à récemment, c’est comment les OEM et les constructeurs de systèmes réagiraient à une telle partie de densité de puissance. La plupart des systèmes seraient-ils refroidis par liquide? Ou la plupart des systèmes continueraient-ils à être refroidis par air? Combien de ces accélérateurs essaieraient-ils de fourrer dans une seule boîte, et combien serait-elle grande? Maintenant que les premiers systèmes basés sur le GH200 font leur chemin vers le marché, il est devenu clair que le facteur de forme est très dicté par la densité de puissance que tout autre chose. Il s’agit essentiellement de la surface disponible pour dissiper la chaleur. Fouillez les systèmes disponibles aujourd’hui chez Supermicro, Gigabyte, QCT, Pegatron, HPE et d’autres, et vous remarquerez rapidement une tendance. Jusqu’à environ 500 W par unité de rack (RU) – 1 kW dans le cas de la MGX ARS-111GL-NHR de Supermicro -, ces systèmes sont largement refroidis par air. Bien que chaud, ce n’est toujours qu’un chargement thermique gérable à dissiper, soit environ 21-24 kW par rack. Cela reste largement dans les capacités de livraison de puissance et de gestion thermique des datacenters modernes, en particulier ceux qui font appel à des échangeurs de chaleur à porte arrière. Cependant, cela change lorsque les constructeurs de systèmes commencent à enfouir plus d’un kilowatt d’accélérateurs dans chaque châssis. À ce stade, la plupart des systèmes OEM que nous avons examinés passent à un refroidissement par liquide direct. Le H263-V11 de Gigabyte, par exemple, offre jusqu’à quatre nœuds GH200 dans un seul châssis 2U.
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle Introduction L’intelligence artificielle (IA)