Comme la loi de Moore ralentissait considérablement, les puces, en particulier celles utilisées dans l’IA et les ordinateurs de haute performance (HPC), ont progressivement chauffé. En 2023, nous avons vu l’arrivée sur le marché de puces Superchips GH200 de Nvidia, dont la puissance atteignait les kilowatts. Nous savions depuis longtemps que ces puces seraient chaudes – Nvidia tease le CPU-GPU franken-chip depuis près de deux ans. Ce que nous ne savions pas jusqu’à récemment, c’est comment les OEM et les constructeurs de systèmes réagiraient à une telle puce à haute densité de puissance. La plupart des systèmes seraient-ils refroidis à l’eau? Ou bien la plupart des systèmes seraient-ils refroidis à l’air? Combien de ces accélérateurs essaieraient-ils de caser dans un seul et même boîtier, et quelle serait la taille de ce boîtier? Maintenant que les premiers systèmes basés sur le GH200 commencent à être commercialisés, il est devenu clair que le format de facteur est très largement dicté par la densité de puissance que par autre chose. Cela se résume essentiellement à la surface disponible pour dissiper la chaleur. Si vous examinez de plus près les systèmes disponibles aujourd’hui de la part de Supermicro, Gigabyte, QCT, Pegatron, HPE et d’autres, vous remarquerez rapidement une tendance. Jusqu’à environ 500 W par unité de montage en racks (RU) – 1 kW dans le cas du MGX ARS-111GL-NHR de Supermicro -, ces systèmes sont largement refroidis à l’air. Bien que chaud, ce n’est toujours qu’une charge thermique gérable, soit environ 21-24 kW par rack. C’est bien dans les capacités de livraison d’énergie et de gestion thermique des datacenters modernes, en particulier ceux qui utilisent des échangeurs de chaleur à porte arrière. Cependant, cela change lorsque les constructeurs de systèmes commencent à en mettre plus d’un kilowatt dans chaque châssis. À ce stade, la plupart des systèmes OEM que nous avons examinés ont basculé vers un refroidissement par eau direct. Le H263-V11 de Gigabyte, par exemple, offre jusqu’à quatre nœuds GH200 dans un seul châssis 2U.
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle Introduction L’intelligence artificielle (IA)