Comment le management thermique évolue à l’ère du circuit intégré kilowatt

Comme la loi de Moore ralentissait considérablement, les puces, en particulier celles utilisées dans l’IA et les ordinateurs de hautes performances (HPC), ont considérablement augmenté en chaleur. En 2023, nous avons vu l’arrivée d’accélérateurs dans la gamme de kilowatts avec l’arrivée des superpuces GH200 de Nvidia. Nous savions depuis longtemps que ces puces seraient chaudes – Nvidia tease la CPU-GPU franken-chip depuis plus de deux ans. Ce que nous ne savions pas jusqu’à récemment, c’est comment les OEM et les constructeurs de systèmes réagiraient à une telle puce à haute densité de puissance. La plupart des systèmes seraient-ils refroidis par liquide? Ou la plupart des systèmes seraient-ils refroidis à l’air? Combien d’accélérateurs ces derniers essaieraient-ils de cram dans une seule boîte, et combien grande serait la boîte? Maintenant que les premiers systèmes basés sur le GH200 arrivent sur le marché, il est devenu clair que le facteur de forme est très dicté par la densité de puissance que par toute autre chose. Cela se résume essentiellement à la surface disponible pour dissiper la chaleur. Fouillez les systèmes disponibles aujourd’hui chez Supermicro, Gigabyte, QCT, Pegatron, HPE et d’autres et vous remarquerez rapidement une tendance. Jusqu’à environ 500 W par unité de rack (RU) – 1 kW dans le cas du MGX ARS-111GL-NHR de Supermicro -, ces systèmes sont largement refroidis à l’air. Bien que chaud, ce n’est toujours qu’une charge thermique gérable à dissiper, soit environ 21-24 kW par rack. Cela reste dans les capacités de livraison d’énergie et de gestion thermique des datacenters modernes, en particulier ceux qui font usage d’échangeurs de chaleur arrière. Cependant, cela change lorsque les constructeurs de systèmes commencent à empiler plus d’un kilowatt d’accélérateurs dans chaque châssis. À ce stade, la plupart des systèmes OEM que nous avons examinés ont basculé vers un refroidissement par liquide direct. Le H263-V11 de Gigabyte, par exemple, offre jusqu’à quatre nœuds GH200 dans un seul châssis 2U.

Share the Post: