Comme la loi de Moore ralentissait considérablement, les puces, en particulier celles utilisées dans l’IA et le calcul haute performance (HPC), se sont considérablement réchauffées. En 2023, nous avons vu l’arrivée d’accélérateurs dans la gamme kilowatt avec l’arrivée des superpuces GH200 de Nvidia. Nous savions depuis longtemps que ces puces seraient chaudes – Nvidia tease depuis près de deux ans le processeur-GPU franken-chip. Ce que nous ne savions pas jusqu’à récemment, c’est la façon dont les OEM et les constructeurs de systèmes réagiraient face à une telle partie de densité de puissance. La plupart des systèmes seraient-ils refroidis par liquide? Ou la plupart des systèmes seraient-ils refroidis par air? Combien d’entre eux essaieraient-ils de fourrer dans une seule boîte, et combien serait-elle grande? Maintenant que les premiers systèmes basés sur le GH200 commencent à être mis sur le marché, il est devenu évident que le facteur de forme est très dicté par la densité de puissance que par autre chose. En gros, il s’agit de savoir combien de surface vous avez pour dissiper la chaleur. Fouillez les systèmes disponibles aujourd’hui de Supermicro, Gigabyte, QCT, Pegatron, HPE, et d’autres, et vous remarquerez rapidement une tendance. Jusqu’à environ 500 W par unité de rack (RU) – 1 kW dans le cas de la MGX ARS-111GL-NHR de Supermicro -, ces systèmes sont largement refroidis par air. Alors que c’est chaud, c’est encore une charge thermique gérable à dissiper, soit environ 21-24 kW par rack. C’est bien dans les capacités de livraison d’énergie et de gestion thermique des datacenters modernes, en particulier ceux qui utilisent des échangeurs de chaleur arrière. Cependant, cela change lorsque les constructeurs de systèmes commencent à fourrer plus d’un kilowatt d’accélérateurs dans chaque châssis. À ce stade, la plupart des systèmes OEM que nous avons examinés ont basculé vers un refroidissement par liquide direct. Le Gigabyte H263-V11, par exemple, offre jusqu’à quatre nœuds GH200 dans un seul châssis 2U.
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle Introduction L’intelligence artificielle (IA)