Comme la loi de Moore a ralenti considérablement, les puces, en particulier celles utilisées dans l’IA et le calcul haute performance (HPC), ont progressivement chauffé. En 2023, nous avons vu l’arrivée des accélérateurs dans la gamme kilowatt avec l’arrivée des superpuces GH200 de Nvidia. Nous savions depuis longtemps que ces puces seraient chaudes – Nvidia tease la puce hybride CPU-GPU depuis plus de deux ans maintenant. Ce que nous ne savions pas jusqu’à récemment, c’est la façon dont les OEM et les constructeurs de systèmes réagiraient face à une telle partie à densité de puissance élevée. La plupart des systèmes seraient-ils refroidis par liquide ? Ou, la plupart d’entre eux utiliseraient-ils un refroidissement par air ? Combien d’entre ces accélérateurs essaieraient-ils de mettre dans un seul boîtier, et quelle serait la taille du boîtier ? Maintenant que les premiers systèmes basés sur le GH200 font leur chemin vers le marché, il est devenu clair que le facteur de forme est beaucoup plus dicté par la densité de puissance que par quoi que ce soit d’autre. Cela se résume essentiellement à la surface disponible pour dissiper la chaleur. Si vous fouillez les systèmes disponibles aujourd’hui de Supermicro, Gigabyte, QCT, Pegatron, HPE et d’autres, vous remarquerez rapidement une tendance. Jusqu’à environ 500 W par unité de rack (RU) – 1 kW dans le cas de la MGX ARS-111GL-NHR de Supermicro –, ces systèmes sont largement refroidis par air. Bien que chaud, ce n’est toujours qu’une charge thermique gérable à dissiper, soit environ 21-24 kW par rack. C’est bien dans les capacités de distribution d’énergie et de gestion thermique des datacenters modernes, en particulier ceux qui utilisent des échangeurs de chaleur arrière. Cependant, cela change lorsque les constructeurs de systèmes commencent à en mettre plus d’un kilowatt dans chaque châssis. À ce stade, la plupart des systèmes OEM que nous avons examinés ont basculé vers un refroidissement par eau direct. Par exemple, le H263-V11 de Gigabyte offre jusqu’à quatre nœuds GH200 dans un seul châssis 2U.
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle Introduction L’intelligence artificielle (IA)