À mesure que la loi de Moore ralentissait, les puces, en particulier celles utilisées dans l’IA et le calcul haute performance (HPC), ont considérablement chauffé. En 2023, nous avons vu l’arrivée de cartes d’accélération de l’ordre du kilowatt avec l’arrivée des superpuces GH200 de Nvidia. Nous savions depuis longtemps que ces puces seraient chaudes – Nvidia présentait ce projet de CPU-GPU depuis plus de deux ans. Ce que nous ne savions pas jusqu’à récemment, c’est comment les OEM et les constructeurs de systèmes réagiraient face à une telle densité de puissance. La plupart des systèmes seraient-ils refroidis par eau liquide? Ou plutôt refroidis à l’air? Combien d’accélérateurs essaieraient-ils de caser dans une seule et même boîte, et à quel point serait-elle grande? Maintenant que les premiers systèmes basés sur le GH200 font leur apparition sur le marché, il est devenu évident que la forme du facteur est dictée en grande partie par la densité de puissance que par autre chose. Cela se résume essentiellement à la surface disponible pour dissiper la chaleur. Si vous fouillez les systèmes disponibles aujourd’hui chez Supermicro, Gigabyte, QCT, Pegatron, HPE et d’autres, vous remarquerez rapidement une tendance. Jusqu’à environ 500 W par unité de rack (RU) – 1 kW dans le cas de la MGX ARS-111GL-NHR de Supermicro -, ces systèmes sont largement refroidis à l’air. Bien que chaud, il s’agit d’une charge thermique gérable, soit environ 21-24 kW par rack. Cela reste dans les capacités de délivrance d’énergie et de gestion thermique des datacenters modernes, en particulier ceux qui utilisent des échangeurs de chaleur à porte arrière. Cependant, les choses changent lorsque les constructeurs de systèmes commencent à en caser plus d’un kilowatt dans chaque châssis. À ce stade, la plupart des systèmes OEM que nous avons examinés ont basculé vers un refroidissement par eau liquide direct. Le H263-V11 de Gigabyte, par exemple, offre jusqu’à quatre nœuds GH200 dans un seul châssis 2U.
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle Introduction L’intelligence artificielle (IA)