Un organisme de surveillance de la DOE met en garde contre les mauvaises conditions d’entretien du système exascale Frontier chez lui.

Le contrôleur du Département de l’Énergie des États-Unis affirme que la maintenance et la gestion des opérations sont très mal gérées dans le centre de données du Oak Ridge National Laboratory, où se trouvent des ordinateurs avancés comme le premier système exascale au monde, Frontier. Le Bureau du vérificateur général (OIG) du DoE a reçu une allégation en septembre 2022 concernant la maintenance et l’étalonnage dans les centres de données du site Oak Ridge dans le Tennessee, qui réalise des projets scientifiques relatifs à la production d’énergie nucléaire et à la sécurité nationale. Selon le rapport [PDF], déposé hier, l’allégation affirmait que le programme d’étalonnage sur place était insuffisant, et qu’il n’y avait pas de maintenance ou une maintenance très médiocre sur les valves de soulagement de pression (PRVs) dans les centres de données. L’OIG a déclaré qu’il avait effectué une inspection de janvier 2023 à septembre 2023, et avait pu «substantier» les allégations. En particulier, le contrôleur a déclaré qu’il avait constaté que le programme d’étalonnage était insuffisant pour répondre aux exigences en matière de garantie de qualité, et que les procédures du système de gestion normalisées n’étaient pas toujours suivies lors de la maintenance des PRVs. Le manque de test ou d’inspection des PRVs peut entraîner un dépassement des limites de pression autorisées du système, pouvant potentiellement entraîner «des événements qui peuvent nuire aux personnels et au matériel», a déclaré l’OIG, tandis que si l’infrastructure n’est pas correctement entretenue, cela peut affecter la disponibilité des ressources de calcul et donc les objectifs de mission du site.

Share the Post: