Le cloud Huawei Sigcomm 2024 a développé un outil de surveillance réseau qui, lorsqu’il est utilisé en production sur trois de ses propres régions, a pu observer plus de son infrastructure que les outils existants, et a révélé des problèmes qui avaient auparavant échappé aux efforts humains. L’outil s’appelle RD-Probe et a été détaillé dans un document [PDF] présenté mardi lors de la conférence SIGCOMM 2024 à Sydney. Le document explique que la surveillance réseau est essentielle mais difficile à réaliser à grande échelle. Les auteurs – certains de Huawei et d’autres de l’École d’informatique de l’Université de Pékin – citent une étude AWS [PDF] selon laquelle le cloud amazonien compte 1087 combinaisons de liens intra-régionaux et 10176 combinaisons de liens inter-régionaux (révélant également que les réseaux de datacenters de Huawei Cloud comprennent plus de 100 000 commutateurs et un million de serveurs). La surveillance de toute cette infrastructure et de tous ces chemins – dans un environnement virtualisé qui utilise l’aléatoire pour l’équilibrage de charge – rend très difficile la collecte de données suffisantes sur ce qui se passe au niveau 2. RD-Probe est la tentative de Huawei Cloud pour résoudre ce problème. Les développeurs de l’outil ont décidé de surveiller chaque port physique de niveau 2, car cela leur permet d’observer l’état d’exécution des tissus de commutation. Considérer uniquement le niveau 3, écrivent les auteurs, signifierait que certains ports ne seraient pas surveillés. La surveillance des ports physiques aide également à obtenir une couverture plus étendue que ne le permet la surveillance des réseaux virtuels – qui, par leur nature même, abstraient certaines des ressources utilisées pour les exécuter. Ce n’est pas souhaitable car sans une couverture complète, les outils de surveillance du réseau auront des angles morts, ce qui signifie que des problèmes seront manqués.
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »
‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du