Vous êtes tellement inquiet quant à la fiabilité d’AWS que le géant du cloud vous permet maintenant de simuler de graves pannes.

En d’après le comptage du Register, Amazon Web Services a fait au moins 192 annonces de produits au cours des quatre derniers jours lors de sa conférence re:Invent. Mais seule une d’entre elles a préoccupé votre correspondant : la nouvelle selon laquelle les clients d’Amazon lui ont demandé de proposer des simulations de ce qui se passe lorsqu’une zone de disponibilité entière – un groupe de centres de données conçus pour une extrême tolérance aux erreurs – est hors ligne en raison d’une panne de courant. AWS propose déjà des simulations de défaillance avec un outil appelé Fault Injection Service (FIS). Comme son nom l’indique, le service permet aux utilisateurs de créer des défaillances factices afin qu’ils puissent tester leur capacité à se remettre d’un événement inattendu. Ce genre de chose est courant chez les hyperscalers de grande taille : Netflix a même créé un outil appelé Chaos Monkey pour casser aléatoirement ses systèmes afin que ses ingénieurs puissent mieux gérer les problèmes. FIS est coupé du même tissu. AWS suggère que le service « facilite la découverte des faiblesses d’une application par les équipes afin d’améliorer les performances, l’observabilité et la tolérance aux erreurs ». Le mode de défaillance d’Amazon offre la possibilité de simuler une instance EC2 souffrant de stress sur ses disques, sa CPU ou sa mémoire. Les utilisateurs peuvent également explorer ce qui se passe lorsque des pods Kubernetes entiers sont supprimés.

Share the Post: