Une panne AWS a affecté cette nuit plusieurs sites et services américains dont Alexa, Netflix et Disney+. Des milliers d’utilisateurs n’ont pu profiter de ces contenus connectés durant plusieurs heures.
En théorie, les infrastructures cloud des hyperscalers sont tellement redondantes que les pannes et incidents n’impactent pas ou peu les services hébergés. En pratique, tous les fournisseurs de Cloud connaissent des périodes où certains services se retrouvent momentanément totalement indisponibles soit suite à une erreur humaine de configuration d’un service soit suite à la défaillance d’un équipement clé (souvent un équipement réseau). Le problème est que les services au sein d’un cloud sont tous plus ou moins interconnectés et que les effets dominos en cas d’incidents sont presque systématiques.
Microsoft et Google ont connu quelques pannes majeures en début d’année 2021 touchant principalement leurs environnements collaboratifs. En cette fin d’année c’est AWS qui se fait remarquer avec une panne d’un équipement réseau sur sa région « US-East-1 » perturbant fortement certaines API AWS sur lesquels reposaient notamment de nombreux services de VOD à commencer par Amazon Prime Video mais aussi Netflix et Disney+. Selon la société d’analyse réseau Kentik, la panne aurait engendré une chute de 26% du trafic sur le service Netflix (dont les infrastructures reposent essentiellement sur AWS). La panne n’a pas affecté que des services vidéos : Alexa, Slack, Coinbase, Chime, iRobot, et différents autres sites Web et services de paiements ont également été touchés par cette indisponibilité des services AWS.
Les premiers dysfonctionnements ont été détectés vers 18h30 (heure française). AWS a mis en place un correctif vers 23H00 mais la situation n’est vraiment revenue à la normale que vers 1h30 ce matin.