Facebook a révélé la cause de l’une des pires interruptions de service jamais enregistrées sur le site de réseau social. La panne a eu lieu le lundi 4 octobre et a affecté des milliards d’utilisateurs dans le monde entier pendant environ 6 heures. Elle a également mis hors service d’autres services appartenant à Facebook, tels que Messenger, Instagram et WhatsApp.
Pendant la panne, Facebook s’est rendue sur Twitter pour prendre acte de la situation et s’excuser de la gêne occasionnée. Mais ce n’est que mardi matin, alors que le service avait été en grande partie rétabli, que l’entreprise a donné à sa communauté mondiale la raison de cet incident.
Dans un article de blog, Facebook a apparemment écarté l’hypothèse d’un piratage ou d’un acte infâme de ce type, affirmant plutôt que la panne a été causée par des modifications de la configuration de ses routeurs qui ont empêché ses systèmes informatiques de communiquer entre eux.
« Nos équipes d’ingénieurs ont appris que des changements de configuration sur les routeurs dorsaux qui coordonnent le trafic réseau entre nos centres de données ont causé des problèmes qui ont interrompu cette communication », a déclaré Facebook dans son article de blog, ajoutant : « Cette perturbation du trafic réseau a eu un effet en cascade sur la façon dont nos centres de données communiquent, entraînant l’arrêt de nos services ».
Refusant d’entrer dans les détails, elle a réaffirmé que « pour le moment, nous pensons que la cause profonde de cette panne était un changement de configuration défectueux », ajoutant qu’elle n’a « aucune preuve que les données des utilisateurs ont été compromises à la suite de cette interruption ».
Une erreur qui coûte cher
Facebook a confirmé que ses systèmes sont à nouveau opérationnels, mais a déclaré que le problème a pris plus de temps que prévu à résoudre, parce que la cause sous-jacente « a également eu un impact sur de nombreux outils et systèmes internes que nous utilisons dans nos opérations quotidiennes, ce qui a compliqué nos tentatives de diagnostiquer et de résoudre rapidement le problème ».
Elle a ajouté : « Nous présentons nos excuses à toutes les personnes touchées, et nous nous efforçons de mieux comprendre ce qui s’est passé aujourd’hui afin de continuer à rendre notre infrastructure plus résiliente ». Si vous êtes désireux de plonger plus profondément dans ce qui s’est passé, consultez l’explication super-détaillée de Cloudflare.
La catastrophe a fait perdre près de 50 milliards de dollars à la valeur boursière de l’entreprise et aurait également coûté à Facebook environ 79 millions de dollars en recettes publicitaires.
Pendant le temps d’arrêt, de nombreuses personnes ont utilisé Twitter pour se moquer de la situation. Twitter elle-même s’est mise de la partie en tweetant « Hello literally everyone », alors que de plus en plus de personnes affluaient sur le service de microblogging pour savoir pourquoi elles ne pouvaient pas accéder à Facebook, Instagram et WhatsApp.