In einem englischen Blog hat Facebook davon berichtet, dass eine fehlerhafte Änderung an der Netzwerk-Konfiguration für den stundenlangen Ausfall verantwortlich war. Betroffen waren demnach die Backbone-Router, die für den Netzwerkverkehr zwischen den Rechenzentren verantwortlich sind.
Laut Facebook waren nicht nur die beliebten Dienste betroffen, sondern auch interne Systeme. Es habe außerdem sehr viel Zeit gekostet, bis man das Problem lokalisieren und beheben konnte. Der Ausfall der Backbone-Server soll wohl einen sog. Kaskadeneffekt ausgelöst haben.
Bevor die Ursache bekannt war, haben einige Experten bereits vermutet, dass Fehler an der Netzwerkkonfiguration für den Ausfall verantwortlich sein könnten.
Cloudflare-Manager Dane Knecht hat ein BGP-Problem vermutet. Border Gateway Protocol (BGP) verbindet die autonomen Systeme (AS) des Internets miteinander. Wenn diese jetzt aber nicht mehr zu Facebook leiten, sind die DNS-Server von Facebook schlichtweg nicht zu erreichen und es kommt zu Ausfällen.
Laut Facebook sollen durch den Ausfall keine Nutzerdaten betroffen gewesen sein. Darüber hinaus entschuldigt sich der Social-Media-Gigant bei allen Betroffenen für die verursachten Unannehmlichkeiten. Mittlerweile sollen alle Facebook-Dienste aber wieder reibungslos funktionieren.
In Zukunft möchte Facebook dafür sorgen, dass die eigene Infrastruktur deutlich robuster wird, damit so etwas nicht noch einmal passiert. Wie das Unternehmen das umsetzen möchte, ist aber nicht bekannt.
Der Ausfall ging etwa gegen 17:30 am 4. Oktober 2021 los. Ab Mitternacht wurde es dann besser. Neben Facebook selbst waren WhatsApp, Facebook Messenger, Instagram und das System Oculus VR betroffen.