Cloudflare Am 18. November 2025 kam es ab etwa 11:20 UTC zu einem großflächigen Dienstausfall. Die Störung beeinträchtigte einen Großteil des globalen Internetverkehrs und führte zu Dienstunterbrechungen auf allen wichtigen Plattformen, darunter ChatGPTClaude, Spotify, X und HostScore.netDer Fehler führte zu anhaltenden HTTP-5xx-Fehlern, unterbrochenen Authentifizierungsabläufen und erhöhter Latenz innerhalb des Netzwerks. Cloudflare's Netzwerk.
Cloudflare Später wurde bestätigt, dass der Vorfall nicht durch einen Cyberangriff verursacht wurde, entgegen anfänglicher Spekulationen aufgrund des Ausmaßes und der Symptome des Ausfalls. Diese Mitteilung dient als offizielles Update für unsere Leser, Partner und Stakeholder. Wir dokumentieren darin den Hergang, die Ausbreitung und die Wiederherstellung der Dienste.
Ausmaß der Störung
Der Ausfall verursachte Cloudflare'Ergebnis CDN und Sicherheitsebenen, die die normale Verarbeitung des Datenverkehrs unterbrachen, was zu einem starken Anstieg von HTTP-5xx-Fehlern im gesamten Netzwerk führte. Besucher betroffener Websites stießen auf Fehlerseiten, Ladeverzögerungen oder lange Wartezeiten. CloudflareDie Proxy-Schicht von hatte Schwierigkeiten, zu reagieren. Wichtige Dienste wie Bot-Management, Turnstile, Workers KV und Cloudflare Gleichzeitig verschlechterte sich der Zugriff. Die Auswirkungen verstärkten sich für Websites, die darauf angewiesen waren. Cloudflare für Caching, Sicherheit und Authentifizierung.
CloudflareDas Dashboard war ebenfalls schwer zugänglich, da Turnstile, die Verifizierungsschicht auf der Anmeldeseite, nicht geladen wurde. Auch die extern gehostete Statusseite des Unternehmens war offline, was in den ersten Minuten des Vorfalls für Verwirrung sorgte. CloudflareDie E-Mail-Infrastruktur von funktionierte weiterhin, die Genauigkeit der Spam-Erkennung nahm jedoch kurzzeitig aufgrund des Ausfalls eines IP-Reputationsfeeds ab.
Grundursache: Der latente Fehler
Cloudflare bestätigte, dass der Ausfall durch einen latenten Fehler in einer Kernkomponente des Bot-Management-Systems ausgelöst wurde.
Um 11:05 UTC führte eine routinemäßige Aktualisierung der Datenbankberechtigungen unbeabsichtigt zu einer Änderung der Metadatenabfrage des Feature-Generierungsdienstes. Anstatt Daten aus einem einzigen Schema abzurufen, fragte der Dienst sowohl das Standard- als auch das r0-Schema ab, was zu einer großen Anzahl doppelter Feature-Zeilen führte. Diese aufgeblähte Konfigurationsdatei wurde anschließend weitergegeben. Cloudflareglobales Netzwerk.
Die Kern-Proxy-Engine setzt aus Performance- und Speichergründen eine Obergrenze von 200 Machine-Learning-Features fest. Die zu große Datei überschritt diese Grenze, was zu einem Absturz des FL2-Proxys und der Rückgabe von 5xx-Fehlern für alle betroffenen Anfragen führte. Kunden, die noch die ältere FL-Engine nutzten, schieden zwar nicht sofort aus, ihre Bot-Management-Werte wurden jedoch auf null gesetzt, was zu einer inkonsistenten Verarbeitung des Datenverkehrs führte.
Zeitplan für die Lösung
Cloudflare Die erste Fehlerwelle im Kundenverkehr wurde um 11:28 UTC festgestellt.
Die Ingenieure konzentrierten sich zunächst auf Workers KV, wo es zwischen 11:32 und 13:05 UTC zu einem ungewöhnlichen Rückgang der Antwortraten kam.
Um 13:04 UTC Cloudflare Es wurde ein Notfall-Patch angewendet, um den Core-Proxy für Workers KV zu umgehen, gefolgt von einer ähnlichen Umgehung für Cloudflare Zugriff um 13:05 UTC.
Um 13:37 UTC begann das Entwicklerteam, die Bot-Management-Konfiguration auf eine als funktionierend bekannte Version zurückzusetzen.
Cloudflare Die Erstellung neuer Feature-Dateien wurde um 14:24 UTC gestoppt und die korrigierte Konfiguration um 14:30 UTC global bereitgestellt, wodurch der normale Datenverkehr wiederhergestellt wurde.
Die Anmeldeprobleme beim Dashboard wurden später behoben, der vollständige Zugriff auf das Kontrollpanel war gegen 15:30 UTC wiederhergestellt. Cloudflare Der Vorfall wurde um 17:06 UTC als vollständig behoben gemeldet.
HostScore.net Folgenabschätzung
HostScore.net war einer der Standorte, die während des Ausfallzeitraums betroffen waren. Unser Team beobachtete sofortige Spitzenwerte bei 5xx-Fehlermeldungen und vorübergehende Nichtverfügbarkeit. Cloudflare CDN und die Sicherheitsebenen konnten die Anfragen nicht verarbeiten. Die Wiederherstellung des Standorts erfolgte schrittweise. Cloudflare Die Rücknahme- und Wiederherstellungsmaßnahmen wurden umgesetzt.
Unsere Überwachungssysteme erkannten das Problem innerhalb weniger Minuten, und wir überwachten das Netzwerkverhalten weiter, bis die volle Stabilität wiederhergestellt war. Obwohl die Störung ihren Ursprung außerhalb unserer Infrastruktur hatte, setzen wir weiterhin auf Transparenz und werden unsere Überwachungs- und Notfallprozesse weiter verbessern, um die allgemeine Serviceverfügbarkeit zu erhöhen.
CloudflareBestätigung und Maßnahmen nach dem Vorfall
Cloudflare hat die Schwere des Vorfalls öffentlich anerkannt.CTO Dane Knecht entschuldigte sich und erklärte, das Unternehmen habe „seine Kunden und das gesamte Internet im Stich gelassen“. Das Unternehmen bezeichnete den Vorfall als seinen schwerwiegendsten Ausfall seit 2019 und unterstrich damit, wie sich ein kleiner Konfigurationsfehler auf groß angelegte verteilte Systeme auswirken kann.
Cloudflare hat mit der Arbeit an mehreren langfristigen Verbesserungen begonnen, darunter die Optimierung des Einspielprozesses für intern generierte Konfigurationsdateien, die Erweiterung globaler Not-Aus-Schalter zur schnelleren Isolierung fehlerhafter Komponenten und die Verhinderung von Ressourcenverbrauch durch Fehlermeldungen. Mit einer Infrastruktur, die sich über 330 Städte erstreckt und schätzungsweise 20 % des Internets versorgt, Cloudflare betonte sein Engagement, ähnliche Fehler in Zukunft zu verhindern.
Fazit
Dieser Vorfall verdeutlicht, wie sehr das heutige Internet von einer kleinen Anzahl grundlegender Dienstanbieter abhängt. Wenn eines dieser Netzwerke ausfällt, können die Auswirkungen innerhalb von Minuten Millionen von Nutzern erreichen. Cloudflare arbeitet an seinem Sanierungsplan HostScore.net bleibt der Transparenz, der kontinuierlichen Überwachung und den ständigen Verbesserungen verpflichtet, die die Widerstandsfähigkeit unserer Plattform und die Zuverlässigkeit der Dienste, auf die unsere Leser angewiesen sind, stärken.