Cloudflare 此次故障導致全球主要網站癱瘓,其中包括 HostScore.net

揭露:內容 HostScore.net 新聞部分可能包括第三方的付費公關投稿。所表達的觀點僅代表各自公司的觀點。 在此處了解有關我們的 PR 提交的更多資訊。

Cloudflare 2025年11月18日,大約從世界協調時11:20開始,發生了大規模的服務中斷。此次中斷影響了全球大部分網路流量,並導致包括以下平台在內的多個主要平台的服務中斷: ChatGPT克勞德、Spotify、X 和 HostScore.net此次故障導致持續出現 HTTP 5xx 錯誤、驗證流程中斷以及延遲增加。 Cloudflare的網絡。

Cloudflare 儘管故障規模和症狀引發了早期猜測,但隨後證實該事件並非網路攻擊所致。本公告旨在向我們的讀者、合作夥伴和利害關係人提供官方更新,記錄事件經過、蔓延情況以及服務最終恢復情況。

顛覆範圍

停電導致 Cloudflare'分數 CDN 安全層停止了正常的流量處理,導致整個網路中的 HTTP 5xx 錯誤數量急劇上升。受影響網站的訪客會遇到錯誤頁面、載入停滯或長時間延遲等問題。 Cloudflare代理層響應困難。關鍵服務包括機器人管理、旋轉門、員工 KV 等。 Cloudflare 同時,訪問能力下降。這對依賴於此的網站造成了更大的影響。 Cloudflare 用於快取、安全性和身份驗證。

Cloudflare由於登入頁面上的驗證層 Turnstile 載入失敗,導致使用者難以存取公司的控制面板。此外,公司外部託管的狀態頁面也離線了,這在事件發生的最初幾分鐘內造成了混亂。 Cloudflare的電子郵件基礎設施繼續運行,由於 IP 信譽資訊遺失,垃圾郵件偵測準確率短暫下降。

根本原因:潛在的漏洞

Cloudflare 經證實,這次故障是由其機器人管理系統核心組件中的潛在漏洞引發的。

UTC時間11:05,一次例行的資料庫權限更新意外地改變了特徵產生服務查詢元資料的方式。該服務不再從單一模式中提取數據,而是開始同時查詢預設模式和r0模式,導致產生了大量重複的特徵行。隨後,這個臃腫的輪廓被傳播開來。 Cloudflare的全球網絡。

核心代理引擎出於效能和記憶體分配的考慮,對機器學習特徵的數量設定了200個的硬性限制。由於檔案過大,超過了此限制,導致FL2代理程式崩潰,並對所有受影響的請求返回5xx錯誤。仍在使用舊版FL引擎的客戶雖然沒有直接失敗,但他們的機器人管理評分被重置為零,導致流量處理不一致。

解決時間表

Cloudflare UTC 時間 11:28 偵測到客戶流量中的第一波錯誤。

工程師最初將注意力集中在 Workers KV 上,該節點在 UTC 時間 11:32 至 13:05 之間響應率出現異常下降。

UTC時間13:04 Cloudflare 應用了一個緊急補丁來繞過 Workers KV 的核心代理,隨後又對其他元件應用了類似的繞過方法。 Cloudflare 訪問時間為世界協調時 13:05。

到 UTC 時間 13:37,工程團隊開始將 Bot 管理配置回滾到已知良好的版本。

Cloudflare UTC 時間 14:24 停止建立新的功能文件,UTC 時間 14:30 在全球部署了更正後的配置,從而恢復了正常的流量。

儀表板登入問題後來得到解決,控制面板存取權限於 UTC 時間 15:30 左右完全恢復。 Cloudflare 事件於世界協調時 17:06 完全解決。

HostScore.net 影響報告

HostScore.net 在故障期間,該網站也受到了影響。我們的團隊觀察到 5xx 回應數量立即激增,並且網站暫時無法存取。 Cloudflare“ CDN 安全層未能處理請求。網站恢復過程逐漸進行。 Cloudflare 已實施回滾和恢復步驟。

我們的監控系統在幾分鐘內就偵測到了問題,我們持續追蹤網路運作狀況,直到網路完全恢復穩定。雖然這次故障源自於我們基礎設施的上游,但我們始終秉持透明原則,並將持續改善監控和緊急計畫流程,以增強整體服務的穩定性。

Cloudflare的確認和事後行動

Cloudflare 公開承認了事件的嚴重性。首席技術長丹·克內希特發表道歉聲明,稱公司「辜負了客戶和整個網路」。該公司將這起事件描述為自 2019 年以來最嚴重的故障,凸顯了一個小小的配置錯誤如何在大型分散式系統中引發連鎖反應。

Cloudflare 已著手進行多項長期改進,包括強化內部產生設定檔的攝取流程、擴展全域終止開關以更快地隔離故障元件,以及防止錯誤報告激增消耗系統資源。其基礎設施覆蓋 330 個城市,為約 20% 的網路流量提供支援。 Cloudflare 強調其致力於防止未來發生類似事故。

結束語

這次事件凸顯了當今網路對少數基礎服務供應商的依賴程度。一旦這些網路中的任何一個出現故障,其連鎖反應就會在幾分鐘內波及數百萬用戶。 Cloudflare 正在製定補救計劃, HostScore.net 我們始終致力於保持透明、持續監控和不斷改進,以增強我們平台的韌性以及讀者所依賴的服務的可靠性。

/ Cloudflare 此次故障導致全球主要網站癱瘓,其中包括 HostScore.net

更多HostScore內容

提交您的公司新聞

尋找宣傳機會 HostScore.net?

與我們的讀者分享貴公司的最新成就、產品公告和公司里程碑。使用此自助提交表格和支付網關立即開始。

提交新聞(自助服務)

探索我們的網站

HostScore 成立的目的是為那些尋求網站託管解決方案的人提供機會,讓他們在花一分錢之前了解他們需要了解的一切主機知識