Cloudflare 此次故障导致全球主要网站瘫痪,其中包括 HostScore.net

披露:内容 HostScore.net 新闻版块可能包含第三方付费公关稿件。文中表达的观点仅代表相关公司的观点。 在此了解有关我们的 PR 提交的更多信息。

Cloudflare 2025年11月18日,大约从世界协调时11:20开始,发生了大范围的服务中断。此次中断影响了全球大部分互联网流量,并导致包括以下平台在内的多个主要平台的服务中断: ChatGPT克劳德、Spotify、X 和 HostScore.net此次故障导致持续出现 HTTP 5xx 错误、身份验证流程中断以及延迟增加。 Cloudflare的网络。

Cloudflare 尽管故障规模和症状引发了早期猜测,但随后证实该事件并非网络攻击所致。本公告旨在向我们的读者、合作伙伴和利益相关者提供官方更新,记录事件经过、蔓延情况以及服务最终恢复情况。

干扰范围

停电导致 Cloudflare'分数 CDN 安全层停止了正常的流量处理,导致整个网络中的 HTTP 5xx 错误数量急剧上升。受影响网站的访问者会遇到错误页面、加载停滞或长时间延迟等问题。 Cloudflare代理层响应困难。关键服务包括机器人管理、旋转门、员工 KV 等。 Cloudflare 与此同时,访问能力下降。这对依赖于此的网站造成了更大的影响。 Cloudflare 用于缓存、安全和身份验证。

Cloudflare由于登录页面上的验证层 Turnstile 加载失败,导致用户难以访问公司的控制面板。此外,公司外部托管的状态页面也离线了,这在事件发生的最初几分钟内造成了混乱。 Cloudflare的电子邮件基础设施继续运行,由于 IP 信誉信息丢失,垃圾邮件检测准确率短暂下降。

根本原因:潜在的漏洞

Cloudflare 经证实,此次故障是由其机器人管理系统核心组件中的潜在漏洞引发的。

UTC时间11:05,一次例行的数据库权限更新意外地改变了特征生成服务查询元数据的方式。该服务不再从单个模式中提取数据,而是开始同时查询默认模式和r0模式,导致生成了大量重复的特征行。随后,这个臃肿的配置文件被传播开来。 Cloudflare的全球网络。

核心代理引擎出于性能和内存分配的考虑,对机器学习特征的数量设置了200个的硬性限制。由于文件过大,超过了此限制,导致FL2代理崩溃,并对所有受影响的请求返回5xx错误。仍在使用旧版FL引擎的客户虽然没有直接失败,但他们的机器人管理评分被重置为零,导致流量处理不一致。

解决时间表

Cloudflare UTC 时间 11:28 检测到客户流量中的第一波错误。

工程师最初将注意力集中在 Workers KV 上,该节点在 UTC 时间 11:32 至 13:05 之间响应率出现异常下降。

UTC时间13:04 Cloudflare 应用了一个紧急补丁来绕过 Workers KV 的核心代理,随后又对其他组件应用了类似的绕过方法。 Cloudflare 访问时间为世界协调时 13:05。

到 UTC 时间 13:37,工程团队开始将 Bot 管理配置回滚到已知良好的版本。

Cloudflare UTC 时间 14:24 停止创建新的功能文件,UTC 时间 14:30 在全球范围内部署了更正后的配置,从而恢复了正常的流量。

仪表盘登录问题后来得到解决,控制面板访问权限于 UTC 时间 15:30 左右完全恢复。 Cloudflare 事件于世界协调时 17:06 完全解决。

HostScore.net 影响声明

HostScore.net 在故障期间,该网站也受到了影响。我们的团队观察到 5xx 响应数量立即激增,并且网站暂时无法访问。 Cloudflare“ CDN 安全层未能处理请求。网站恢复过程逐渐进行。 Cloudflare 已实施回滚和恢复步骤。

我们的监控系统在几分钟内就检测到了问题,我们持续跟踪网络运行状况,直至网络完全恢复稳定。虽然此次故障源于我们基础设施的上游,但我们始终秉持透明原则,并将继续改进监控和应急预案流程,以增强整体服务的稳定性。

Cloudflare的确认和事后行动

Cloudflare 公开承认了事件的严重性。首席技术官丹·克内希特发表道歉声明,称公司“辜负了客户和整个互联网”。该公司将此次事件描述为自 2019 年以来最严重的故障,凸显了一个小小的配置错误如何在大型分布式系统中引发连锁反应。

Cloudflare 已着手进行多项长期改进,包括强化内部生成配置文件的摄取流程、扩展全局终止开关以更快地隔离故障组件,以及防止错误报告激增消耗系统资源。其基础设施覆盖 330 个城市,为约 20% 的网络流量提供支持。 Cloudflare 强调其致力于防止未来发生类似事故。

总结

这次事件凸显了当今互联网对少数基础服务提供商的依赖程度。一旦这些网络中的任何一个出现故障,其连锁反应就会在几分钟内波及数百万用户。 Cloudflare 正在制定补救计划, HostScore.net 我们始终致力于保持透明、持续监控和不断改进,以增强我们平台的韧性以及读者所依赖的服务的可靠性。

/ Cloudflare 此次故障导致全球主要网站瘫痪,其中包括 HostScore.net

更多HostScore内容

提交您的公司新闻

寻找宣传机会 HostScore.net?

与我们的读者分享贵公司的最新成就、产品公告和公司里程碑。使用此自助提交表单和支付网关,立即开始。

提交新闻(自助服务)

探索我们的网站

HostScore 成立的目的是为那些寻求网络托管解决方案的人提供机会,让他们在花一分钱之前了解他们需要了解的一切主机知识