網易首頁 > 網易號 > 正文申請入駐

Claude 全球大宕機復盤：導彈還是成功稅？

2026-03-03 17:01:20　來源: 老馮云數

北京舉報

分享至

北京時間 3 月 2 日晚 19:49，Claude 崩了。

截止到本文發出時（次日 16:24），網頁端仍然沒有完全恢復。

網頁版彈出“Claude is currently experiencing a temporary service disruption”，客戶端登錄失敗，Console 報 500 錯誤。高峰時近 2000 名用戶同時報障。消息迅速傳開，社交媒體上一片哀嚎。

與此同時，另一條新聞正在刷屏：伊朗無人機炸了 AWS 在阿聯酋的數據中心。

兩件事撞到一起，一個極具戲劇性的敘事立刻成型——“AWS 中東機房被炸，Claude 跟著一起掛了！”媒體爭相報道，連 Bloomberg 都出了快訊。全球程序員瑟瑟發抖，紛紛感嘆“第三次世界大戰先打掉了我的 AI 編程助手”。

但這個敘事，大概率是錯的。

事實一：到底什么掛了，什么沒掛？

這是分析問題的起點，也是絕大多數人沒搞清楚的關鍵。

Anthropic 在事故發生后明確確認：Claude API（api.anthropic.com）工作正常。出問題的是：

注意這個模式：后端模型推理沒掛，前端界面和認證系統掛了。

Claude Code 的情況比較微妙——它本身走的是 API 通道，但在認證、會話管理等環節依賴了前端基礎設施，所以出現了“錯誤率升高”但并非完全不可用的癥狀。如果你在故障期間用的是直接調 API 的方式，你甚至可能完全沒感知到這次事故。正好比老馮這篇文章，正是使用 Claude Code 進行事實核查的。

這是一個非常重要的線索。這更像“認證與流量入口先爆，再向后擴散”，不是“核心推理集群被物理摧毀”。

事實二：AWS 中東被炸了什么？

我在另一篇分析中已經詳細梳理過，這里簡要回顧。

3 月 1 日，伊朗對阿聯酋和巴林發射無人機/導彈，AWS 在中東的數據中心遭遇直接打擊：

?UAE（me-central-1）：3 個可用區中 2 個癱瘓（mec1-az2 被直接命中起火，mec1-az3 連鎖斷電）?Bahrain（me-south-1）：3 個可用區中 1 個受損（mes1-az2 附近打擊造成物理損傷）?Israel（il-central-1）：未受影響

中東 9 個運營可用區里掛了 3 個，占比 33%。UAE 區域喪失 2/3 容量。這確實是 AWS 歷史上前所未有的物理災難——人類第一次用導彈無人機打掉了云計算基礎設施。但問題來了：Anthropic 的服務跑在中東嗎？

事實三：Claude 不在中東

問題的關鍵在于，Anthropic 是一家總部位于舊金山的 AI 公司。Claude 的模型推理集群，需要的是大規模 GPU 算力——H100/H200 集群。這些資源部署在 AWS 的 us-east-1（弗吉尼亞）、us-west-2（俄勒岡）等美國本土核心區域，而不是中東。

AWS 中東區域（me-central-1、me-south-1）是面向中東本地客戶的區域服務節點。這些區域主要服務于中東地區的企業客戶，部署的是標準的云計算服務（EC2、S3、RDS 等），而非大規模 AI 推理集群。

AWS 官方故障隔離文檔寫得很直白：Region 之間相互隔離，單 Region 故障原則上不應拖垮其他 Region。

如果 Claude 的核心推理引擎跑在中東，那 API 應該也掛了。 但 API 完全正常——這直接否定了“導彈打掉 Claude 后端”的假說。有人可能會說：“也許 AWS 在全球做了流量重路由，導致其他區域過載？”理論上存在這種可能，但如果是后端過載，受影響的應該是 API 響應速度和可用性，而不是前端的登錄認證系統。而實際表現恰恰相反——API 沒事，前端認證掛了。

真正的原因：成功稅

那么，真正的原因可能是什么呢？

讓我們把時間線往前撥 48 小時，看看 3 月 2 日之前發生了什么。

五角大樓風波

2 月底，一場政治風暴席卷了 AI 行業：

1.五角大樓要求 Anthropic 開放模型用于軍事用途（包括自主武器和監控系統），被 Dario Amodei 拒絕2.特朗普政府將 Anthropic 列為“激進左翼 AI 公司”，下令聯邦機構 6 個月內停用3.國防部長 Hegseth 將 Anthropic 定性為“供應鏈安全風險”4.OpenAI 隨即簽下 2 億美元五角大樓合同，接過了 Anthropic 拒絕的生意

這在普通消費者中引發了劇烈反應。

。戰爭部長說這是 “企業道德作秀”，但不得不說這個秀的效果確實極好。

用腳投票

?2 月 28 日：ChatGPT 美國卸載量暴漲 295%（正常日環比僅 9%）?2 月 28 日：Claude 下載量環比增長 51%?2 月 28 日：Claude 歷史上首次在美國 App Store 下載量超過 ChatGPT，登頂第一?此前 Claude 在 App Store 排名第 42 位（超級碗廣告后）?2026 年以來，Claude 免費活躍用戶增長 60%，日注冊量 翻了四倍

Reddit 和 X 上掀起了 “ 運動。用戶自發撰寫從 ChatGPT 遷移到 Claude 的教程。一場史無前例的 AI 產品“用腳投票”正在發生。

然后 Claude 就掛了

從 App Store 第 42 名到第 1 名。日注冊量翻四倍。海量新用戶在同一個周末涌入。

任何系統工程師看到這組數字，都知道接下來會發生什么。

前端服務——Web 界面、認證系統、會話管理——這些不是按照“突然涌入幾倍用戶”來設計容量的。后端 GPU 推理集群可以通過排隊和限流來扛住壓力，但前端的登錄、Session 管理、WebSocket 連接等服務，面對的是瞬時并發的沖擊。

這完美解釋了為什么：

?API 沒掛（API 用戶量相對穩定，且本來就有限流機制）?前端掛了（海量新用戶涌入 claude.ai 注冊/登錄）?Claude Code 部分受影響（依賴前端認證鏈路，但核心推理走 API）?Claude for Government 沒事（獨立部署，用戶量不受消費級市場波動影響）

時間線對不上

再看時間線：

AWS 中東事件從 3 月 1 日凌晨就開始了。如果 Claude 的故障與之相關，為什么延遲了 27 個小時才出現？而且出現的不是后端推理故障，而是前端認證崩潰？

更合理的時間線是：經過一個周末的病毒式傳播，周一（3 月 2 日）工作日開始，全球用戶密集上線，前端系統在北京時間周一晚（美東周一早晨）迎來峰值流量，然后——扛不住了。

11:49 UTC 恰好是美東早上 6:49——美國東海岸用戶開始新一天工作的時間。這不是巧合。

Anthropic 自己怎么說？

Anthropic 官方在事后表示，公司過去一周一直在應對 “unprecedented demand”（前所未有的需求）。

這句話本身就是答案。他們沒提 AWS 中東，沒提導彈，沒提區域故障。他們說的是——需求太大了。

這是一個好問題。甚至可以說，這是你能遇到的最好的問題之一。

在基礎設施運維的世界里，有兩種宕機：

1.需求不足導致的宕機：沒人用你的服務，但它還是掛了——這說明你的系統質量有問題2.需求過載導致的宕機：太多人想用你的服務——這說明你的產品太成功了

Claude 遇到的是第二種。這不是一個工程災難，這是一個 成功稅（Success Tax）。

當然，“成功稅”不代表可以不交。Anthropic 的前端基礎設施在面對用戶激增時的脆弱性暴露無遺。這也給所有 AI 公司上了一課：

?前端和認證系統的彈性擴展同樣關鍵——不是只有 GPU 集群需要彈性?消費級產品的流量特征與 API 完全不同——API 增長是線性的，消費級產品可能是指數的?政治事件可以在 48 小時內改變用戶規模的數量級——這是傳統容量規劃無法預見的

截至發稿：仍在波動

截至北京時間 3 月 3 日，Claude 的狀態頁顯示仍有活躍事故：

?06:59 UTC：Claude Opus 4.6 出現 elevated errors（正在調查）?03:15 - 04:43 UTC：claude.ai、cowork、platform、Claude Code 出現 elevated errors

服務在恢復與波動之間反復。這符合“容量不足逐步擴容”的特征，而不是“物理設施被毀等待重建”的特征。如果是后者，恢復曲線不會是這種漸進式的。

結論

AWS 中東數據中心被伊朗無人機炸了，這是事實。Claude 全球大宕機，這也是事實。但把這兩件事畫等號——那是在偷懶。

證據鏈清晰地指向一個判斷：Claude 的故障本質上是一次 容量過載事故，誘因是 OpenAI 五角大樓合同引發的大規模用戶遷移。從 App Store 第 42 名到第 1 名，日注冊量翻四倍——沒有幾個前端系統能在 48 小時內毫無準備地接住這種沖擊。

導彈炸的是機房，掛的是中東客戶的 EC2 和 S3。用戶洪流沖的是登錄頁面，掛的是 claude.ai 的認證系統。

兩件事，兩個原因，兩條因果鏈。恰好撞在了同一個周末。

對 Anthropic 來說，這反而是一個微妙的好消息：你的競爭對手（OpenAI）幫你做了你自己花多少錢都買不來的用戶增長。代價只是一次前端宕機和一個尷尬的周末。

這個故障，恐怕 Dario Amodei 做夢都會笑醒。

聲明：本文碳基智力含量：約 20% References

[1] Anthropic confirms Claude is down in a worldwide outage - BleepingComputer:https://www.bleepingcomputer.com/news/artificial-intelligence/anthropic-confirms-claude-is-down-in-a-worldwide-outage/
[2]Anthropic's Claude Chatbot Goes Down For Thousands of Users - Bloomberg:https://www.bloomberg.com/news/articles/2026-03-02/anthropic-s-claude-chatbot-goes-down-for-thousands-of-users
[3]ChatGPT uninstalls surged by 295% after DoD deal - TechCrunch:https://techcrunch.com/2026/03/02/chatgpt-uninstalls-surged-by-295-after-dod-deal/?type=AI
[4]Claude beats ChatGPT in U.S. app downloads - Axios:https://www.axios.com/2026/03/01/anthropic-claude-chatgpt-app-downloads-pentagon
[5]Anthropic's Claude overtakes ChatGPT in App Store - Fortune:https://fortune.com/2026/03/02/anthropic-claude-dario-amodei-number-one-app-store-openai-chatgpt-sam-altman-department-war/
[6]AWS says drones hit two of its datacenters in UAE - The Register:https://www.theregister.com/2026/03/02/amazon_outages_middle_east/
[7]Claude Goes Down Globally as AWS Data Centers Burn - Awesome Agents:https://awesomeagents.ai/news/claude-outage-march-2026-aws-middle-east/
[8]Claude Status Page:https://status.claude.com/
[9]Why Is Claude Not Working? - Techloy:https://www.techloy.com/why-is-claude-not-working-everything-we-know-about-the-anthropic-outage/
[10]AWS Global Infrastructure: https://aws.amazon.com/about-aws/global-infrastructure/regions_az/

專欄：云計算泥石流

云故障

云資源

下云記

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.