北京時間 3 月 2 日晚 19:49,Claude 崩了。
截止到本文發出時(次日 16:24),網頁端仍然沒有完全恢復。
網頁版彈出“Claude is currently experiencing a temporary service disruption”,客戶端登錄失敗,Console 報 500 錯誤。高峰時近 2000 名用戶同時報障。消息迅速傳開,社交媒體上一片哀嚎。
與此同時,另一條新聞正在刷屏:伊朗無人機炸了 AWS 在阿聯酋的數據中心。
兩件事撞到一起,一個極具戲劇性的敘事立刻成型——“AWS 中東機房被炸,Claude 跟著一起掛了!”媒體爭相報道,連 Bloomberg 都出了快訊。全球程序員瑟瑟發抖,紛紛感嘆“第三次世界大戰先打掉了我的 AI 編程助手”。
![]()
但這個敘事,大概率是錯的。
事實一:到底什么掛了,什么沒掛?
這是分析問題的起點,也是絕大多數人沒搞清楚的關鍵。
Anthropic 在事故發生后明確確認:Claude API(api.anthropic.com)工作正常。出問題的是:
![]()
注意這個模式:后端模型推理沒掛,前端界面和認證系統掛了。
Claude Code 的情況比較微妙——它本身走的是 API 通道,但在認證、會話管理等環節依賴了前端基礎設施,所以出現了“錯誤率升高”但并非完全不可用的癥狀。如果你在故障期間用的是直接調 API 的方式,你甚至可能完全沒感知到這次事故。正好比老馮這篇文章,正是使用 Claude Code 進行事實核查的。
這是一個非常重要的線索。這更像“認證與流量入口先爆,再向后擴散”,不是“核心推理集群被物理摧毀”。
事實二:AWS 中東被炸了什么?
我在另一篇分析中已經詳細梳理過,這里簡要回顧。
3 月 1 日,伊朗對阿聯酋和巴林發射無人機/導彈,AWS 在中東的數據中心遭遇直接打擊:
?UAE(me-central-1):3 個可用區中 2 個癱瘓(mec1-az2 被直接命中起火,mec1-az3 連鎖斷電)?Bahrain(me-south-1):3 個可用區中 1 個受損(mes1-az2 附近打擊造成物理損傷)?Israel(il-central-1):未受影響
![]()
中東 9 個運營可用區里掛了 3 個,占比 33%。UAE 區域喪失 2/3 容量。這確實是 AWS 歷史上前所未有的物理災難——人類第一次用導彈無人機打掉了云計算基礎設施。但問題來了:Anthropic 的服務跑在中東嗎?
事實三:Claude 不在中東
問題的關鍵在于,Anthropic 是一家總部位于舊金山的 AI 公司。Claude 的模型推理集群,需要的是大規模 GPU 算力——H100/H200 集群。這些資源部署在 AWS 的 us-east-1(弗吉尼亞)、us-west-2(俄勒岡)等美國本土核心區域,而不是中東。
AWS 中東區域(me-central-1、me-south-1)是面向中東本地客戶的區域服務節點。這些區域主要服務于中東地區的企業客戶,部署的是標準的云計算服務(EC2、S3、RDS 等),而非大規模 AI 推理集群。
AWS 官方故障隔離文檔寫得很直白:Region 之間相互隔離,單 Region 故障原則上不應拖垮其他 Region。
如果 Claude 的核心推理引擎跑在中東,那 API 應該也掛了。 但 API 完全正常——這直接否定了“導彈打掉 Claude 后端”的假說。有人可能會說:“也許 AWS 在全球做了流量重路由,導致其他區域過載?”理論上存在這種可能,但如果是后端過載,受影響的應該是 API 響應速度和可用性,而不是前端的登錄認證系統。而實際表現恰恰相反——API 沒事,前端認證掛了。
真正的原因:成功稅
那么,真正的原因可能是什么呢?
讓我們把時間線往前撥 48 小時,看看 3 月 2 日之前發生了什么。
五角大樓風波
2 月底,一場政治風暴席卷了 AI 行業:
1.五角大樓要求 Anthropic 開放模型用于軍事用途(包括自主武器和監控系統),被 Dario Amodei 拒絕2.特朗普政府將 Anthropic 列為“激進左翼 AI 公司”,下令聯邦機構 6 個月內停用3.國防部長 Hegseth 將 Anthropic 定性為“供應鏈安全風險”4.OpenAI 隨即簽下 2 億美元五角大樓合同,接過了 Anthropic 拒絕的生意
這在普通消費者中引發了劇烈反應。
。戰爭部長說這是 “企業道德作秀”,但不得不說這個秀的效果確實極好。
用腳投票
?2 月 28 日:ChatGPT 美國卸載量暴漲 295%(正常日環比僅 9%)?2 月 28 日:Claude 下載量環比增長 51%?2 月 28 日:Claude 歷史上首次在美國 App Store 下載量超過 ChatGPT,登頂第一?此前 Claude 在 App Store 排名第 42 位(超級碗廣告后)?2026 年以來,Claude 免費活躍用戶增長 60%,日注冊量 翻了四倍
Reddit 和 X 上掀起了 “ 運動。用戶自發撰寫從 ChatGPT 遷移到 Claude 的教程。一場史無前例的 AI 產品“用腳投票”正在發生。
![]()
然后 Claude 就掛了
從 App Store 第 42 名到第 1 名。日注冊量翻四倍。海量新用戶在同一個周末涌入。
任何系統工程師看到這組數字,都知道接下來會發生什么。
前端服務——Web 界面、認證系統、會話管理——這些不是按照“突然涌入幾倍用戶”來設計容量的。后端 GPU 推理集群可以通過排隊和限流來扛住壓力,但前端的登錄、Session 管理、WebSocket 連接等服務,面對的是瞬時并發的沖擊。
這完美解釋了為什么:
?API 沒掛(API 用戶量相對穩定,且本來就有限流機制)?前端掛了(海量新用戶涌入 claude.ai 注冊/登錄)?Claude Code 部分受影響(依賴前端認證鏈路,但核心推理走 API)?Claude for Government 沒事(獨立部署,用戶量不受消費級市場波動影響)
時間線對不上
再看時間線:
![]()
AWS 中東事件從 3 月 1 日凌晨就開始了。如果 Claude 的故障與之相關,為什么延遲了 27 個小時才出現?而且出現的不是后端推理故障,而是前端認證崩潰?
更合理的時間線是:經過一個周末的病毒式傳播,周一(3 月 2 日)工作日開始,全球用戶密集上線,前端系統在北京時間周一晚(美東周一早晨)迎來峰值流量,然后——扛不住了。
11:49 UTC 恰好是美東早上 6:49——美國東海岸用戶開始新一天工作的時間。這不是巧合。
Anthropic 自己怎么說?
Anthropic 官方在事后表示,公司過去一周一直在應對 “unprecedented demand”(前所未有的需求)。
這句話本身就是答案。他們沒提 AWS 中東,沒提導彈,沒提區域故障。他們說的是——需求太大了。
這是一個好問題。甚至可以說,這是你能遇到的最好的問題之一。
在基礎設施運維的世界里,有兩種宕機:
1.需求不足導致的宕機:沒人用你的服務,但它還是掛了——這說明你的系統質量有問題2.需求過載導致的宕機:太多人想用你的服務——這說明你的產品太成功了
Claude 遇到的是第二種。這不是一個工程災難,這是一個 成功稅(Success Tax)。
當然,“成功稅”不代表可以不交。Anthropic 的前端基礎設施在面對用戶激增時的脆弱性暴露無遺。這也給所有 AI 公司上了一課:
?前端和認證系統的彈性擴展同樣關鍵——不是只有 GPU 集群需要彈性?消費級產品的流量特征與 API 完全不同——API 增長是線性的,消費級產品可能是指數的?政治事件可以在 48 小時內改變用戶規模的數量級——這是傳統容量規劃無法預見的
截至發稿:仍在波動
截至北京時間 3 月 3 日,Claude 的狀態頁顯示仍有活躍事故:
?06:59 UTC:Claude Opus 4.6 出現 elevated errors(正在調查)?03:15 - 04:43 UTC:claude.ai、cowork、platform、Claude Code 出現 elevated errors
![]()
服務在恢復與波動之間反復。這符合“容量不足逐步擴容”的特征,而不是“物理設施被毀等待重建”的特征。如果是后者,恢復曲線不會是這種漸進式的。
結論
AWS 中東數據中心被伊朗無人機炸了,這是事實。Claude 全球大宕機,這也是事實。但把這兩件事畫等號——那是在偷懶。
證據鏈清晰地指向一個判斷:Claude 的故障本質上是一次 容量過載事故,誘因是 OpenAI 五角大樓合同引發的大規模用戶遷移。從 App Store 第 42 名到第 1 名,日注冊量翻四倍——沒有幾個前端系統能在 48 小時內毫無準備地接住這種沖擊。
導彈炸的是機房,掛的是中東客戶的 EC2 和 S3。用戶洪流沖的是登錄頁面,掛的是 claude.ai 的認證系統。
兩件事,兩個原因,兩條因果鏈。恰好撞在了同一個周末。
對 Anthropic 來說,這反而是一個微妙的好消息:你的競爭對手(OpenAI)幫你做了你自己花多少錢都買不來的用戶增長。代價只是一次前端宕機和一個尷尬的周末。
這個故障,恐怕 Dario Amodei 做夢都會笑醒。
聲明:本文碳基智力含量:約 20% References
[1] Anthropic confirms Claude is down in a worldwide outage - BleepingComputer:https://www.bleepingcomputer.com/news/artificial-intelligence/anthropic-confirms-claude-is-down-in-a-worldwide-outage/[2]Anthropic's Claude Chatbot Goes Down For Thousands of Users - Bloomberg:https://www.bloomberg.com/news/articles/2026-03-02/anthropic-s-claude-chatbot-goes-down-for-thousands-of-users[3]ChatGPT uninstalls surged by 295% after DoD deal - TechCrunch:https://techcrunch.com/2026/03/02/chatgpt-uninstalls-surged-by-295-after-dod-deal/?type=AI[4]Claude beats ChatGPT in U.S. app downloads - Axios:https://www.axios.com/2026/03/01/anthropic-claude-chatgpt-app-downloads-pentagon[5]Anthropic's Claude overtakes ChatGPT in App Store - Fortune:https://fortune.com/2026/03/02/anthropic-claude-dario-amodei-number-one-app-store-openai-chatgpt-sam-altman-department-war/[6]AWS says drones hit two of its datacenters in UAE - The Register:https://www.theregister.com/2026/03/02/amazon_outages_middle_east/[7]Claude Goes Down Globally as AWS Data Centers Burn - Awesome Agents:https://awesomeagents.ai/news/claude-outage-march-2026-aws-middle-east/[8]Claude Status Page:https://status.claude.com/[9]Why Is Claude Not Working? - Techloy:https://www.techloy.com/why-is-claude-not-working-everything-we-know-about-the-anthropic-outage/[10]AWS Global Infrastructure: https://aws.amazon.com/about-aws/global-infrastructure/regions_az/
專欄:云計算泥石流
云故障
云資源
下云記
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.