2026年3月1日,伊朗無人機(jī)擊中AWS阿聯(lián)酋與巴林?jǐn)?shù)據(jù)中心。這可能是公開報道中第一次有大型云廠商的數(shù)據(jù)中心遭到軍事打擊并癱瘓。以前覺得戰(zhàn)爭離軟件工程很遠(yuǎn),現(xiàn)在看,只隔著一層機(jī)柜門。發(fā)生了什么?
2026年3月1日,中東沖突升級后,伊朗對阿聯(lián)酋和巴林境內(nèi)的多個目標(biāo)實(shí)施了無人機(jī)/導(dǎo)彈打擊,并對美國在中東資產(chǎn)展開報復(fù)。
在這波打擊中,AWS位于阿聯(lián)酋和巴林的數(shù)據(jù)中心被無人機(jī)直接命中。是的,不是斷電,不是光纜被挖,不是空調(diào)故障,是 無人機(jī)物理命中了數(shù)據(jù)中心建筑,引發(fā)了火災(zāi)和結(jié)構(gòu)性損壞。
![]()
這可能是 公開報道中第一次有超大規(guī)模云廠商的數(shù)據(jù)中心因軍事行動而物理癱瘓。
AWS一開始還遮遮掩掩,在狀態(tài)頁面上寫的是“有不明物體撞擊數(shù)據(jù)中心,產(chǎn)生火花和火焰”。好家伙,無人機(jī)在你們的措辭里成了“不明物體”。直到3月3日凌晨,AWS才正式確認(rèn):這是無人機(jī)打擊(drone strikes)。
打了多少?
先看AWS在中東的家底。中東一共3個 Region 投入運(yùn)營,共計 9個可用區(qū)(AZ):
![]()
此次遭受打擊的情況:
![]()
9個AZ掛了3個,中東整體 33%的可用區(qū)癱瘓。阿聯(lián)酋區(qū)域更慘 —— 3個可用區(qū)掛了2個,多AZ 高可用直接停擺。你精心設(shè)計的跨AZ容災(zāi)架構(gòu)?在無人機(jī)面前跟沒有一樣。以色列區(qū)域倒是毫發(fā)無損——至少在現(xiàn)有公開通報中未見直接物理影響。
影響面有多大?
阿聯(lián)酋區(qū)域:38項(xiàng) AWS 服務(wù)受到影響,核心服務(wù)全線中斷 —— EC2、Lambda、EKS、VPC、RDS、CloudFormation、S3,該有的一個不少。
巴林區(qū)域:更夸張,46項(xiàng) AWS 服務(wù)出現(xiàn)故障,電力和網(wǎng)絡(luò)連接中斷。
綜合兩個區(qū)域的影響:
![]()
(注:上表分級統(tǒng)計口徑有重疊,不能簡單相加。)
區(qū)域客戶首當(dāng)其沖:已有報道提到 Snowflake 在中東的部署受到AWS故障影響,部分本地企業(yè)也報告業(yè)務(wù)中斷。
而AWS官方的建議更是史無前例 —— 他們建議受影響客戶“立即從遠(yuǎn)程備份恢復(fù)到其他 AWS 區(qū)域,理想情況下是歐洲區(qū)域”。你什么時候見過AWS官方主動建議客戶“趕緊跑”的?這基本上等于官方承認(rèn):短期內(nèi)別指望恢復(fù)了。
截至3月3日,被無人機(jī)直接命中的 mec1-az2 仍然處于 物理離線 狀態(tài) —— 消防和安全部門還沒批準(zhǔn)工程師重新進(jìn)入建筑。你連進(jìn)都進(jìn)不去,更別提修了。
![]()
![]()
AI 全線遭殃
在AWS中東機(jī)房被炸的同一個周末,全球主要的AI服務(wù)幾乎全部出現(xiàn)了不同程度的故障:
Claude / Claude Code 在3月2日出現(xiàn)了全球范圍的大面積故障,用戶瘋狂刷到“Claude will return soon”和 HTTP 529 過載錯誤。根據(jù) Anthropic 狀態(tài)頁更新,這次故障一度表現(xiàn)為登錄/會話路徑問題,后續(xù)也提到“部分 API 方法異常”;
因此,現(xiàn)有公開信息不足以證明這次故障由AWS中東數(shù)據(jù)中心受損直接導(dǎo)致。老馮會另寫一篇分析。《Claude 全球大宕機(jī)復(fù)盤》
Gemini / GPT 也在同期出現(xiàn)了服務(wù)波動。是否與AWS中東事件存在直接因果關(guān)系,現(xiàn)有公開信息并不充分。但推斷應(yīng)該是由 Claude 故障導(dǎo)致的級聯(lián)影響。
總之這個周末,搞 AI 的不好過。
云計算的阿喀琉斯之踵
回頭看這件事,技術(shù)層面其實(shí)沒什么好分析的 —— 物理層面的毀滅,什么軟件架構(gòu)都扛不住。你的多AZ、多Region、自動故障轉(zhuǎn)移,在導(dǎo)彈面前統(tǒng)統(tǒng)是紙糊的。這件事真正值得思考的是另一個維度:
數(shù)據(jù)中心的選址,從此多了一個新的變量 —— 它會不會被炸。 以往云廠商選址數(shù)據(jù)中心,考慮的無非是電價、網(wǎng)絡(luò)、氣候、政策、人才。從今天開始,“地緣政治風(fēng)險”和“軍事打擊概率”要正式寫進(jìn)選址評估報告了。
AWS 的多 Region 架構(gòu)在這次事件中其實(shí)表現(xiàn)算符合預(yù)期 —— 區(qū)域間的故障隔離確實(shí)生效了。。全局控制平面(IAM、CloudFront、Route 53)全部部署在美國本土區(qū)域,中東的Region并不承載任何全局服務(wù)的控制平面角色。所以雖然中東炸了,但全球其他地方的AWS客戶幾乎沒受影響。
這恰恰說明了一個道理:真正的容災(zāi),不是同城雙活,不是同Region跨AZ,而是跨Region甚至跨云。你的業(yè)務(wù)如果重度依賴某個特定Region,那么當(dāng)這個Region因?yàn)槿魏卧颍ú还苁亲匀粸?zāi)害還是軍事打擊)掛了的時候,你就是等死。對于依賴中東AWS的企業(yè)來說,這次事件是一個血淋淋的教訓(xùn)。
尾聲
過去幾十年,科技行業(yè)有一個隱含的假設(shè):數(shù)據(jù)中心是“平民基礎(chǔ)設(shè)施”,不會成為軍事打擊目標(biāo)。這個假設(shè)在2026年3月1日被無人機(jī)炸碎了。
以后的云架構(gòu)評審會上,可能會多出這樣一個靈魂拷問:
“如果這個Region被炸了怎么辦?”
別笑,這不再是一個荒謬的問題了。
聲明:本文碳基智力含量:約 20%
References
[1] AWS Health Dashboard Status:https://status.aws.amazon.com/[2]AWS Health Dashboard RSS:https://status.aws.amazon.com/rss/all.rss[3]AWS says drones hit two of its datacenters in UAE - The Register:https://www.theregister.com/2026/03/02/amazon_outages_middle_east/[4]Two AWS Middle East availability zones down - Computing.co.uk:https://www.computing.co.uk/news/2026/two-aws-middle-east-availability-zones-down-after-datacentre-impacted-by-objects[5]AWS UAE suffers AZ outage - Data Center Dynamics:https://www.datacenterdynamics.com/en/news/aws-uae-outage-after-objects-struck-the-data-center-cause-fire-amid-iran-attacks/[6]AWS Middle East Outage - Data Center Knowledge:https://www.datacenterknowledge.com/outages/aws-middle-east-outage-after-data-center-hit-by-unidentified-objects[7]Anthropic Status:https://status.claude.com/[8]OpenAI Status: https://status.openai.com/
專欄:云計算泥石流
云故障
云資源
下云記
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.