![]()
兄弟們,活久見了!
18號晚上你們要是網(wǎng)速夠快,應(yīng)該見證了一件載入史冊的事兒:全球斷網(wǎng)。
不是局部的,不是某個國家的,是全球大范圍一起斷的那種。
ChatGPT打不開,一直轉(zhuǎn)圈圈。推特好不容易登錄進去,卻什么都刷不出來。國外的哥們兒正在打LOL排位賽,直接就掉線了。想要點個外賣,系統(tǒng)崩潰掉。Spotify想聽個歌,卻一直都在加載中。
看看自己的手機,WiFi信號滿格,5G顯示正常,路由器都重啟三遍了,但就是用不了。
有人懷疑自己被封號了,有人以為手機壞了。
更離譜的是,想去Down Detector查到底哪崩了,結(jié)果它自己也崩了。
這一切都因為一家公司的一個文件生成邏輯錯誤引發(fā)。這家公司叫Cloudflare。
![]()
很多人可能根本就沒聽說過,簡單點說,它就是互聯(lián)網(wǎng)的超級物業(yè)。
你訪問網(wǎng)站,從表面來看是直接連接到服務(wù)器,可實際上中間隔著Cloudflare,它負責為網(wǎng)站,加速、抵御攻擊、管理流量,在全球布設(shè)有330多個數(shù)據(jù)中心。
舉個例子:網(wǎng)購時,商家從本地倉發(fā)貨肯定比從外地總倉快。Cloudflare就是那個幫網(wǎng)站在全球建本地倉的。
而且它還當保鏢,有人想搞DDoS攻擊?攔下。有爬蟲機器人想薅數(shù)據(jù)?攔下。
Cloudflare占了全球CDN市場28%份額,服務(wù)數(shù)千萬網(wǎng)站。
所以你懂了吧?這就像小區(qū)物業(yè),你平時感覺不到它存在,但它一罷工,所有業(yè)主都被鎖在門外。
昨晚就是這么個情況,物業(yè)系統(tǒng)崩了,全世界都進不了小區(qū)。
好端端的,它是怎么崩的?
![]()
Cloudflare有個Bot Management系統(tǒng),專門用來區(qū)分真人和機器人。它會給每個訪問者打個分,網(wǎng)站管理員可以根據(jù)自己的需求定規(guī)矩,比如電商的可以設(shè)個門檻:分數(shù)不到 70 的不讓下單,這樣就能防住那些自動搶購機器人。
這套打分系統(tǒng)有個配置文件,里面大概有 60 個檢查項,系統(tǒng)每過 5 分鐘就會喊一下數(shù)據(jù)庫:嘿,給我發(fā)一份最新的特征清單。
原本流程很順暢,系統(tǒng)問,數(shù)據(jù)庫答,60條數(shù)據(jù),井井有條。
但11月18號上午11:05(UTC時間),工程師對數(shù)據(jù)庫做了個常規(guī)權(quán)限調(diào)整。
23分鐘后,災(zāi)難開始發(fā)酵。
因為這次調(diào)整,把原本的單線電話變成了全公司大喇叭。
然后,重點來了,前臺總管給了60條,北京分庫聽到了也給60條,上海分庫、廣州分庫紛紛響應(yīng),60條數(shù)據(jù)瞬間被復(fù)讀成幾百條。
更尷尬的是,Cloudflare在設(shè)計系統(tǒng)的時候,覺得平常一般就是60條,最多也就是100條,把上限設(shè)定為200肯定是足夠用的。
結(jié)果這幫分庫一復(fù)讀,數(shù)據(jù)量瞬間沖破200大關(guān),系統(tǒng)當場宕機。
![]()
最魔幻的是,這個崩潰不是一直崩,而是仰臥起坐式的崩。
因為數(shù)據(jù)庫是分批更新的,有些節(jié)點更新了,有些還是老版本。所以系統(tǒng)每5分鐘查詢一次,就相當于開盲盒:
?運氣好 → 碰到老版本 → 60條數(shù)據(jù) → 網(wǎng)站活了
?運氣背 → 碰到新版本 → 幾百條數(shù)據(jù) → 網(wǎng)站又死了
我們就這樣在能用和不能用之間反復(fù)橫跳,被折磨了整整6個小時。
Cloudflare的工程師一開始也懵了,看著監(jiān)控數(shù)據(jù)像心電圖一樣上下跳,第一反應(yīng)是:完了,又被DDoS攻擊了!(前段時間他們剛扛住7.3Tbps的超級攻擊)
更巧的是,他們自己的狀態(tài)頁也崩了(后來證實是巧合),工程師們一度懷疑:有人在針對性攻擊我們?
折騰了好幾個小時,直到下午13:37才鎖定真兇:不是外敵,是自己人背刺。
14:24,他們緊急停止自動生成配置文件,手動翻出舊版本并推送至全球。
14:30,核心流量已基本恢復(fù)正常。17:06,所有服務(wù)重啟完畢,災(zāi)難正式結(jié)束。
![]()
Cloudflare官方承認了錯誤,承諾會加強檢查、審查容錯能力。
但說實話,每次大廠宕機后都會發(fā)這種保證書。
這都已經(jīng)崩了多少次了?2024年7月CrowdStrike更新導(dǎo)致全球Windows藍屏;今年10月AWS崩了,Downdetector記錄超過1700萬份故障報告,影響60多個國家3500多家公司;現(xiàn)在輪到Cloudflare。
問題在于,我們把整個互聯(lián)網(wǎng)壓在極少數(shù)幾家公司身上。
這就像一座空中樓閣,地基只有那么幾根柱子,哪根柱子晃一晃,整座樓都得跟著顫。
當互聯(lián)網(wǎng)變成像空氣和水一樣的必需品時,我們才發(fā)現(xiàn),供水廠只有那么幾家,而且水管工偶爾還會手滑。
這,就是真實的互聯(lián)網(wǎng)。
聲明:本文內(nèi)容均經(jīng)過嚴謹考證,少部分素材由AI工具輔助核實。文章旨在傳遞正能量,無低俗和不良引導(dǎo)。
參考信源:Cloudflare官方博客--Cloudflare outage on November 18, 2025
騰訊網(wǎng)-Cloudflare崩了 ChatGPT、X等網(wǎng)站訪問受影響
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.