![]()
去年夏天,弗吉尼亞州勞登縣的數(shù)據(jù)中心集群突然拉閘限電。當?shù)仉娋W(wǎng)運營商 PJM Interconnection 發(fā)出緊急警報:AI 訓練負載飆升,變壓器過載風險逼近紅線。這是美國最大數(shù)據(jù)中心樞紐首次因 AI 算力需求被迫限電,比行業(yè)預測提前了至少18個月。
Kiran Kalyanaraman 在能源行業(yè)干了15年,見過風電泡沫、光伏過剩,但沒見過這種場面。「數(shù)據(jù)中心就像突然闖進客廳的大象,電網(wǎng)根本沒準備好沙發(fā)。」他在近期一篇分析里打了個比方。
這位前 AWS 能源產(chǎn)品負責人、現(xiàn)獨立顧問,正在幫幾家云廠商重新設(shè)計電力采購策略。他的核心觀點很刺耳:所有人都在談 AI 模型參數(shù)、GPU 集群規(guī)模,卻沒人認真算過電賬——訓練一個 GPT-4 級別的大模型,耗電量相當于 5000 個美國家庭一年的用電總和。
算力狂歡的隱藏成本
2023 年全球數(shù)據(jù)中心耗電量約 460 太瓦時,占全球總用電量的 1.5%。國際能源署(IEA)預測,到 2026 年這一比例將翻倍。Kalyanaraman 拆解了更細的數(shù)據(jù):單個超大規(guī)模數(shù)據(jù)中心(Hyperscale)的功率密度已從 2015 年的 5 兆瓦飆升至 2024 年的 50 兆瓦,10 年增長 10 倍。
功率密度飆升的直接后果是電網(wǎng)接入排隊時間延長。美國部分地區(qū)的變電站擴容審批周期已達 3-5 年,而 AI 公司的數(shù)據(jù)中心建設(shè)周期壓縮到了 12-18 個月。時間錯配造成的結(jié)果是:微軟、谷歌、亞馬遜開始自帶發(fā)電設(shè)備進場。
微軟與 Constellation Energy 簽下 20 年購電協(xié)議,重啟三英里島核電站;谷歌在數(shù)據(jù)中心園區(qū)部署現(xiàn)場天然氣發(fā)電;亞馬遜則批量采購小型模塊化核反應(yīng)堆(SMR)的遠期產(chǎn)能。Kalyanaraman 稱之為「企業(yè)自建電網(wǎng)」的苗頭——云廠商從電力消費者變成電力基礎(chǔ)設(shè)施投資者。
電網(wǎng)的三種死法
Kalyanaraman 把 AI 對電網(wǎng)的沖擊歸納為三個層面,每個層面都在改寫行業(yè)規(guī)則。
第一層是物理容量。傳統(tǒng)電網(wǎng)設(shè)計基于「可預測負載」假設(shè):工業(yè)區(qū)白天用電高、居民區(qū)晚上用電高,峰谷差可控。AI 訓練負載完全不同——它是 7×24 小時滿負荷運行,且功率波動極小,相當于給電網(wǎng)塞了一塊恒定的熱鐵塊。變壓器長期高負載運行,絕緣老化速度加快 30%-40%。
第二層是調(diào)度邏輯。電網(wǎng)運營商依賴需求響應(yīng)(Demand Response)機制平衡峰谷,比如夏天讓工廠錯峰生產(chǎn)換取電費折扣。但 AI 訓練任務(wù)無法中斷——模型 checkpoint 重啟成本極高,云廠商寧可交罰款也不愿降負載。Kalyanaraman 指出:「電網(wǎng)失去了最靈活的調(diào)節(jié)杠桿。」
第三層是定價機制。美國部分州實行節(jié)點邊際電價(LMP,Locational Marginal Price),電價隨實時供需波動。2022 年得州冬季風暴期間,電價一度飆升至 9000 美元/兆瓦時。AI 數(shù)據(jù)中心對電價敏感度極低——電費占運營成本比例不足 10%,遠低于傳統(tǒng)制造業(yè)的 30%-50%。這種「價格不敏感型」負載涌入,正在扭曲電力市場的價格信號。
被忽視的第三條路
行業(yè)討論集中在兩條路徑:要么瘋狂擴建發(fā)電側(cè)(核電、天然氣、儲能),要么優(yōu)化算力側(cè)(液冷、芯片能效、模型壓縮)。Kalyanaraman 認為兩者都漏掉了一個更底層的變量——電網(wǎng)本身的智能化程度。
他舉了個具體案例。某云廠商在北歐的數(shù)據(jù)中心園區(qū),通過實時對接電網(wǎng)調(diào)度系統(tǒng),在風電過剩時段自動啟動訓練任務(wù),在電網(wǎng)緊張時段切換至推理負載(推理功耗約為訓練的 1/5-1/10)。這種「算力-電力協(xié)同調(diào)度」使園區(qū)綠電使用率從 62% 提升至 91%,同時降低了 15% 的電費支出。
關(guān)鍵在于打破數(shù)據(jù)孤島。電網(wǎng)運營商掌握實時拓撲、負荷預測、機組出力的毫秒級數(shù)據(jù);云廠商掌握任務(wù)優(yōu)先級、資源調(diào)度、QoS 約束的秒級數(shù)據(jù)。兩者至今沒有標準化的數(shù)據(jù)接口。Kalyanaraman 參與的一個行業(yè)聯(lián)盟正在推動 IEEE 新標準,試圖定義「算力負載的電網(wǎng)可調(diào)度性」指標——類似于家電的能效標簽,但面向數(shù)據(jù)中心。
另一個被低估的方向是地理套利。AI 訓練任務(wù)對延遲不敏感(不像在線游戲或金融交易),理論上可以追逐最便宜、最清潔的電力全球流動。Kalyanaraman 算過一筆賬:若將美國中西部凌晨 2 點的過剩風電,通過光纖傳輸至東海岸進行模型訓練,網(wǎng)絡(luò)延遲增加 20 毫秒,但電費降低 60%。「問題是,現(xiàn)在的云調(diào)度系統(tǒng)沒有電價感知能力。」
政策滯后與商業(yè)機會
美國能源部 2023 年發(fā)布的《數(shù)據(jù)中心能源報告》仍沿用 2016 年的負載假設(shè)。歐盟《人工智能法案》全文未提及能源消耗。Kalyanaraman 在閉門會議上聽到一位 FERC(聯(lián)邦能源管理委員會)官員承認:「我們還在用監(jiān)管傳統(tǒng)工廠的方式監(jiān)管 AI 數(shù)據(jù)中心,但兩者的負載曲線完全不同。」
這種滯后創(chuàng)造了灰色地帶。部分州政府為吸引數(shù)據(jù)中心投資,承諾「不限電、不限排」的優(yōu)惠政策,實質(zhì)是將電網(wǎng)風險轉(zhuǎn)嫁給其他用戶。2024 年初,俄亥俄州居民團體起訴州政府,指控某 2 吉瓦數(shù)據(jù)中心項目將導致居民電價上漲 12%-18%。
商業(yè)機會也在涌現(xiàn)。Kalyanaraman 觀察到的三個賽道:一是「電網(wǎng)級儲能」的重新定位——從削峰填谷轉(zhuǎn)向為 AI 負載提供不間斷電源(UPS)替代方案;二是「算力期貨」市場——云廠商提前鎖定特定時段的綠電配額,類似航空公司的燃油對沖;三是「碳感知調(diào)度」軟件——將電力碳強度實時嵌入 Kubernetes 調(diào)度決策,自動將訓練任務(wù)遷移至低碳節(jié)點。
他投資的一家初創(chuàng)公司正在做最后一件事。產(chǎn)品上線 6 個月,已幫客戶減少 23000 噸二氧化碳排放,相當于 5000 輛燃油車一年的排放量。客戶名單包括兩家頭部云廠商和一家自動駕駛公司。
IEA 的最新預測顯示,到 2030 年全球數(shù)據(jù)中心耗電量將達到 1050 太瓦時,超過日本當前全國用電量。Kalyanaraman 在分析結(jié)尾寫了一句:「AI 的瓶頸不是算力,是變壓器。」
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.