AI這場攪動全球的軍備競賽,在算力之外,存力、電力這兩條戰線,也已經清晰成型。
2025 年,隨著 AI 應用從“嘗鮮期”走向“深水區”,數據存力的短板,已經成為制約人工智能發展的最大瓶頸,卻也迎來自己的一個前所未有的歷史新周期。
一邊是摩根士丹利等機構高調預言存儲芯片將迎來前所未有的“超級周期”和“最強定價權”;一邊是中國在“東數西算”“國家算力網絡”等戰略中,明確提出到 2025 年存儲總量超 1800EB、先進存儲占比 30%、核心數據災備覆蓋率 100% 的量化目標。
千頭萬緒,從何著手?中國電子工業標準化技術協會數據存儲專委會(以下簡稱專委會)的出現,具有標志性的意義——中國選擇的路徑很明確:一方面在總量上補課,一方面在標準與生態上“換道超車”。
——導語
01
浮出水面的支柱
從時間線上看,如果要給眼前這輪AI 巨浪找一個大眾記憶中的起點,2023 年的 DeepSeek 等推理大模型上線,大概是一個標志性節點。那一刻開始,AI 從論文、開源社區和開發者論壇,真正走進了普通用戶的聊天窗口和日常工作流。
到了 2025 年,這股熱潮已經從“嘗鮮”走向“深耕”——在C端,互聯網與云廠商在推出一系列 AI 助手、內容生成、個性推薦等服務;在 B 端,金融、制造、能源、醫療、政務等行業,大模型和行業模型密集落地;在自動駕駛、具身智能、AI+科研等前沿領域,則在持續吞噬著更高規格、更長周期的算力與數據資源。
這一切有一個共同的底色:數據洪流正在從量變開始質變。
在“量”的全球視角下,數據總量仍在以 30%–36% 左右的年復合增速狂飆,多個機構預測,到 2030 年有望突破 200ZB。 在中國,國家數據局披露:2024 年我國數據產量已達 41.06ZB,且仍在快速攀升。
在“質”的視角看來,AI 訓練數據本身也在快速變化——圍繞大模型、行業模型建設的訓練數據集,處于年增 40% 左右的上升通道,且越來越多地呈現出多模態、多源異構的特征。更關鍵的是,其中非結構化數據(視頻、圖片、傳感器數據、日志等)占比已經超過 80%。
但無論如何,一個定論是:數據的生產速度,已經遠遠超過我們存儲、管理和流動這些數據的能力。
無論是萬億級參數的大模型訓練,還是訓練動輒 TB 級的數據吞吐,所有“算力軍備競賽”的敘事背后,其實都隱含著一個問題:存力足不足?
在經典的技術劃分中,AI 的底座被概括為“算法、算力、數據、存力”四根支柱;在基礎設施視角下,則更強調“算力、存力、運力、電力”四大能力。無論哪一種說法都指向同一事實——算力是“肌肉”,數據是“血液”,而存力既是“骨骼”,也是“血管”。如果沒有存力,如果沒有存力承載的數據,再強的算力也會失去意義。
過去幾年,資本與輿論的光環更多籠罩在 GPU 上:誰搶到了更多 A100/H100,誰堆起了更大的智算中心,似乎就代表誰拿到了 AI 時代的“門票”。但這種“重算輕存”的跛足發展模式,以及一直存在于傳統數據中心建設中“存算比不合理”的問題,已經開始暴露的更加徹底。
把視角放到具體的數據中心和存力中心,問題更為具體而尖銳。
最明顯的,是效率失衡、數據孤島嚴重。
不少傳統數據中心的存儲利用率長期徘徊在 20%–30% 左右。 上游投資了大量盤柜和機房,下游卻因為缺乏統一的命名空間、協議標準與調度接口,導致數據被鎖定在一個個“孤島”之中——不同云之間、不同中心之間,甚至同一中心的不同集群之間,數據難以自由流動。
很頭疼的是,很多傳統算力中心的架構先天不適配 AI,并突出的表現在存儲子系統上。
傳統存儲系統是以數據庫、虛擬化、文件服務等為典型負載設計的,以結構化數據、中等并發為主。而如今的 AI 負載,從自動駕駛到金融風控、從工業視覺到具身智能,對存儲的要求是:高頻小文件隨機讀寫;毫秒甚至微秒級時延;千卡、萬卡集群同時訪問同一數據集。
![]()
舊架構在新需求面前顯得力不從心。
不得不提到的還有供應鏈安全與國產化壓力。
在閃存芯片、企業級 SSD、先進控制器、高端陣列系統等環節,中國仍存在對海外供應鏈的依賴。一旦出現出口管制、產能緊張等情況,其對 AI 產業和數字基礎設施的沖擊,并不亞于“算力被卡”。
正是因為前述的供需錯位,摩根士丹利等國際投行給出了一個頗為強勢的判斷——在 AI 服務器、云數據中心的驅動下,存儲芯片已經開啟罕見的“超級周期”,并在半導體眾多子行業中,擁有“最強定價權”。
但真正了解存力特別是高端存力的人才知道,存儲芯片屬于介質,而介質在高端存力整體解決方案中只是成本的小頭,真正”卡脖子“的,是管理成千上萬的介質與AI親和度極高的管理系統。
而中國的幸運在于,差不多十年前的精準卡位,使得曙光開始研究分布式文件系統的根技術,現在已經成為中國唯二擁有全自主產權的分布式文件系統的企業,并以此為基礎發展了一系列產品,發光發熱在中國的千行百業中。
這就好比,我們要修房子,水泥、磚瓦可能需要外購一部分,價格也不穩定,需要大力加強國產化,但真正擘畫“中國存力”這座大廈的全部設計圖和基本原理,已經牢牢掌握在我們手中。
有藍圖,缺磚瓦,可以有很多辦法可想;有磚瓦,無藍圖,這座大廈100年也建不成。
正是因為有曙光以及一批同行者的努力,中國在這一時間點給出的回應,是非常直接的“數字承諾”:
到 2025 年,全國數據存儲總規模要超過 1800EB,先進存儲占比 30% 以上,重點行業核心數據災備覆蓋率達到 100%。
一方面,這意味著新增產能的大規模建設,另一方面,是幾乎統一一個大盤子的“補短板”工程——大量現有數據中心、存力中心在架構、效率、能耗和安全上的問題,都需要在 AI 浪潮中重新被審視和改造。
對于中國存儲產業而言,這無疑是一個萬億級的結構性機會,而為此我們要回答這些問題:
——如何從“補算力的短板”轉向“補存力的短板”
——學會從“要多少容量”轉向“要怎樣的存儲方案”
——努力從“買設備”轉向“重構底座與標準”
算力需要存力發揮更大效能,數據需要存力提高質量。沒有存力支柱的 AI 體系,是不完整的,這也是“存力中國行動”的邏輯起點。
02
中國行動:從“技術跟隨者”到“標準制定者”
如果說技術和周期是臺前的主角,那么標準就是幕后真正左右格局的那只“看不見的手”。
在半導體與存儲產業史上,一個幾乎被驗證無數次的規律是:
誰制定了標準,誰就掌握了產業鏈的節奏權和議價權。
目前,在存儲行業里,在接口層面,NVMe正在取代 SATA,成為數據中心 SSD 的主流接口,不僅改變了控制器和固件的技術路線,也深刻地重塑了上層軟件和系統的設計范式;在分布式和云存儲領域,S3 協議幾乎成為事實標準,圍繞它已經形成了全球性的云服務生態和第三方工具生態。
而聚焦在 AI 場景中,這種“標準之爭”還在不斷升級:
以英偉達為首的吃飽了AI算力紅利的企業,把手伸向了存力這塊蛋糕,他們通過 GPU Direct Storage等技術,將 GPU 與存儲之間的數據路徑重構,把數據從 NVMe 直接喂進顯存,繞開 CPU 和主存,形成幾乎封閉的“GPU 中心主義”IO 體系;
另一方面,SNIA 等國際組織啟動 Storage.AI 等項目,試圖在 AI 存儲負載模型、接口和計算存儲等方面,形成新一代標準框架。
這些努力本身無可厚非,但對任何后來者而言,意味著:如果一味被動接入這些體系,就很容易被鎖死在別人的生態和路徑之中。
對于中國這樣一個數據大國和 AI 大國,如果僅僅沿用舊標準、舊路徑,“存儲困境”就會從技術問題升級成產業安全與發展模式的問題——既有被“卡脖子”的風險,也難以用海外標準完整適配中國這樣超大規模、多行業、多層級場景的復雜需求。
在這個大背景下,專委會的出現,具有劃時代的標志性意義。
它一端對接主管部門,把“1800EB 總量、30% 先進存儲、100% 核心數據災備”這類頂層目標拆解為可執行的技術路線和標準路徑;另一端則把存儲設備廠商、整機廠、運營商、云服務商、科研機構等拉到一張桌子上,試圖把碎片化的點狀創新,組織成可協同的產業合力。
在這張桌子上,曙光存儲擁有三重身份——重要的設備與方案提供商、存儲專委會的當值會長和“先進存力”的首提布局者。
在 2025 年數據存儲產業大會上,曙光接棒華為,成為新任專委會當值會長,給出的思路,可以概括為四個關鍵詞:政策導向、產業牽引、標準先行、生態共建。
![]()
在政策層面,明確提出先進存力不是簡單“跟著國外做”,而是積極響應工信部等主管部門對數字基礎設施的總體布局,把“東數西算”“全國算力一張網”的真實需求作為技術路線選擇的依據。
在產業牽引上,面對全球超過 2.6 萬億元的數據存儲市場空間,中國存儲產業不能只盯住“替代進口”的那一畝三分地,而要在大模型、智算中心、行業云等新賽道中,主動定義先進存力的形態和能力邊界甚至是市場邊界。
在我們反復談及的“標準先行”中:曙光參與并主導了 AI 負載,液冷存儲的能效指標、高性能并行文件系統接口標準,到跨域數據流動協議、存算協同 API等多個層級的標準化工作,這些標準將天然與國產 CPU、AI 框架、開源生態打通。目標是讓未來的 AI 存儲不再是廠商各自為戰,而是在統一的“地基”上做差異化創新。
當然,不可或缺的還有生態共建,也就是通過開放接口和部分開源協作,讓國產 CPU、GPU/NPU、操作系統、中間件、AI 框架都能在標準化的接口上協同演進,避免出現“每家一套、互不兼容”的內耗局面。
所謀者大,為國為民。
但如果腳下有路,眼前有方向,心中有雄心,路總是有的,而且不止一條。
結合產業趨勢和典型實踐,以曙光為代表的中國存儲廠商,正在沿著三條主線,重構面向 AGI 時代的存儲新范式。
第一條,是跨云、邊、端的數據流動體系。
這是一個喜歡談萬物互聯的時代,卻殊不知,萬物互聯之路,就需要一套跨云、邊、端的數據流動體系或說存力體系的支撐。
如果大而化之的說,這包括通過統一命名空間、多協議支持、跨域無感遷移等能力,讓數據可以在公有云、私有云、行業云、邊緣節點、終端設備之間自由流動;更智能一些的,則能實現熱數據自動靠近算力,冷數據自動下沉等先進存儲的技術特征,最終實現不同業務系統、不同社會組織、機構之間的數據“墻”被打通,形成真正意義上的數據要素流通網絡。
第二條,是深度集成 AI 調度能力的“聰明存力”。
存儲以前不引人注目,是因為在前互聯網時代,它只是被動的“數據倉庫”,而今天我們需要的,是有感知、有決策能力的“物流大腦”。
這可以體現為——在協議和內核層面識別 AI 訓練/推理的 IO 模式,做自適應優化;充分利用智能預取、冷熱識別、故障自愈等能力,保障萬卡級訓練集群在高并發場景下仍然能穩定持續“吃飽”;此外,還要把監控、調優、彈性擴展等能力開放給 AI 平臺,在算力與存力之間建立反饋閉環。
目前的AI熱浪,正在加速突進這一條路徑的建設。
第三條,則是建設在萬物互聯、AI存算等具體場景其上,通過標準和開源,構建完整的存力產業閉環——這既包括在國內標準體系內定義 Future Storage、AI 存儲規范,也包括在國際舞臺上積極參與如 MLPerf Storage、Storage.AI 等規則制定,讓中國的實踐經驗能影響全球 AI 存儲的評價體系和發展方向。
從“補課”到“共創”,中國存儲正在從技術層面走向標準層面,嘗試在 AGI 時代的新一輪基礎設施演進中,爭取屬于自己的位置。
03
場景為王:先進存力進產業
標準如果停留在紙面上,就只是文件;只有寫進工程項目和業務系統里,才可能變成真正的“事實標準”。
在電信運營商、具身智能企業、頂尖科研機構等關鍵場景中,以曙光為代表的國產存儲廠商,已經給出了幾組頗具代表性的樣本。
在“東數西算”網絡的版圖上,中國移動呼和浩特數據中心是最具標志性的一塊拼圖:規劃投資約 400 億元,設計 11 萬個機架,目前已有 2.24 萬個機架投入使用;整體算力規模約 19000P,其中智算資源 15600P,已部署芯片的國產化率接近 90%。
![]()
它既是京津冀等區域的算力后花園,也是中國移動“九天”大模型等自研體系的主戰場,更是對外承載多行業 AI 業務的綜合樞紐。
在這樣一個“算力航母”里,存儲的角色,被重新定義成整個系統的“性能閥門”。
中國移動呼和浩特數據中心的管理團隊很清楚:如果沒有先進存儲,萬卡級 GPU 集群就會被 IO 束縛,算力投資很難真正變現。因此,在建設過程中,曙光參與打造了一套“全閃+混閃”的分布式存力底座,總規模超過 60PB。
說的稍微技術一點就是——前端的 ParaStor F9000 全閃系統專為 AI 訓推場景設計,通過五級加速、三級協同,將單節點帶寬和集群吞吐能力拉升到可以匹配萬卡集群的水平;后端的 ParaStor S6000 混閃系統,則以高密度、低 TCO 承載起千億參數模型的歸檔與多版本管理需求。
更具“范式”意義的,是在這個項目中落地的“超級隧道”技術和跨域無感遷移機制:
可以說,前者通過虛擬化 CPU、內存、網卡與 SSD,為每一次 IO 打通一條獨享路徑,大幅降低隊列等待和抖動;后者則讓數據在不同機房、不同區域間遷移時,對上層業務幾乎是透明的,為未來全國算力網絡下的數據統籌調度提供了可復用的技術路徑。
目前, 在中國移動內部,這被視為一個可復制、可推廣的“算存協同樣板間”,其價值已經超出了單一項目本身。
與電信場景相比,具身智能的存儲挑戰更顯“刁鉆”。
智元機器人作為具身智能賽道的代表企業之一,從 200TOPS 級的“遠征 A1”起步,迅速推出“遠征”“靈犀”兩大系列多款人形機器人,并在交互服務、柔性智造、特種作業、科研教育等場景開啟商用量產。
![]()
在這些產品的背后,是極其復雜的多模態數據流與訓練流程。
視覺、語音、觸覺、動力學數據交織在一起,大規模仿真與強化學習需要長期、高頻的小文件隨機讀寫,任何存儲系統的抖動,都可能被放大成“動作延遲”或“行為異常”。
曙光為智元打造的,是一個以“加速 AI”為設計核心的智存系統:
前端分布式全閃存儲池提供超過 500GB/s的聚合讀帶寬,讓訓練集群不再為“喂不飽”發愁;后端對象存儲為非結構化數據提供單桶約 5 萬 IOPS 的高性能能力,支撐海量傳感器數據和歷史日志的沉淀與回放。
最后,前后端兩者通過分級策略與統一管理平臺,形成貫穿“采集—訓練—驗證—部署—回流”的全生命周期數據底座。
對于智元而言,這意味著模型迭代更快、訓練成本更可控,也意味著在具身智能這條高投入賽道上,多了一層“基礎設施層面的確定性”。
在 AI for Science 方向,高校與科研機構對存儲有兩點“硬要求”:
一是足夠快,能明顯縮短計算時間;二是足夠穩,不能讓長周期任務“中途報廢”。
西湖大學高性能計算中心的內部測試就發現:只要對存儲系統做針對性優化,AI 科研的整體計算過程可以加快約 30%——這直接影響到科研項目的節奏和成果產出。
在最終落地方案中,西湖大學選擇了曙光的全閃存儲系統,實測單節點帶寬達到 150GB/s,約為國際頭部廠商同類產品的近 4 倍。
在冷凍電鏡、分子動力學模擬、AI 模型訓練等多種高負載混合場景下,這套系統保持了長期穩定運行。
西湖大學的科研人員表示,在新的存儲子系統的支持下,一方面,性能提升直接轉換成科研效率的提升,讓“算一個大實驗”不再那么耗時;另一方面,依托全棧自研軟硬件和多重冗余設計,再輔以 7×24 小時運維,核心科研數據獲得了接近“航天級”的安全保障。
如該校高性能計算中心負責人所言:“科研像奧運會,只追求更快更高更強。存儲在 AI 集群里,是非常核心的一環。”
從電信到具身智能,再到科研教育,這些場景共同構成了“先進存力”的現實注腳——它不是一串抽象的參數,而是落在一座座數據中心、一臺臺機器人、一個個集群上的系統性能力。
04
和“事實標準”PK到底
站在 2025 年回望,我們可以看到一條逐漸清晰的路徑:在技術與周期層面,AI 讓算力需求爆炸式增長,也讓存力成為全新的瓶頸和稀缺資源;在國家與產業層面,中國通過“存力中國行動”給出明確的時間表與數字目標,把存力提升到與算力同等重要的戰略高度。
而特別讓人踏實的是,在企業與標準層面,以曙光為代表的一批本土廠商,通過中電標協數據存儲專委會的平臺,嘗試推動從設備、系統到標準的全棧躍遷,讓中國存儲不再只是“補課者”,而成為 AGI 時代存儲新范式的“共同制定者”。
在我個人關于存力的專著《第四支柱》中多次指出,從社會責任的角度看,曙光的角色已經超出了一個商業公司本身:
——在“東數西算”“國家算力網絡”等戰略工程中,它承擔起存力底座的建設任務;
——在供應鏈安全和技術自主的大背景下,它堅持全棧自研的艱難路線;
——在行業標準尚未定型的當下,它通過專委會等平臺,推動產業鏈上下游形成共識。
而這并不是曙光存儲的終點,因為新成立的協會,則代表其要肩負著更廣義的行業擔當:
既要為企業提供協調與對話的平臺,又要在國際標準博弈中,代表中國存儲發聲。
![]()
最終,所有的努力都會匯入同一個終極賽場——國際存儲競爭。
在這個賽場上,常被提起的一句話是:“一流企業做標準,二流企業做品牌,三流企業做產品。
但在 AI 時代,需要加上一句補充——標準的 PK,歸根到底只有一條原則:市場的選擇。
歷史已經給出過太多案例,脫離生態、脫離應用的“紙面標準”,最終往往被市場拋棄;真正有生命力的,是像 NVMe、SATA、S3 這類“事實標準”——它們不是寫出來的,而是在一次次場景落地和商業選擇中“用出來”的。
對中國存儲產業而言,未來要定的標準,絕不能是關起門來自說自話的技術條款,而必須是:開放的、可對接全球生態的標準;來自實踐、能解決真實痛點的標準。
以及,最終能通過廣泛市場采用,沉淀為 AGI 時代“事實標準”的標準。
曙光和它的同行者們正在走的,是一條從“技術自立”到“產品突圍”,再到憑借市場選擇確立“事實標準”的艱難而正確的道路;這既是企業的機遇,也是中國存儲產業在超級周期面前,真正實現從量到質躍遷的必由之路。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.