![]()
當前,整個信息技術產業正處在一個關鍵的節點上。一邊是生成式AI、自動駕駛等技術快速商業化,推動全球數據總量激增。另一邊,基礎的數據存儲環節,正面臨從成本、容量到性能的全維度壓力。
全球存儲硬件價格已進入顯著的上行通道,部分產品價格短期波動劇烈。這使得企業數據中心擴容和AI基礎設施建設的預算持續攀升,成本控制面臨挑戰。與此同時,AI的普及也改變了數據性質。自動駕駛產生海量感知數據,大模型需要處理PB級數據集,這些不僅要求“存下來”,更對存儲系統的容量擴展提出了近乎無限的要求。AI推理場景中,對海量參數和億萬級小文件的實時并發調用,則將存儲系統的性能短板暴露無遺。
因此,當前的存儲緊張,其本質并非傳統的周期性價格調整,而是一場由AI技術驅動的“數據洪峰”,與全球存儲產能(特別是適應AI需求的高性能產能)爬坡緩慢之間的結構性碰撞。
行業的結構性挑戰,必然呼喚結構性的解決方案。在這一背景下,任何在AI存儲領域取得的實質性突破,都格外值得關注。
近日,在全球權威的存儲性能評測 IO500 榜單中,京東云海存儲躋身全球前四,并位列國產自研第一。這項成績的一個關鍵背景在于,它是目前全球性能最強的、基于通用 NVMe 架構的 AI 存儲系統,同時也是全球最大規模基于國產 CPU 的 AI 存儲實踐。
![]()
這一突破之所以引人注目,是因為它不依賴于極端專用硬件,而指向了一條通過全棧自研的軟件和架構優化,在通用化、開放化的技術路徑上實現頂級性能的路徑。這無疑為應對前述行業困境,提供了一個新的、切實可行的技術視角。
01、一場非周期性的“存儲荒”
談論人工智能的未來,業界有一個共識:AI 始于數據而不是 GPU。因此 AI 時代也是數據存儲創新的黃金時代。
過去,存儲系統的設計首要考量是容量與可靠性,性能往往是夠用即可;但在 AI 的世界里,尤其是在大模型訓練與高頻推理場景下,數據的供給速度直接決定了價值數千萬乃至上億的 GPU 集群,究竟是在全力“煉金”,還是在無奈“空轉”。
傳統存儲架構在處理這類元數據密集型負載時,其吞吐能力和延遲瓶頸暴露無遺,直接導致昂貴的算力資源利用率長期徘徊在低位,“算力空轉”成為行業通病。
據 Gartner 預測數據,2025 年全球 Data Center 支出將激增約 46%,接近 4900 億美元,這一增長主要是由生成式 AI 驅動,AI服務器正在消耗全球 40% 的 DRAM 和高容量SSD。這意味著海量的非結構化數據,如文本、圖像、視頻等,不僅需要被簡單地歸檔保存,更需要被實時地、高并發地處理和調用。
需求的劇變,迅速傳導至供給端,引發了一系列連鎖反應。為滿足 AI 服務器對極致內存帶寬的渴求,全球主要的存儲芯片制造商,如三星,SK 海力士,正將核心的晶圓產能,大規模轉向生產高帶寬內存(HBM)和 DDR5 等高端產品。
這種產能的“虹吸效應”,直接導致傳統平價存儲產品 DDR4/LPDDR4X 供給同比減少 60%。一些頭部 AI 公司動輒鎖定全球產量數十百分比的大額長期協議,更是加劇了這種緊張,報價模式也從季度走向“每日定價”。這意味著采購存儲不再基于長期規劃,而更像是應對每天價格波動的短線操作,一個由賣方主導的極端市場已然形成。
毫無疑問,我們正在經歷的,并非存儲器行業周而復始的周期性價格波動,而是一場由 AI 技術革命直接驅動的“結構性超級周期”。過去的周期有跡可循,供需在動態中尋找平衡;而此次,AI 帶來的需求是全新的、剛性的,且仍在急劇膨脹,它從根本上重塑了存儲市場的價值標準和供需關系。
![]()
因此,行業需要的是一種“不妥協”的解決方案:它必須在性能上足以喂飽最饑餓的 AI 算力,滿足千萬級 IOPS、TB 級帶寬和百微秒級延遲的嚴苛門檻;也必須在成本上具備極強的抗波動韌性,能對沖硬件漲價的壓力,甚至通過架構創新降低總擁有成本;同時,在金融、政務等關鍵領域,它還必須滿足核心技術自主可控的剛性要求。
這三重要求,構成了 AI 時代存儲底座必須跨越的“新三角”。
02、技術新周期,呼喚怎樣的新一代AI存儲
如前文所言,AI 所需求的存力不只是擴大容量,而是徹底改變了“數據怎么被存、怎么使用、用得有多快”。海量的數據不僅需要被存儲,更需要被高速地處理、分析和調用。
由此,AI 存儲的門檻非常直觀。
大模型應用場景下,數據集以文檔、圖片、音視頻等非結構化小文件為主 —— 單文件通常僅為幾十字節到幾百 KB,但總量可達數億甚至數十億級別。這種“海量小文件”要求的儲存能力是,極高的元數據管理效率與高并發小文件吞吐。
帶寬亦是一大瓶頸。一般大模型應用的讀取帶寬需求約為 40G,寫入帶寬約為 20G。數千個計算節點同時訪問存儲系統,存儲帶寬的要求比電商業務頂峰時段高出幾百甚至幾千倍,存儲性能的高低可能造成模型訓練周期 3 倍的差異。再者,大模型參數實時同步要求存儲延遲低于 50 微秒,而傳統 NAS 系統平均延遲 500 微秒以上。
若存儲帶寬或并發調度等核心能力跟不上,算力就會被逼成“等數據”的閑置狀態。GPU 長期低利用率、讀寫高延遲耽擱訓練周期,直接拖慢產品落地。
傳統存儲性能不足,京東云海這類面向大模型場景深度優化的基礎設施因此脫穎而出。
云海 AI 存儲可支持千億級參數 AI 大模型,基于自研引擎采用全追加寫模型,融合超低延時 RDMA 網絡與軟件架構優化,實現了接近本地 NVMe 磁盤的 I/O 性能表現:4K 隨機寫 IOPS 達到 1000 萬級,平均延遲在 100 微秒級,單節點可提供 44GiB/s 的帶寬性能。
在大模型訓練的并行文件存儲下,單文件系統支持千萬級 IOPS,上萬臺服務器同時并發訪問,為超大規模 AI 訓練任務保駕護航。
但性能拉滿是一方面,性價比決定了它能否真正規模化落地。
企業本身在在大容量、高性能存儲系統軟硬件方面投入已經非常可觀,單次投入多在數百萬至數千萬級別。以一臺 L3 級別的自動駕駛測試車為例,其平均每天產生 60TB 的數據,完整測試產生的數百 PB 數據更需要存儲 30 年以上。
除了巨量新增數據,企業還需兼顧存量數據的低成本存儲。像關鍵領域的數據存儲就有硬性要求,如政府電子檔案要求保存周期為 5 年甚至更長,公檢法司數據要求保存周期至少 30 年以上。
而較傳統超算存儲技術,云海 AI 存儲不采用 PMEM 硬件,具備更強通用性的同時,也實現了更低存儲成本。這是它能夠一舉拿下性能、成本、規模化落地多項第一的底氣。
音頻存儲可視為一個低頻文件需兼顧高安全與低成本的典型場景。像國內頭部音頻平臺荔枝有數億低頻文件存儲需求,京東云基于自研云海存儲系統,為其構建過一套兼顧性能、成本與可靠性的存儲解決方案。
![]()
其中包括通過存算分離架構,將計算與存儲資源獨立調度,打破固定配比限制,使磁盤利用率提升至 90%;獨創冷熱數據自動分層機制,熱數據三副本保障毫秒級響應,冷數據采用 EC 低冗余技術(僅 1.1x 副本率),在保持極高數據可靠性的同時,綜合存儲成本直降 30%;以及建立跨機架、多節點容災體系,實現每次讀寫自動多副本備份。
得益于這些設計,云海存儲為荔枝 4.5 億用戶提供了高品質、零中斷的音頻服務,為互聯網成熟期企業量身打造了經濟高效、安全可靠的全新存儲范式。
當然,作為國產自研第一的 AI 存儲,滿足國產化場景的可控需求方面,云海也做得足夠扎實。
信創重點行業如金融、政務、能源等關鍵領域需滿足信創適配要求,同時保證核心技術自主可控。這就需要企業在建設存儲系統中采用大量國產硬件,又不能為性能短板所限。
云海作為京東 100% 自研產品,代碼自研率超 98%,核心技術完全自主可控。且云海與主流國產化硬件和軟件兼容互認,包括操作系統、數據庫、中間件、服務器、CPU等等,可基于全局無鎖架構充分發揮國產硬件能力。
以金融行業為例,某頭部證券公司對存儲系統的要求非常具體:高性能、低成本,能夠無縫對接主流國產虛擬化平臺,并與現有域環境和告警平臺實現兼容。這些傳統存儲系統的“不可能任務”,云海通過采用多臺鯤鵬和海光 CPU 架構存儲一體機搭建分布式存儲集群,解決了對應挑戰。
在信息安全自主可控的前提下,提升資源利用率、降低硬件采購成本,這是現代企業數字化轉型的共同議題,也只有能全面處理相應需求的存儲服務,能夠穿越這個“超級周期”。
03、解鎖AI生產力,國產存儲的破局之路
其實性能、成本和可控性的三維優化,其綜合效益會體現在具體服務的“高可用性”上。換句話說,京東云海提供的 AI 儲蓄技術方案,讓高性能存儲從 “大廠專屬” 變為 “大眾可用”。
這種高可用性最突出的標識是部署靈活。當下,大多數云廠商傾向把存儲服務與云平臺高度綁定,其局限也很明顯:擴容不靈活、彈性差、成本高,難以適應多樣化與快速變化的業務要求。
但云海從京東云完全解耦,支持獨立部署交付,給到充分的配置自由度。這使其在超百家金融、證券、汽車等企業場景交付驗收,并穩定運行至今。
再者,前文提到的價格競爭力,亦包含京東集團的供應鏈集采優勢提供的保障。前文提到,由于 AI 與存儲需求激增,使得硬件供給結構受到沖擊。而相較于純軟件競品,云海在通用硬件能力的基礎上,典型配置價格更低。企業用得起,且性價比優勢明顯。
云海在京東內部多種復雜場景的打磨實踐也不能忽視。在保證高性能與低成本的同時,云海產品的穩定性歷經 13 年實踐驗證,從 618 到 11.11 的高流量洗禮中實現零故障。其穩定性和可靠性的含金量早已全面領先,自然會吸引如科大訊飛一般的行業頭部客戶采用。
例如,科大訊飛 AI 營銷采用“開源分布式存儲軟件+服務器硬件”搭建,對十億級小文件數據量時,讀寫性能陡然下降。但升級京東云 AI 存儲云海后,科大訊飛 AI 營銷實現了一個集群一個文件系統,可輕松應對多模態大模型時千億到十萬億的參數規模。
同時,基于高性能存儲層,以及大容量存儲層的自動數據分級,在大幅降低存儲成本的同時,實現了大模型訓練能力的大幅提升,幫助科大訊飛的 AI 營銷業務降本增效。
![]()
行業普遍認為,未來不可能是一個通用大模型解決所有用戶需求,而將存在多種應用大模型根據用戶場景并行使用。這意味著,前文所討論的由 AI 驅動數據量激增以及高并發推理需求,將成為常態并持續走高。
此時此刻,我們顯然不能再將 AI 競爭等同于算力比拼。畢竟數據處理的需求需要長期、穩定、可擴展地服務于業務場景,如果存儲不能快速響應、無法穩定承載大規模數據訪問或成本過高,即使算力再強,也無法讓 AI 持續高效地服務企業用戶。
因此,存儲能力會是 AI 競爭的一個賽點,京東云海的 IO500 榜單成績亦是一個信號。其自研存儲系統仍有非常大的上限拓展空間,還將推動高性能存儲在模型訓練、科學計算、大規模數據分析等垂直場景中廣泛應用,助力更多企業重塑 AI 生產力。
尤其是在一個追求算力效率與自主可控的時代,云海 AI 存儲這種駕馭全局復雜性的“工程思維”,也代表了一種更具韌性和普適性的基礎設施構建理念。它意味著,企業獲得先進存力的方式可以變得更靈活、更經濟,也更能支撐起持續演進的AI戰略。
畢竟,AI 的普惠未來,離不開一個同樣普惠、堅實且自主的數據基座。當存儲的枷鎖被打開,數據的潛力才能真正奔涌,驅動智能最終抵達每一個需要它的角落。
*題圖及文中配圖來源于網絡。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.