編輯|Panda
一根 256 GB 內(nèi)存條標價 5000 美元?這個價格已經(jīng)輕松超過了英偉達頂配顯卡 RTX 5090 的市場溢價。
![]()
此推文引發(fā)了廣泛討論,已收獲超 200 萬瀏覽,圖源:X@Yuchenj_UW
由于 AI 算力需求引發(fā)了極端的結(jié)構(gòu)性緊缺,全球內(nèi)存市場正陷入一場前所未有的瘋狂。報道稱 OpenAI 與三星電子、SK 海力士簽署了大規(guī)模 DRAM 晶圓供應(yīng)協(xié)議,其預(yù)估的 DRAM 晶圓需求可能達到全球 DRAM 晶圓產(chǎn)能的約 40%,這一需求規(guī)模在行業(yè)內(nèi)引發(fā)了對存儲供應(yīng)緊張的關(guān)注。與此同時,微軟、谷歌等大型科技公司也派出采購團隊在韓國與這些主要存儲芯片供應(yīng)商展開密集談判,以爭取更多 DRAM 和高帶寬存儲(HBM)供應(yīng)資源。
而就在 2026 年 1 月的 CES 演講中,英偉達 CEO 黃仁勛又更進一步為這股趨勢給出了極具分量的判斷。
他指出,圍繞 AI 推理與上下文的數(shù)據(jù)存儲正在形成一個「此前從未真正存在過的市場」,并預(yù)測其規(guī)模很可能成長為全球最大的存儲市場之一,因為它在本質(zhì)上承載著全球 AI 系統(tǒng)的工作內(nèi)存(working memory)。黃仁勛強調(diào),AI 的工作負載在訪問模式、時延要求和數(shù)據(jù)生命周期上都與傳統(tǒng)數(shù)據(jù)庫和存儲系統(tǒng)截然不同,因此現(xiàn)有存儲架構(gòu)難以滿足需求,存儲技術(shù)本身必須經(jīng)歷一次根本性的重構(gòu)。
![]()
視頻鏈接:https://mp.weixin.qq.com/s/w3GRxO8EsPpZJMlhyTQFKA
這種底層架構(gòu)的變革需求,正是當下 AI 基礎(chǔ)設(shè)施面臨的一大核心挑戰(zhàn)。
現(xiàn)在,一家成立已過十周年的公司對這一挑戰(zhàn)發(fā)起了沖鋒。
1 月 15 日, XSKY 星辰天合在北京舉辦了主題為「數(shù)據(jù)常青 智算無界」的 AIMesh 產(chǎn)品戰(zhàn)略發(fā)布會,并宣布戰(zhàn)略重心從「信息技術(shù)(IT)」全面跨越至「數(shù)據(jù)智能(Data Intelligence)」。
![]()
這家成立于 2015 年 5 月的企業(yè),已經(jīng)在十年多的時間里從初創(chuàng)團隊成長為一頭獨角獸,更是已然成為中國對象存儲市場的領(lǐng)跑者,并肩負起了中國核心產(chǎn)業(yè)超過5500 PB關(guān)鍵數(shù)據(jù)的安全重任。不僅如此,該公司的增長勢頭依然強勁:在近三年實現(xiàn)了超過 50%的逆勢高增長;隨著業(yè)務(wù)對性能渴望的加劇,其全閃存占比已翻了三倍,達到了35%。大規(guī)模存儲方面,XSKY 已經(jīng)擁有了28010 PB級以上的超級集群,甚至跨越了單機群百 PB的技術(shù)門檻。這每一個數(shù)字的增長,都是客戶投下的一張張信任票,也構(gòu)成了 XSKY 應(yīng)對 AI 大爆發(fā)的底層底氣。
從這些數(shù)字也看得出來,AI 大爆發(fā)正在催動數(shù)據(jù)中心的進化。
過去十年的 IT 時代,數(shù)據(jù)中心的功能類似于一座嚴謹?shù)摹笀D書館」,價值核心在于數(shù)據(jù)的「存得進、找得到」。但在進入數(shù)據(jù)智能時代后,數(shù)據(jù)的價值正在從「被檢索」進化為「被計算」,每一份文檔和圖片都正成為生成未來的燃料。
為了適應(yīng)這種轉(zhuǎn)變,企業(yè)的數(shù)據(jù)中心必須完成一次物種進化,從安靜的圖書館演變?yōu)橐蛔找罐Z鳴的「AI 工廠」。
面對大模型時代的算力博弈,XSKY 確立了清晰的戰(zhàn)略定位:通過發(fā)布 AIMesh 全棧 AI 數(shù)據(jù)方案,XSKY 致力于打造開放解耦且絕對中立的數(shù)據(jù)底座,旨在破解企業(yè)私有高價值數(shù)據(jù)向智慧轉(zhuǎn)化的效率瓶頸。
![]()
為什么「專有數(shù)據(jù)」是 AI 時代唯一的護城河?
在大模型技術(shù)快速迭代的當下,業(yè)界逐漸達成了一個共識:算法正在走向同質(zhì)化。
正如 AI 大牛 Andrej Karpathy 指出的那樣,大模型(如 Transformer)的算法實現(xiàn)非常簡潔,通常只有幾百行代碼。他提出,在大模型時代,數(shù)據(jù)不再僅僅是燃料,數(shù)據(jù)就是「源代碼」。因為人類不再通過編寫邏輯代碼來解決問題,而是通過策劃、清洗和標注特定的數(shù)據(jù)集,讓模型通過學習這些數(shù)據(jù)來獲得專家能力。
而對于企業(yè)而言,當領(lǐng)先的模型架構(gòu)和訓練方法變得透明且易于獲取時,企業(yè)真正的差異化競爭優(yōu)勢和護城河,就在于其自身擁有的獨特「專有數(shù)據(jù)」。這些數(shù)據(jù)是企業(yè)長年累月積淀下的獨有配方,也是將通用大模型轉(zhuǎn)化為具備垂直領(lǐng)域?qū)<夷芰Φ娜剂稀?/p>
出于安全和合規(guī)的考慮,這些高價值的核心數(shù)據(jù)不能外溢到公有云,它們必須牢牢掌握在企業(yè)自己手中。因此,構(gòu)建一個私有化、安全且可控的 AI 數(shù)據(jù)底座成為了企業(yè)的剛需。
XSKY 的角色正是守住數(shù)據(jù)安全的底線,讓企業(yè)能將私有數(shù)據(jù)在內(nèi)部安全地轉(zhuǎn)化為智慧。
這種對數(shù)據(jù)價值的深度理解,已經(jīng)在行業(yè)頭部的實踐中得到了驗證。剛剛在 1 月 9 日成功登陸港交所的 MiniMax 便是典型的例子。作為全球 AI 領(lǐng)域從創(chuàng)立到上市最快紀錄的最新創(chuàng)造者,MiniMax 的成功證明了在算法日益透明的今天,私有數(shù)據(jù)資產(chǎn)才是支撐企業(yè)估值與競爭力的核心。
目前,MiniMax 有 PB 級的數(shù)據(jù)存放在 XSKY 的存儲平臺上,其中包括最核心的訓練數(shù)據(jù)與推理模型數(shù)據(jù)。對于這類處于商業(yè)化爆發(fā)期的頭部 AI 企業(yè)而言,存儲底座的穩(wěn)定性直接決定了研發(fā)的連續(xù)性。
這種需求的變化也預(yù)示著基礎(chǔ)設(shè)施職能的徹底改變。正如前文所說,過去的數(shù)據(jù)中心更像是一座安靜的「圖書館」,核心任務(wù)是確保數(shù)據(jù)「存得進、找得到」。但在 AI 時代,數(shù)據(jù)中心必須進化為一座日夜轟鳴的「AI 工廠」,數(shù)據(jù)不再是靜止的檔案,而是被不斷計算、不斷產(chǎn)生價值的動態(tài)資產(chǎn)。XSKY 的戰(zhàn)略目標,就是幫助企業(yè)的專有數(shù)據(jù)完成這一物種進化,讓基礎(chǔ)設(shè)施能夠支撐起從數(shù)據(jù)準備到模型訓練再到推理部署的全生命周期。
AIMesh 如何推倒阻礙 AI 效率的「三堵墻」?
在大模型訓練與推理的實戰(zhàn)場景中,傳統(tǒng)的存儲架構(gòu)正面臨嚴峻的挑戰(zhàn)。這些挑戰(zhàn)可以被總結(jié)成三堵墻:IO 墻、重力墻和內(nèi)存墻。
- IO 墻:當算力的吞吐速度遠遠超過存儲的讀寫速度時,計算單元被迫進入空轉(zhuǎn)等待狀態(tài),導(dǎo)致 GPU 利用率往往低至 30% 到 50%。
- 重力墻:隨著數(shù)據(jù)體量的指數(shù)級增長,跨地域流動的高昂成本讓數(shù)據(jù)逐漸淪為孤島,形成了難以逾越的「重力墻」。
- 內(nèi)存墻:隨著 AI 應(yīng)用向長上下文和復(fù)雜智能體(Agent)演進,KVCache 的爆炸式增長讓顯存(HBM)撞上了物理極限的「內(nèi)存墻」,導(dǎo)致硬件投入成本急劇攀升。
![]()
典型的「內(nèi)存墻」:2018 年至 2025 年期間,Transformer 模型尺寸每 2 年增長約 19 倍,而每個加速器的內(nèi)存每 2 年僅增長約 1.9 倍。不僅如此,過去 20 年間,峰值計算能力增長了約 6 萬倍,但 DRAM 帶寬僅增長了約 100 倍,互連帶寬也僅增長了約 30 倍。結(jié)果就是:處理器閑置等待數(shù)據(jù)。來源:ayarlabs.com
要推倒這些深層物理層面的效率障礙,不僅需要軟件架構(gòu)的創(chuàng)新,更需要與底層芯片性能的深度適配。舉個例子,作為這一進程的見證者,芯片巨頭英特爾與 XSKY 的合作已經(jīng)跨越了第一個十年。從早期作為 Intel SPDK 技術(shù)最早的一批貢獻者共同探索用戶態(tài)輪詢技術(shù),到如今實現(xiàn)對最新硬件的 Day-0 級技術(shù)響應(yīng),這種長期的技術(shù)共創(chuàng)為 AIMesh 全棧 AI 數(shù)據(jù)方案的發(fā)布奠定了基礎(chǔ)。
基于這種長期的軟硬協(xié)同積淀,XSKY 通過 AIMesh 構(gòu)建了一張面向 AI 工廠的數(shù)據(jù)與內(nèi)存網(wǎng),旨在打破這三堵墻,進而利用架構(gòu)創(chuàng)新將技術(shù)參數(shù)轉(zhuǎn)化為真實的業(yè)務(wù)價值。
MeshFS:打破 IO 墻,加速模型訓練
面對 AI 訓練中嚴峻的「IO 墻」挑戰(zhàn),XSKY 發(fā)布了專為 AI 訓練而生的并行文件系統(tǒng)MeshFS
![]()
該系統(tǒng)將 XGFS 成熟的企業(yè)級協(xié)議棧與 XSEA 星飛全閃架構(gòu)的 Shared-Everything 極速底座深度融合,為軟件棧注入了強勁的性能心臟。
為了徹底破解算力在等待數(shù)據(jù)時的損耗,MeshFS 在以下三個維度實現(xiàn)了技術(shù)突破:
- 全協(xié)議兼容:MeshFS 提供標準的 POSIX 語義,這意味著現(xiàn)有的 Python 或 TensorFlow 訓練代碼無需修改即可運行。更重要的是其實現(xiàn)了「一份數(shù)據(jù),多協(xié)議互通」,數(shù)據(jù)清洗可以通過 HDFS 接口使用 Spark,訓練過程通過 POSIX 接口使用 PyTorch,歸檔則使用 S3。數(shù)據(jù)在全流程中不需要搬家,原地即可被不同的業(yè)務(wù)流處理。MeshFS 也完美支持 Kubernetes CSI。
- 線性的極致性能:通過全分布式架構(gòu)和元數(shù)據(jù)分片技術(shù),MeshFS 的性能可以隨節(jié)點數(shù)線性增長。系統(tǒng)引入了 Run To Completion 技術(shù),將元數(shù)據(jù)處理延遲壓低至微秒級。即使面對億級規(guī)模的小文件數(shù)據(jù)集,依然能保持順滑的訪問體驗。
- 企業(yè)級管理與智能分層:在提供目錄 QoS、配額以及審計等完善特性的同時,MeshFS 支持智能分層能力。數(shù)據(jù)可以在全閃存層和低成本層之間透明流動,讓用戶能夠以 Tier-2 的成本存儲數(shù)據(jù),同時享受 Tier-0 的訓練速度。
在性能實測中,MeshFS 憑借「一跳讀」設(shè)計實現(xiàn)了順序讀帶寬 30% 的提升,同時依靠端到端 EC 寫技術(shù)讓順序?qū)憥挸鐾惍a(chǎn)品 50%
此外,MeshFS 還針對英特爾新一代至強處理器的 AVX-512 與 AMX 指令集進行了深度優(yōu)化。
在剛剛完成 IPO 的大模型企業(yè) MiniMax 的生產(chǎn)環(huán)境中,MeshFS 提供了高吞吐、低延遲的 I/O 支持。無論是在大規(guī)模數(shù)據(jù)的 DataLoad 階段,還是在關(guān)鍵的 Checkpoint 保存環(huán)節(jié),MeshFS 都能有效保證訓練效率。而在推理端,MeshFS 的高吞吐特性支撐了近萬個推理服務(wù)在極短時間內(nèi)上線,確保了海螺 AI 等核心產(chǎn)品在全球市場的競爭力。
在這種頂級 AI 企業(yè)的高強度實戰(zhàn)中,XSKY 的技術(shù)架構(gòu)經(jīng)受住了考驗,成為了支撐其走向資本市場的堅實底座。
MeshSpace:推倒重力墻,實現(xiàn)全局流動
面對「重力墻」,XSKY 給出的解決方案是MeshSpace
![]()
作為面向 EB 級數(shù)據(jù)的全局非結(jié)構(gòu)化數(shù)據(jù)平臺,MeshSpace 實現(xiàn)了從「單桶千億」到「單桶 EB」的架構(gòu)演進。
MeshSpace 通過三大核心能力,重新定義了大規(guī)模存儲的治理模式:
- 平滑演進能力:MeshSpace 能夠直接納管企業(yè)現(xiàn)有的 XEOS 集群。這意味著過去十年積累的數(shù)據(jù)資產(chǎn)無需經(jīng)歷痛苦的遷移過程,即可原地升級并融入新的 AI 訓練流。
- 全局控制面統(tǒng)一:這是架構(gòu)設(shè)計中最具突破性的地方。通過統(tǒng)一的 DNS 接入,MeshSpace 將分散在不同物理機房、甚至是云端的物理集群抽象為一個邏輯整體。對于業(yè)務(wù)端而言,無論底層物理資源如何離散,都只有一個統(tǒng)一的入口。物理上是離散的,但在邏輯上,它們就是「一套存儲」。
- 數(shù)據(jù)治理全局化:MeshSpace 支持異構(gòu)存儲平臺的統(tǒng)一調(diào)度。數(shù)據(jù)可以在全閃存、HDD 甚至磁帶之間,根據(jù)數(shù)據(jù)溫度和業(yè)務(wù)需求自由流動,確保熱數(shù)據(jù)能夠快速參與計算,冷數(shù)據(jù)能夠自動沉降以降低成本。
在性能表現(xiàn)上,MeshSpace 帶領(lǐng)對象存儲正式邁入了「百萬 OPS 單桶時代」。單個對象存儲桶可以每秒支持高達一百萬次對象寫入,以及數(shù)百萬次對象讀取,這一規(guī)格遠超主流公有云產(chǎn)品的單桶性能上限。不僅如此,XSKY 還對 XScale 最底層的分布式 KV 引擎進行了徹底的優(yōu)化,讓 AI 訓練中關(guān)鍵的大塊寫性能提升了近 50%,同時將延遲降低了 30%
這種架構(gòu)精準擊中了 MiniMax 等混合云用戶的痛點。由于采用了混合云架構(gòu),數(shù)據(jù)孤島帶來的跨域調(diào)度成本曾是其核心挑戰(zhàn)。MeshSpace 幾乎是為其量身定制的解決方案,通過統(tǒng)一的全局命名空間收斂數(shù)據(jù)入口,業(yè)務(wù)端不再需要感知數(shù)據(jù)的真實物理位置,從而徹底解決了數(shù)據(jù)遷移帶來的低效問題,極大降低了管理成本。
MeshFusion:擊穿內(nèi)存墻,降低推理成本
至于最后的內(nèi)存墻,XSKY 推出了一種面向 KVCache 的「持久化內(nèi)存」方案MeshFusion
MeshFusion 運行在 GPU 服務(wù)器內(nèi)部,通過創(chuàng)新的軟件棧將本地 NVMe SSD 資源池化,轉(zhuǎn)化為可供 GPU 直接調(diào)用的 L3 級外部內(nèi)存。
不僅如此,MeshFusion 還擁有三大必殺技:
- 零拷貝:數(shù)據(jù)從 SSD 直通 GPU 顯存,極大降低延遲。
- 極致并發(fā):專為 KVCache 的小 IO、高并發(fā)寫入優(yōu)化,支持原子提交。
- 協(xié)議自適應(yīng):兼容 vLLM、SGLang 等主流推理框架,代碼零修改。
實測數(shù)據(jù)顯示,該方案能以 1% 的硬件成本實現(xiàn)近乎無限的上下文窗口,且性能與 DRAM 的差距保持在 10% 以內(nèi)。
云計算服務(wù)商 ZStack 表示,MeshFusion 的 SSD 擴展內(nèi)存能力將顯著降低 AI 服務(wù)規(guī)模化部署的門檻,并計劃將其與自身的 AIOS 智塔平臺展開深度集成。同時,XSKY 正在與英特爾聯(lián)合預(yù)研基于 CXL 技術(shù)的內(nèi)存池化方案,旨在徹底打破物理內(nèi)存邊界,為萬億參數(shù)模型提供充裕的資源池支持。
數(shù)據(jù)常青與絕對中立的戰(zhàn)略定力
在當前「百模大戰(zhàn)」的背景下,技術(shù)架構(gòu)與算法模型正處于劇烈的變動期。對于企業(yè)決策者而言,在極高的不確定性中做出確定的選擇至關(guān)重要。XSKY 給出的答案是堅持開放解耦,做絕對中立的數(shù)據(jù)底座
這一戰(zhàn)略背后蘊含著深刻的時間邏輯。在 XSKY 看來,算力硬件(GPU)的生命周期通常只有3 到 5 年,屬于快速迭代的變量。相比之下,承載著企業(yè)智慧的代碼、文檔與影像等數(shù)據(jù)資產(chǎn),其存續(xù)周期通常長達10 到 20 年
因此,XSKY 提出了「數(shù)據(jù)常青」的理念,主張用一個穩(wěn)固、長周期的底座去支撐上層快速演進的算力競爭,以不變的底座應(yīng)對萬變的未來。
為了實現(xiàn)這種確定的支撐,XSKY 始終堅持不綁定任何一種特定的算力平臺。無論企業(yè)選擇英偉達,還是昇騰、寒武紀、摩爾線程、沐曦等國產(chǎn)芯片,AIMesh 都能提供統(tǒng)一且標準的數(shù)據(jù)服務(wù)。這種中立立場賦予了客戶在算力博弈中的主動權(quán),使其能夠根據(jù)業(yè)務(wù)需求自由選擇最合適的硬件資源,而不必擔心被特定生態(tài)鎖死。
這種對中立與解耦的堅守,也讓 XSKY 在生態(tài)構(gòu)建中獲得了深厚的信賴。以 ZStack 為例,雙方在云計算時代便是「存算分離」建設(shè)的優(yōu)選組合,彼此被稱為「背靠背的戰(zhàn)友」。進入 AI 時代,這種默契得到了延續(xù)。ZStack 認為 AIMesh 的架構(gòu)設(shè)計與其 AIOS 智塔戰(zhàn)略高度契合,雙方計劃在智算中心建設(shè)中繼續(xù)復(fù)制云時代的成功經(jīng)驗,共同成為智能算力基礎(chǔ)設(shè)施中可靠、高效的算存基石。
從云計算到大模型,技術(shù)浪潮幾經(jīng)更迭,但 XSKY 始終致力于解決大規(guī)模數(shù)據(jù)存儲與利用的核心需求。正如發(fā)布會所強調(diào)的,XSKY 的使命是做企業(yè)數(shù)據(jù)資產(chǎn)的守門人,同時也是 AI 之路的加速器。通過構(gòu)建高效、可控的 AI 工廠,XSKY 將持續(xù)助力企業(yè)打破算力與數(shù)據(jù)的邊界,實現(xiàn)智算無界。
做數(shù)據(jù)資產(chǎn)的守門人
2026 年 1 月 15 日舉行的這場戰(zhàn)略發(fā)布會,標志著 XSKY 將其十年的技術(shù)積累全面導(dǎo)向 AI 場景。AIMesh 全棧方案的發(fā)布,是 XSKY 面對智算時代給出的一份階段性答卷。
回顧這十年的進階歷程,XSKY 對 AI 浪潮的布局早在數(shù)年前就已經(jīng)開始。在 2022 年,公司便預(yù)判到了 AI 對于極致性能與數(shù)據(jù)治理的迫切需求,并投入研發(fā)了XSEA全閃底座EasyData 數(shù)據(jù)管理平臺。作為 Shared-Everything 架構(gòu)的極速底座,XSEA 已經(jīng)通過了金融核心交易與自動駕駛算力中心等嚴苛場景的驗證,為今天的 MeshFS 提供了澎湃的性能心臟。而 EasyData 則作為數(shù)據(jù)編排與治理的中樞,面向從采集、清洗到歸檔的完整鏈路提供全局管理,確保了 AI 數(shù)據(jù)全生命周期的有序流動。
正是基于這些關(guān)鍵技術(shù)點的長期深耕,XSKY 才能在今天完成從「單點極致」到「全局統(tǒng)領(lǐng)」的架構(gòu)升維。這一戰(zhàn)略升級的核心目標在于破解企業(yè)私有高價值數(shù)據(jù)向智慧轉(zhuǎn)化的效率瓶頸。
在未來的競爭中,算力硬件的生命周期可能只有 3 到 5 年,但承載企業(yè)智慧的數(shù)據(jù)資產(chǎn)卻要存續(xù) 10 到 20 年。XSKY 將繼續(xù)堅守「數(shù)據(jù)常青」的理念,通過提供開放且解耦的基礎(chǔ)設(shè)施,支撐上層快速迭代的算力競爭。作為數(shù)據(jù)資產(chǎn)的守門人,XSKY 同時也是企業(yè) AI 之路的加速器。在智算中心需求爆發(fā)的未來,XSKY 將持續(xù)助力企業(yè)打破存儲與計算的邊界,確保私有數(shù)據(jù)資產(chǎn)高效轉(zhuǎn)化為智能優(yōu)勢。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.