9月12日,2025全球數據存儲教授論壇在深圳舉行,華為公司揭曉第五屆“奧林帕斯獎”唯一最高獎:清華大學計算機系武永衛教授團隊以“以存換算”技術方案摘下桂冠,這是清華繼2020年舒繼武團隊后第二次在這一全球賽事中登頂。兩次獲獎,相隔五年,卻共同指向同一命題——讓數據存得更快、更省、更智能,也為AI大模型時代的中國存儲方案寫下有力注腳。
![]()
武永衛團隊此次瞄準的是大模型推理的“內存焦慮”。隨著參數規模膨脹,推理階段近九成顯存被KVCache占用,GPU外的大量CPU內存、NVMe SSD與近存計算資源卻長期閑置。團隊提出“以存換算”新范式:先把KVCache做成全局共享池,讓同一段緩存跨卡、跨機、跨任務復用,命中率提高3.6倍;再把“冷數據”下沉到SSD或近存計算節點,“熱計算”繼續留在顯存,實現存算異構協同,顯存需求平均下降58%。基于這一思路,他們發起Mooncake架構與KTransformers框架兩個開源項目,已在GitHub收獲1.8萬星,被月之暗面Kimi、阿里、螞蟻、訊飛等平臺采用,單卡即可跑128k長文本,相當于把原本需要8卡A100的推理任務壓縮到3卡完成,硬件成本直降六成。相關論文獲FAST 2025最佳論文獎,36項發明專利已獲授權,NVIDIA最新發布的Dynamo系統也直接借鑒了Mooncake的核心組件。
時間撥回2020年,首屆奧林帕斯獎同樣被清華摘下。舒繼武教授團隊面對的是內存數據“掉電即失”的頑疾,他們提出持久性內存存儲系統構建方案,通過重新設計文件系統、索引結構與一致性協議,讓新型非易失內存既能像內存一樣字節尋址,又能像磁盤一樣斷電不丟。系統上線后,數據庫事務處理性能提升六倍,故障恢復時間從分鐘級縮短到秒級,一舉奪得百萬獎金。五年過去,該成果已規模化應用于多家云廠商的持久內存實例,成為業界構建高可靠、低延遲存儲的參考模板。
![]()
華為公司董事、ICT產品與解決方案總裁楊友桂在頒獎現場表示,奧林帕斯獎五年累計投入1.5億元,共吸引全球五百余位教授、兩千余名學者投身存儲基礎研究。他透露,2025年華為將基于Mooncake架構發布新一代AI存儲節點,預計2026年規模商用。中國計算機學會存儲專委會主任馮丹教授則認為,從“磁盤—內存—緩存”到“持久內存—近存計算”,存儲層級不斷擴張,清華團隊把“存儲”抽象為可彈性供給的“算力外圍”,完成了存儲與算力的第二次分離,為萬卡級大模型集群提供了新的擴展范式。
至此,清華大學在華為“奧林帕斯獎”賽事中已斬獲兩項最高獎、一項先鋒獎,繼續領跑全球高校。隨著AI進入大模型縱深階段,存儲與計算的協同創新仍將持續刷新產業想象,而清華人兩次把旗幟插上奧林帕斯山頂,也讓“中國方案”成為定義下一代數據底座的重要聲音。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.