近日,天翼云基礎架構事業部(操作系統技術部)智算網絡創新實驗室取得重要突破:以第一單位身份完成的兩篇智算網絡基礎設施論文,同登計算機網絡領域國際頂級會議IEEE INFOCOM 2026。這是天翼云在智算網絡領域的研究成果首次獲得中國計算機學會(CCF)A類頂級會議權威背書。研究成果已在多個生產集群中穩定運行,有效支撐了AI訓練、超算仿真等對“超低時延、超高帶寬”有嚴苛需求的業務場景,構建了“自研技術—解決業務痛點—規模商用落地—凝練學術成果”的完整閉環,成功實現了從產業實踐到學術前沿的雙向跨越。
IEEE INFOCOM作為全球通信與網絡領域的標志性頂會,長期位列CCF-A類會議榜單,代表著所屬細分領域的全球最高學術水準。其評審體系兼具嚴苛性與專業性,既聚焦理論創新的前沿性,更強調成果的項目可行性與產業影響力,在學界與業界均享有廣泛且高度的認可。
本次INFOCOM的評選競爭尤為激烈。《SF-STACK: Streamlining RDMA for Heterogeneous Telecom Storage》與《Budget-Constrained Federated Bandits for Mobile Applications》從千余份高質量投稿中脫穎而出,成功入選,不僅是國際學術界對天翼云技術創新能力的權威認證,更印證了天翼云紫金智算網絡研究“源于實踐、解決真問題”的務實基因——研究直面電信級業務場景的真實挑戰,相關成果均歷經大規模生產環境的檢驗與錘煉。
自研落地:SF-STACK超融合協議棧,從“行業難題”到“規模商用”的突破
《SF-STACK: Streamlining RDMA for Heterogeneous Telecom Storage》的核心成果——自研SF-STACK超融合協議棧,是天翼云紫金智算網絡技術實力的集中體現。該成果的誕生,離不開天翼云對電信級存儲集群的深度洞察:當前智算分布式存儲場景中,網絡配置異構、管理權限分散等問題,已成為高性能網絡(RDMA、遠程直接內存訪問)技術規模化部署的關鍵挑戰。
針對這一痛點,天翼云創新性地將內核態TCP、用戶態TCP與RDMA協議深度融合,從根本上解決了傳統全連接拓撲“連接爆炸”等問題。SF-STACK經過三年生產環境驗證,已應用于紫金DPU云主機、天翼云智算HPFS高性能文件存儲、XSSD超高性能云硬盤等核心產品中。實測數據顯示,SF-STACK部署后,存儲業務IO訪問性能相比傳統TCP/IP協議棧提升100%,端到端網絡時延降低60%。系統同時可穩定支持高達20萬可靠連接,為開放異構的算力場景,提供了高吞吐、高并發、低時延的核心技術保障。
該論文在國際學術界首次系統梳理了電信級存儲服務的技術特征,并完整呈現了天翼云在異構環境中大規模部署RDMA的實戰經驗,涵蓋資源調度、成本控制與運維優化等關鍵環節,為全球行業提供了經過生產驗證的落地方案。
協同創新:不止于存儲智算網絡,跨域調度全面布局
《Budget-Constrained Federated Bandits for Mobile Applications》,則聚焦智算網絡跨域協同的核心痛點。針對分布式學習中“資源受限、數據隱私保護”的雙重需求,天翼云首次將帶預算約束的線性老虎機模型引入聯邦學習,提出高效算法FedUCBwK。
該算法通過統一策略更新閾值,在保障原始數據不泄露的前提下,實現了“收益最大化、開銷最小化”的平衡。從理論層面證明其通信與計算復雜度僅為對數級,真實數據集實驗中性能持續優于現有方法,為智算網絡中資源敏感型分布式任務(如邊緣AI調度、跨域協同訓練)提供了可證明、高可靠的算法支撐。
未來,天翼云將持續加強智算網絡基礎設施的自主研發,推動學術成果向產品競爭力的高效轉化,圍繞“技術堅實、落地可靠”構建天翼云紫金智算網絡高性能底座,為數字中國高質量發展貢獻國云力量。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.