![]()
2026年1月5日, 英偉達首席執行官黃仁勛正式發布該公司下一代AI數據中心平臺Vera Rubin,并表示該平臺已進入全面生產階段。Vera Rubin是Blackwell架構的繼任者,采用六款芯片的極端協同設計。
具體而言,Vera Rubin平臺由六款全新芯片組成,實現高度集成:
1、Vera CPU,基于ARM架構的Olympus核心,配備“空間多線程”技術,使每個線程享有單核完整吞吐量,等效于176核處理能力,搭配128GB GDDR7內存。
![]()
2、Rubin GPU,配備288GB HBM4內存,提供50 PFLOPS NVFP4推理性能(較Blackwell提升 5倍)和35 PFLOPS 訓練性能(提升3.5倍),晶體管數量僅增加1.6倍。
3、BlueField-4 DPU,負責卸載存儲和安全任務。
4、Spectrum-6光子以太網交換機和ConnectX-9 / Quantum-CX9 InfiniBand NIC,支持高達1.6 Tb/s 帶寬。
![]()
5、NVLink 6互聯,提供18TB/s高帶寬,實現芯片間無縫通信;NVL72 機架整體縱向擴展(scale-up)帶寬達 260 TB/s。
Vera Rubin的旗艦產品為Vera Rubin NVL72機架式系統,整合72個Rubin GPU和36 個 Vera CPU,提供高達3.6 EFLOPS 的NVFP4推理性能和 2.5 EFLOPS 的訓練性能,在某些工作負載下推理性能較Blackwell提升至5倍,每token成本降低可達10倍。
![]()
其中,Vera Rubin NVL72為旗艦型號,整合72個Rubin GPU和36個Vera CPU,提供高達3.6EFLOPS的NVFP4推理性能和2.5 EFLOPS的訓練性能。在某些工作負載下,推理性能較Blackwell提升5倍,每token成本降低可達10倍。
![]()
相比上一代,Vera Rubin NVL72系統采用全新機箱設計,實現完全無風扇、無管路、無電纜的 100% 液冷散熱。黃仁勛表示,該設計將安裝時間從Blackwell系統的2小時縮短至僅5分鐘,大幅提升部署效率。
![]()
英偉達強調,Vera Rubin在混合專家(MoE)模型訓練中,僅需 Blackwell四分之一的GPU數量即可達到相同速度;在推理階段,token 生成成本可降低至原有的十分之一。這得益于平臺對長上下文、多模態和代理式 AI 工作負載的優化,以及新一代RAS引擎的實時健康監測與主動維護功能。
![]()
總的來看,Vera Rubin平臺的發布標志著英偉達在AI數據中心領域再次實現革命性突破。通過CPU、GPU、DPU、高速網絡與液冷機箱的高效協同設計,它不僅實現了推理與訓練性能的數量級提升與成本大幅下降,更在能效、部署效率和系統可靠性上樹立了全新標準。
![]()
隨著2026年下半年量產交付的推進,Vera Rubin有望為下一代長上下文、多模態與代理式AI的規模化應用提供核心動力,進一步鞏固英偉達在加速計算生態中的引領地位。
小編將在第一時間分享更多相關最新動態和爆料,敬請關注。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.