NVIDIA DGX Rubin 系統整合了 NVIDIA 在計算、網絡和軟件領域的最新突破,將推理 token 成本降至 NVIDIA Blackwell 平臺的十分之一,可加速從推理和訓練到長上下文推理的任意 AI 工作負載。
![]()
在 CES 上,NVIDIA 推出了 Rubin 平臺,該平臺由六款全新芯片組成,旨在打造一臺超凡的 AI 超級計算機,專為加速代理式 AI、混合專家模型(MoE)以及長上下文推理而設計。
Rubin 平臺通過先進的協同設計方法,將六款芯片——NVIDIA Vera CPU、Rubin GPU、NVLink 6 交換機、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太網交換機——進行了有機整合,從而加速訓練過程并降低推理 token 生成成本。
不論是企業還是研究環境,DGX SuperPOD 都可作為部署基于 Rubin 系統的基礎架構設計參考方案。
NVIDIA DGX 平臺將從 NVIDIA 計算到網絡再到軟件的整個技術棧整合為一個統一協同的系統,消除了基礎設施集成的負擔,使團隊能夠專注于 AI 創新和業務成果。
NVIDIA 創始人兼首席執行官黃仁勛表示:“當前訓練和推理的 AI 計算需求不斷飆升,Rubin 的問世恰逢其時。”
基于 Rubin 的 DGX SuperPOD 部署將集成:
- NVIDIA DGX Vera Rubin NVL72 或 DGX Rubin NVL8 系統
- NVIDIA BlueField-4 DPU,用于構建安全、軟件定義的基礎設施
- NVIDIA 推理上下文記憶存儲平臺,支持下一代推理工作負載
- NVIDIA ConnectX-9 SuperNIC
- NVIDIA Quantum-X800 InfiniBand 與 NVIDIA Spectrum-X 以太網
- NVIDIA Mission Control,用于 AI 基礎設施的自動化編排與運維
DGX SuperPOD 長期以來一直是大型 AI 基礎設施的藍圖。Rubin 平臺的問世將成為新一代 AI 工廠的起點——這些系統旨在實現跨數千步推理,并以顯著降低的成本交付智能,助力企業構建下一代尖端模型、多模態系統和代理式 AI 應用。
以上為摘要內容,點擊鏈接閱讀完整內容:NVIDIA DGX SuperPOD 為基于 Rubin 的系統奠定基礎 | NVIDIA 英偉達博客
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.