從 NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代網絡和量子技術實現了飛躍。在 SC25 上展示的加速系統突顯了全球超級計算和 AI 的進展。
![]()
在 SC25(全球超級計算大會)上,NVIDIA 展示了在 NVIDIA BlueField DPU 及新一代網絡、量子計算、科學研究、AI 物理等領域的進展。加速系統正推動 AI 超級計算的新篇章。
![]()
NVIDIA 加速計算業務副總裁兼總經理 Ian Buck 在 SC25 上發表了特別演講。
NVIDIA 創始人兼首席執行官黃仁勛驚喜現身 St. Louis 活動現場,并向出席 SC25 的觀眾分享了 NVIDIA 最新的超級計算進展。
![]()
黃仁勛還帶來了一份特別禮物,NVIDIA DGX Spark AI 超級計算機,這是迄今為止全球最小的超級計算機。
![]()
- 最新的 AI 物理開放模型系列 NVIDIA Apollo 正式發布:NVIDIA 在 SC25 上還推出了面向 AI 物理的開放模型系列 NVIDIA Apollo。該開放模型系列利用 AI 物理領域的最新成果,將神經運算符、Transformer 和擴散技術等領先的機器學習架構,與特定領域的知識相結合。Apollo 將提供用于訓練、推理和基準測試的預訓練檢查點和參考工作流,使開發者根據其特定需求集成和自定義模型。
![]()
- NVIDIA Warp 助力物理模擬:NVIDIA Warp 是一個專門構建的開源 Python 框架,可將計算物理和 AI 的 GPU 加速提升高達 245 倍。NVIDIA Warp 為仿真、機器人和機器學習工作負載提供了一種結構化方法,它結合了 Python 的易用性以及與原生 CUDA 代碼相當的性能。
![]()
NVIDIA BlueField-4 DPU: 驅動 AI 工廠操作系統的處理器
- 展示為 AI 工廠操作系統賦能的 NVIDIA BlueField-4:在 GTC 華盛頓特區上亮相的 NVIDIA BlueField-4 DPU 正在為 AI 工廠操作系統賦能。NVIDIA BlueField-4 集成了 64 核 NVIDIA Grace CPU 和 NVIDIA ConnectX-9,大幅提升了性能效率和零信任安全性。通過卸載、加速和隔離網絡、存儲和安全等關鍵的數據中心功能,NVIDIA BlueField-4 DPU 可以釋放 CPU 和 GPU,使其完全專注于計算密集型工作負載。
![]()
NVIDIA ConnectX-9 SuperNIC
- NVIDIA CPO(光電一體化封裝)技術,提高速度和可靠性:NVIDIA Quantum-X Photonics 網絡交換機能夠大幅降低 AI 工廠和超級計算中心的能耗和運營成本。NVIDIA 已經實現了融合電路和光通信一體的大規模部署。NVIDIA Quantum-X Photonics 平臺包括 NVIDIA Quantum Q3450 CPO InfiniBand 交換機和 ConnectX-8 SuperNIC,專為需要顯著降低功耗、提高可靠性和降低延遲的高性能環境而設計。
- 全球超級計算中心采用 NVQLink:全球十余個頂尖科學計算中心正在采用 NVQLink,這是一種連接加速計算和量子處理器的通用互連技術。借助 NVQLink,科學家和開發者在量子硬件和經典硬件之間架起了通用橋梁,使可擴展的糾錯、混合應用和實時量子 GPU 工作流變得切實可行。
![]()
- 開發現實世界的混合應用:NVQLink 將量子處理器與 GPU 超級計算相結合,實現可擴展的糾錯和混合應用。科學家可以通過 CUDA-Q API 獲得統一的編程環境。開發者可以實時構建和測試量子-GPU 工作流。借助 NVQLink,全球超級計算中心正在為實用的量子經典系統奠定基礎,以前所未有的速度和規模將不同的量子處理器與 NVIDIA 加速計算單元相連接。
- Arm 采用 NVIDIA NVLink Fusion:AI 正在重塑數據中心,每瓦效率成為衡量成功的關鍵。核心驅動力是 Arm Neoverse,其部署核心數已超過 10 億。為了滿足激增的需求,Arm 正在通過 NVIDIA NVLink Fusion 擴展 Neoverse。Arm 和 NVIDIA 共同為 AI 基礎設施設定了新標準,使生態系統合作伙伴能夠構建差異化、高能效的系統,加速整個 AI 時代的創新。
- 為加速計算提供更智能的動力:隨著 AI 工廠規模的擴大,能源成為新的瓶頸。NVIDIA Domain Power Service(DPS)將這一限制轉化為機會,將電力轉化為一種動態、可協調的資源。DPS 與用于設計和運營新一代數據中心的平臺 NVIDIA Omniverse DSX Blueprint 緊密集成。
- NVIDIA 與 CoreWeave 獲得 Graph500 BFS 基準測試冠軍,性能較此前紀錄提升翻倍:NVIDIA 在第 30 期 Graph500 寬度優先搜索(BFS)榜單中獲得第一名,使用部署在 CoreWeave 達拉斯數據中心的 8192 塊 NVIDIA Hopper GPU,取得了每秒遍歷 410 萬億條邊(TEPS)的成績,性能較此前最優紀錄提升超兩倍。
以上為摘要內容,點擊下方鏈接閱讀完整內容:
加速計算和網絡推動 AI 時代的超級計算 | NVIDIA 英偉達博客
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.