SC25 | 加速計算和網(wǎng)絡(luò)推動 AI 時代的超級計算

2025-11-21 18:54:24　來源: NVIDIA英偉達(dá)中國

北京舉報

分享至

從 NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU，新一代網(wǎng)絡(luò)和量子技術(shù)實現(xiàn)了飛躍。在 SC25 上展示的加速系統(tǒng)突顯了全球超級計算和 AI 的進(jìn)展。

在 SC25（全球超級計算大會）上，NVIDIA 展示了在 NVIDIA BlueField DPU 及新一代網(wǎng)絡(luò)、量子計算、科學(xué)研究、AI 物理等領(lǐng)域的進(jìn)展。加速系統(tǒng)正推動 AI 超級計算的新篇章。

NVIDIA 加速計算業(yè)務(wù)副總裁兼總經(jīng)理 Ian Buck 在 SC25 上發(fā)表了特別演講。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛驚喜現(xiàn)身 St. Louis 活動現(xiàn)場，并向出席 SC25 的觀眾分享了 NVIDIA 最新的超級計算進(jìn)展。

黃仁勛還帶來了一份特別禮物，NVIDIA DGX Spark AI 超級計算機，這是迄今為止全球最小的超級計算機。

最新的 AI 物理開放模型系列 NVIDIA Apollo 正式發(fā)布：NVIDIA 在 SC25 上還推出了面向 AI 物理的開放模型系列 NVIDIA Apollo。該開放模型系列利用 AI 物理領(lǐng)域的最新成果，將神經(jīng)運算符、Transformer 和擴散技術(shù)等領(lǐng)先的機器學(xué)習(xí)架構(gòu)，與特定領(lǐng)域的知識相結(jié)合。Apollo 將提供用于訓(xùn)練、推理和基準(zhǔn)測試的預(yù)訓(xùn)練檢查點和參考工作流，使開發(fā)者根據(jù)其特定需求集成和自定義模型。

NVIDIA Warp 助力物理模擬：NVIDIA Warp 是一個專門構(gòu)建的開源 Python 框架，可將計算物理和 AI 的 GPU 加速提升高達(dá) 245 倍。NVIDIA Warp 為仿真、機器人和機器學(xué)習(xí)工作負(fù)載提供了一種結(jié)構(gòu)化方法，它結(jié)合了 Python 的易用性以及與原生 CUDA 代碼相當(dāng)?shù)男阅堋?/li>

NVIDIA BlueField-4 DPU：驅(qū)動 AI 工廠操作系統(tǒng)的處理器

展示為 AI 工廠操作系統(tǒng)賦能的 NVIDIA BlueField-4：在 GTC 華盛頓特區(qū)上亮相的 NVIDIA BlueField-4 DPU 正在為 AI 工廠操作系統(tǒng)賦能。NVIDIA BlueField-4 集成了 64 核 NVIDIA Grace CPU 和 NVIDIA ConnectX-9，大幅提升了性能效率和零信任安全性。通過卸載、加速和隔離網(wǎng)絡(luò)、存儲和安全等關(guān)鍵的數(shù)據(jù)中心功能，NVIDIA BlueField-4 DPU 可以釋放 CPU 和 GPU，使其完全專注于計算密集型工作負(fù)載。

NVIDIA ConnectX-9 SuperNIC

NVIDIA CPO（光電一體化封裝）技術(shù)，提高速度和可靠性：NVIDIA Quantum-X Photonics 網(wǎng)絡(luò)交換機能夠大幅降低 AI 工廠和超級計算中心的能耗和運營成本。NVIDIA 已經(jīng)實現(xiàn)了融合電路和光通信一體的大規(guī)模部署。NVIDIA Quantum-X Photonics 平臺包括 NVIDIA Quantum Q3450 CPO InfiniBand 交換機和 ConnectX-8 SuperNIC，專為需要顯著降低功耗、提高可靠性和降低延遲的高性能環(huán)境而設(shè)計。

全球超級計算中心采用 NVQLink：全球十余個頂尖科學(xué)計算中心正在采用 NVQLink，這是一種連接加速計算和量子處理器的通用互連技術(shù)。借助 NVQLink，科學(xué)家和開發(fā)者在量子硬件和經(jīng)典硬件之間架起了通用橋梁，使可擴展的糾錯、混合應(yīng)用和實時量子 GPU 工作流變得切實可行。

開發(fā)現(xiàn)實世界的混合應(yīng)用：NVQLink 將量子處理器與 GPU 超級計算相結(jié)合，實現(xiàn)可擴展的糾錯和混合應(yīng)用。科學(xué)家可以通過 CUDA-Q API 獲得統(tǒng)一的編程環(huán)境。開發(fā)者可以實時構(gòu)建和測試量子-GPU 工作流。借助 NVQLink，全球超級計算中心正在為實用的量子經(jīng)典系統(tǒng)奠定基礎(chǔ)，以前所未有的速度和規(guī)模將不同的量子處理器與 NVIDIA 加速計算單元相連接。

Arm 采用 NVIDIA NVLink Fusion：AI 正在重塑數(shù)據(jù)中心，每瓦效率成為衡量成功的關(guān)鍵。核心驅(qū)動力是 Arm Neoverse，其部署核心數(shù)已超過 10 億。為了滿足激增的需求，Arm 正在通過 NVIDIA NVLink Fusion 擴展 Neoverse。Arm 和 NVIDIA 共同為 AI 基礎(chǔ)設(shè)施設(shè)定了新標(biāo)準(zhǔn)，使生態(tài)系統(tǒng)合作伙伴能夠構(gòu)建差異化、高能效的系統(tǒng)，加速整個 AI 時代的創(chuàng)新。

為加速計算提供更智能的動力：隨著 AI 工廠規(guī)模的擴大，能源成為新的瓶頸。NVIDIA Domain Power Service（DPS）將這一限制轉(zhuǎn)化為機會，將電力轉(zhuǎn)化為一種動態(tài)、可協(xié)調(diào)的資源。DPS 與用于設(shè)計和運營新一代數(shù)據(jù)中心的平臺 NVIDIA Omniverse DSX Blueprint 緊密集成。

NVIDIA 與 CoreWeave 獲得 Graph500 BFS 基準(zhǔn)測試冠軍，性能較此前紀(jì)錄提升翻倍：NVIDIA 在第 30 期 Graph500 寬度優(yōu)先搜索（BFS）榜單中獲得第一名，使用部署在 CoreWeave 達(dá)拉斯數(shù)據(jù)中心的 8192 塊 NVIDIA Hopper GPU，取得了每秒遍歷 410 萬億條邊（TEPS）的成績，性能較此前最優(yōu)紀(jì)錄提升超兩倍。

以上為摘要內(nèi)容，點擊下方鏈接閱讀完整內(nèi)容：

加速計算和網(wǎng)絡(luò)推動 AI 時代的超級計算 | NVIDIA 英偉達(dá)博客

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.