IT之家 1 月 2 日消息,Signal65 最新發(fā)布 SemiAnalysis InferenceMAX 基準測試分析報告,在 Deepseek-R1 0528 混合專家(MoE)模型推理場景中,英偉達(NVIDIA)Blackwell GB200 NVL72 機架系統(tǒng)性能遠超 AMD 的 Instinct MI355X。
IT之家注:混合專家模型是一種高效的 AI 模型架構(gòu),典型代表之一就是 Deepseek-R1 0528,成為諸多基準測試常用的模型。
![]()
圖源:Signal65
它不像傳統(tǒng)模型那樣每次任務(wù)都動用整個大腦,而是擁有一群“專家”,每次只根據(jù)問題類型激活最懂行的那幾個“專家”來處理,但大規(guī)模擴展時會引發(fā)節(jié)點間巨大的通信延遲和帶寬壓力,形成計算瓶頸。
英偉達為此采用了“極致協(xié)同設(shè)計”(Extreme Co-Design)策略。GB200 NVL72 通過緊密互聯(lián) 72 顆芯片,并配備 30TB 的高速共享內(nèi)存,極大地優(yōu)化了全對全(all-to-all)通信效率,有效解決了數(shù)據(jù)傳輸延遲問題。
![]()
圖源:英偉達
測試數(shù)據(jù)顯示,在類似的集群配置下,英偉達方案每 GPU 的吞吐量高達 75 tokens / 秒,其性能達到了 AMD Instinct MI355X 的 28 倍。
對于超大規(guī)模云計算廠商(Hyperscalers)而言,總體擁有成本(TCO)是核心考量指標。Signal65 結(jié)合 Oracle 云定價數(shù)據(jù)分析指出,GB200 NVL72 機架不僅性能強悍,經(jīng)濟性同樣驚人。其每 token 的相對成本僅為 AMD 方案的十五分之一,同時還提供了更高的交互速率。
![]()
圖源:Signal65
盡管英偉達在 MoE 領(lǐng)域占據(jù)統(tǒng)治地位,但這并不代表 AMD 已全面落敗。報告指出,AMD 的 MI355X 憑借高容量 HBM3e 內(nèi)存,在稠密模型(Dense Models)環(huán)境中仍是極具侵略性的選項。
該媒體指出 AMD 目前尚未推出新一代機架級解決方案來應(yīng)對 NVL72 的挑戰(zhàn)。不過,隨著未來 AMD Helios 平臺與英偉達 Vera Rubin 平臺的對決臨近,雙方在機架級擴展方案上的競爭將愈發(fā)激烈。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.