近日,NVIDIA宣布其AI與高性能計算領域明星產品Blackwell GPU的升級版本——Blackwell Ultra,也就是B300和GB300,預計將于今年晚些時候推出。緊接著,將迎來全新的“Rubin”GPU。其中,GB300 GPU作為首次支持PCIe 6.0的GPU,將帶來高達50%的性能提升,同時功耗高達1400W。
![]()
Blackwell Ultra采用臺積電4NP工藝制造,擁有2080億個晶體管,采用兩個Die通過NV-HBI高速界面互連(帶寬10TB/s),配備了總計160個SM單元(每個包含128個CUDA核心)和640個第五代Tensor核心,共享完全一致性的二級緩存。GPU間通過1.8TB/s帶寬的第五代NVLink互連,而GPU與CPU之間的NVLink-C2C通道帶寬為900GB/s,這些技術特點與前代產品保持一致。
Blackwell Ultra的亮點之一是首次支持PCIe 6.0,這將使可用帶寬直接翻倍,同時HBM3E內存容量從192GB增加到288GB(帶寬8TB/s)。不過,這一升級也帶來了功耗的增加,最大功耗達到了1400W。
性能方面,Blackwell Ultra的NVFP4 dense稠密性能提升了50%,達到了15PFlops,而sparse稀疏性能保持在20PFlops。此外,SFU(特殊功能單元)EX2下的注意力加速能力也從5TF/s提升至10.7TF/s,翻了一番還多。FP8、FP16、TF16等數據格式的性能則基本沒有變化。
Blackwell Ultra的主要部署形態將是GB300 NV72服務器,采用液冷機架,每個節點包含兩顆B300 GPU和一顆Grace GPU。這一升級版的推出,將為AI和HPC領域帶來更加高效和強大的計算能力。
PCIe 6.0加速來了
PCIe 不僅僅是一個物理插槽標準。總線的主力是拓撲。PCIe 用于連接內置外設、筆記本電腦和迷你 PC 的附加卡以及 SSD 存儲。Mini PCIe 使用相同的拓撲、編碼和規格,并且與常規 PCIe 電氣兼容。現在常見的M.2 SSD接口也采用PCIe拓撲。
PCIe 的串行數據路徑使用單向差分對來提高信號完整性。雖然這些線對需要進行長度匹配才能消除偏斜,但每對的兩條跡線比 8、16 或 32 條跡線更容易處理。
![]()
差分信號走線的去偏技術
高速并行總線也可能受到串擾的影響,串擾是一種從一條走線到另一條走線的信號泄漏。這會導致數據損壞并限制帶寬。差分配對信號可消除大部分串擾并提供更清晰的信號。
PCIe 差分對的優勢
PCIe的單向差分對由四根走線組成,作為每個方向的差分對。每組四個連接稱為一個通道,PCIe 插槽可支持 1 到 16 個通道。用于連接兩個 PCIe 設備的通道組稱為互連或鏈路。現代圖形加速器通常使用 16 通道插槽,有些需要兩個插槽和額外的電源連接。
差分對布置可加快傳輸速度并提高可靠性。在 PCIe 版本 1.0 和 2.0 中,數據以帶有兩個開銷位的 8 位字傳輸,稱為 8b/10b 編碼。這意味著 20% 的傳輸比特是開銷,而不是數據。PCI 3.0 將這一數字提升至 128b/130b 編碼,產生 98.5% 的數據率和 1.5% 的開銷。這種編碼從 PCIe 1.0 到 5.0 一直保留,表示具有不歸零(NRZ) 格式的二進制數據。
PCIe 1.0 至 6.0:傳輸速度加倍
PCIe 1.0 每通道傳輸速度高達 2.5 GB/s,16 通道互連時最高傳輸速度為 4 GB/s。隨著協議和芯片制造能力的改進,PCIe 2.0 使這一數字翻了一番。PCIe 3.0 從 8b/10b 提升到 128b/130b,速度幾乎翻倍至每通道 8 GB/s。此后的每個新版本的數據速率都增加了一倍。2022 年推出的 PCIe 6.0 在編碼和協議方面帶來了重大變化,將速度提升至 64 GB/s。PCIe 6.0 從 NRZ 數據格式更改為脈沖幅度調制 4 級(PAM4) 信令。PAM 表示與 NRZ 中的一位相同單位間隔中的兩位,它給出四個值而不是兩個。這有效地用兩位值替換了二進制位。PAM4 的錯誤率要高得多,因此需要高級糾錯。
在Blackwell Ultra之前,PCIe 6.0更多是停留在標準制定、控制器發布和早期企業級應用的階段。Blackwell Ultra這樣的頂級GPU作為消費市場和數據中心市場的“風向標”,其采用PCIe 6.0將產生強大的拉動效應,迫使整個產業鏈迅速跟進和成熟。其意義遠不止于“一次接口升級”。它更像是一個 “點火器”:
1. 對產業:它強力推動了PCIe 6.0生態的成熟,迫使CPU、主板、連接器等上下游廠商全面跟進,開啟了新一輪的硬件更新周期。
2. 對技術:它為數據中心和高端工作站的異構計算、高速互聯提供了關鍵的基礎設施,解決了未來AI和計算密集型應用的潛在I/O瓶頸。
3. 對用戶:短期內是“戰未來”的特性,為未來的游戲和應用預留了巨大的帶寬空間;長期來看,它將像之前的每一次PCIe升級一樣,最終成為所有PC的基石, enabling下一代計算體驗。
簡單來說,Blackwell Ultra和PCIe 6.0的結合,不是為了解決今天的問題,而是為了構建明天的基礎。
平臺已經舉辦的高速銅纜供應鏈會議一覽表
線束行業參考學習資訊
更多關于最新的線纜行業發展訊息,請關注我們的微信公眾號!我們將第一時間搜尋到行業前沿訊息和您一起分享!不做盈利用途,文中觀點都是基于公開數據及信息,僅供交流,不構成投資建議!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.