中文互聯網上關于Deepseek使用UE8M0 Scale數據格式的討論,還引發國產芯片漲停潮,實在是好笑。
![]()
上面這張圖來自英偉達Blackwell芯片的官方文檔,引入了MXFP8的數據格式,使用了E8M0作為縮放因子。這完全就是B200芯片的特性。你能拿英偉達定義的數據格式顛覆英偉達嗎?
所以說,全網爆火的DeepSeek UE8M0 FP8 ,其實英偉達早已支持。

NVIDIA PTX ISA(并行線程執行,PTX 指令集)文檔里面早就已經出現了 .ue8m0這個數據類型

地址:
https://docs.nvidia.com/cuda/parallel-thread-execution/#mma-scaling-kind-type-valid-combination
UE8M0 fp8并不是 DeepSeek 獨創
至少從 PTX 8.0/9.0(對應 Hopper/Ada 架構 GPU)開始,NVIDIA 已經在 ISA 級別支持 .ue8m0
它就是 NVIDIA 官方 scale 數據格式之一,用在 FP8/FP4混合精度量化的場景
NVIDIA Hopper 架構 (H100系列)
H100 GPU(2022年發布),面向數據中心和 AI 訓練/推理,是 首個官方支持 FP8 (E4M3 / E5M2) 混合精度 的 GPU 架構,在 PTX 指令里引入了 .ue8m0作為 scale data type。
NVIDIA Ada Lovelace 架構 (RTX 40系列)
RTX 4090 / 4080 / 4070等消費級顯卡(2022年底發布),面向游戲和 AI 推理。同樣在底層指令集里繼承了 .ue8m0、E4M3/E5M2的支持。
也就是說技術上:UE8M0已經在 NVIDIA 硬件生態存在

因此個人覺得DeepSeek 這句話應該這么理解
這相當于DeepSeek V3.1把原本只在硬件/內核實現層面存在的 scale 表達方式,提升到模型部署和訓練標準,適配了國產下一代芯片
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.