![]()
![]()
真正的創新,不是把事情做得更快,而是把事情做得更“便宜、更穩定、更可復制”。
作者 | 思嶺
一、一個判斷
剛剛的CES 2026上,黃仁勛帶著Vera Rubin超算架構向全世界走來!Rubin的推理性能比Blackwell提升了5倍,訓練性能提升3.5倍,成本降低10倍
但是,Vera Rubin,不是一代芯片,而是一種“算力生產方式”的升級如果你只把Vera Rubin 看成“Blackwell 的 5 倍性能版”,那你低估了它。
Vera Rubin真正做的事情只有一句話:
把 AI 算力,從“昂貴的科研資源”,變成“可以工業化生產的基礎設施”。
這和當年從蒸汽機到電力的躍遷,本質是同一件事。
二、為什么 Blackwell 不夠了?
我們先回到一個基本問題:
今天的AI,卡在了哪里?
答案不是模型,也不是算法,而是——系統規模化。
萬億參數模型→ 不是“單卡更強”,而是多卡協同更高效
Agentic AI、長上下文 → 不是“算得更快”,而是存得住、調得動
企業級部署→ 不是“性能峰值”,而是單位Token成本
Blackwell 解決了單卡極限問題,而 Rubin 解決的是——系統工程問題。
這,是一次典型的“范式轉移”。
三、Vera Rubin 的技術原理
不再堆卡,而是把數據中心設計成一臺計算機
Blackwell 像一輛性能炸裂的超跑;
Rubin,則是把整個高速公路系統重新設計了一遍。
它的關鍵創新,不在某一顆芯片,而在整體架構的協同設計。
可以把Rubin的技術拆成四個層面看。
1??算力層:NVFP4 +第三代Transformer Engine
Rubin GPU 的核心,是NVFP4精度體系。
它不是簡單“更低精度”,而是:
逐層分析Transformer計算特性
動態調整精度、路徑和算子
結果是:
推理性能:5倍
單 Token 成本:1/10
MoE 訓練 GPU 數量:減少到1/4
這是一種算法-硬件共設計(Co-design)的典型范式。
2??調度層:Vera CPU的戰略意義
很多人忽略了 Vera CPU。
但我認為,這是 Rubin 架構里最被低估的一步棋。
88 個自研 Olympus 核心
Armv9.2 全兼容
NVLink-C2C 高速直連 GPU
它解決的不是“算力”,而是——GPU等數據的空轉浪費
在 Agentic AI 時代,調度效率=真實算力。
3??互聯與存儲:NVLink 6 + BlueField-4
AI 推理真正的瓶頸是什么?
不是算,是KV Cache和上下文。
Rubin 用了一個極聰明的做法:
在 GPU 內存和傳統存儲之間,創造“第三層上下文內存”。
由 BlueField-4 DPU 統一管理。
結果是:
推理吞吐提升5倍
72 GPU 像一個超級GPU協同
推理成本直接降到1/7
這一步,才是“工業化”的關鍵。
72 GPU → 一個 NVL72
8 個 NVL72 → 一個 SuperPOD
數千 Agent、百萬 Token 上下文 → 開箱即用
英偉達不再賣“零件”,而是賣“工廠”。
四、從知識產權角度看,英偉達做對了什么?
1??芯片專利升級為系統專利
Rubin 的護城河,不是某一項發明,而是:
GPU 微架構
精度體系
CPU-GPU 協同
互聯協議
DPU 調度
機架級封裝
這是專利組合拳(Patent Thicket)。
你繞過一項,繞不過系統。
2??軟硬一體,鎖死可替代性
NVFP4 精度標準
NVLink 私有互聯
BlueField 數據路徑
Omniverse / Cosmos / Isaac 軟件棧
即使硬件被模仿,生態無法復制。
這是典型的:
以架構為核心的知識產權戰略
3??開源,不是放棄IP,而是定義標準
Cosmos、GR00T、AlphaMayo 全家桶開源,表面看是“開放”。
但本質是:
定義物理 AI 的數據格式
定義仿真的世界模型范式
定義訓練-推理-仿真的三計算機體系
誰掌握標準,誰掌握未來的許可權。
五、Vera Rubin 上市后,對 AI 產業意味著什么?
判斷一:
“算力焦慮”將從技術問題,變成工程問題
萬億模型→ 不再是“燒錢競賽”
企業級 AI → 成本首次可預測
長上下文、Agent → 真正跑得起來
AI從科研,走向產業。
判斷二:
云廠商與模型公司,將進一步“綁定”英偉達
AWS、Azure、Google Cloud、OpenAI、Meta 首批部署 Rubin。
這意味著:
下一代 GPT / Gemini / Claude
底層假設:Rubin級系統存在
這會形成新的路徑依賴。
判斷三:
物理AI,將成為下一個十年的主戰場
AlphaMayo、Cosmos、Isaac GR00T 不是“自動駕駛 demo”。
它們代表的是:
AI 從“理解文本”,走向“理解世界”。
機器人、汽車、工廠、醫療設備,都會被重構。
六、給知產人和企業的三點建議
最后,說點IP人“能用的”。
建議一:
別只盯“模型專利”,要盯“系統協同專利”
未來的高價值專利,一定是:
算法× 架構 × 調度 × 數據流
單點創新,越來越難防守。
建議二:
提前布局“推理側”與“上下文管理”
訓練專利紅利期正在過去,
推理效率、成本、隱私計算,才是下一個金礦。
建議三:
關注“標準型開源”的隱性IP價值
不是所有開源,都是放棄控制。
有些開源,是為了:
讓全世界,按你的方式思考問題。
結 語
真正的創新,不是把事情做得更快,而是把事情做得更“便宜、更穩定、更可復制”。
Vera Rubin 做到的,正是這件事。
當算力像電一樣被生產出來,一個由物理 AI 驅動的新世界,已經不可逆地開始了。
而英偉達,正在用系統級創新與知識產權,
站在這個世界的“總開關”旁邊。
——這,才是Vera Rubin真正的意義。
(本文僅代表作者觀點,不代表知產力立場)
封面來源 | AI
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.