CES 2026的特別演講中不能沒有NVIDIA黃仁勛,在正式開展前夕,NVIDIA創始人兼CEO黃仁勛用物理AI的故事主線描述了下一代AI的可能性。與此同時,Vera Rubin這位暗物質研究先驅、天文學家,也終于隨著NVIDIA下一代CPU和GPU正式發布被更多人所記住。
![]()
下一代AI計算平臺Vera Rubin不僅僅是算力的再度提升,也將全面覆蓋更多商用領域,包括自動駕駛、機器人、醫療、通用AI。2.5噸的Vera Rubin NVL72出現在老黃背后那一刻,一場高度協同設計、徹底淘汰傳統水冷模組的最前沿AI解決方案,被提上議程。
![]()
Blackwell到Vera Rubin:6顆芯片一次更換
黃仁勛上來就給了一個大招,Blackwell的解決方案已經走到了傳統計算基礎設施的盡頭,就換而言之,過去十年投下去的約10萬億美元傳統計算基礎設施,必須被加速計算與AI重做一遍,否則無法支撐每年10倍模型體量和5倍生成內容的增長速度。
![]()
因此Vera Rubin的升級是一整套解決方案,包括雙芯片封裝的Rubin GPU,ARM v9 144核的Vera CPU。這樣的前提下,需要BlueField-4 DPU外掛16TB的KV-Cache,以及NVLink Switch 7提供1.8TB/s的傳輸總線,2個1.6Tbps的光收發芯片,一組效率高達94%的DC/DC電源模組,主打一個猛上加猛,一整套解決方案安裝到整機也冷的NVL72機組上,重量達到2.5噸。
![]()
![]()
重歸重,帶來的性能飛躍也是非常直接的。相比上一代Blackwell,Rubin的NVFP4推理性能提升5倍,訓練性能提升3.5倍,HBM4內存帶寬提升2.8倍,NVLink互連帶寬翻倍,生成token成本降至現在的1/10。
![]()
![]()
![]()
例如運行相同70B參數MoE模型的時候,Blackwell生成2048 token需要1.8秒,彈道了Rubin僅需要0.35秒,并且能耗降低60%。
另外,在BlueField-4 DPU的加持下,KV-Cache可以幫助GPU顯存卸載到機架共享的內存池上,每顆GPU都可以額外擴展16TB高速內存,從而實現近乎無限的長對話、長視頻理解。
![]()
![]()
新硬件搭配全新的NVFP4下還能更進一步,NVFP4可以保持>99.2%精度的前提下,把每次推理的位寬砍半,同時顯存帶寬需求減半,進而實現成本降到上一代1/10。黃仁勛在演講上表示,模型大小年增長10倍,生成內容年增長5倍,而用戶愿意為每token支付的費用年降10倍,因此只有靠全棧協同設計才能活下去。
![]()
目前Vera Rubin已經在臺積電N3產線流片,計劃在2026Q2規模出貨,戴爾、HPE、聯想、Supermicro等OEM會在2026年下半年開始整機交付,從而啟動新一輪的AI算力迭代。
![]()
物理AI近在咫尺
AI加速的意義已經在現實中被得以展現,當2個BDXdroids走上演講臺就是最直接的證明。現在的AI已經跑通了從虛擬到物理、再由物理回饋虛擬AI的閉環,通過訓練、仿真、部署的路徑加速物理AI的可行性。
![]()
![]()
![]()
而這整個過程也已經由NVIDIA跑通,先使用DGX進行訓練,然后通過Omniverse、Cosmos在孿生世界進行仿真,最后通過AGX、Orin展開機器人部署,一氣呵成。
![]()
更重要的是,NVIDIA在現場宣布三大物理AI支柱已經開源,Cosmos World基礎模型可以完成視頻到動作的聯合訓練,GROOT 1.6人形機器人推理模型提供32自由度協調,Isaac Lab Arena仿真安全測試框架包含了50萬條機器人軌跡基準。這套為了賣更多GPU而打造免費軟件生態的形式在GeForce消費端屢試不爽,大多數時候NVIDIA提供的軟件生態不僅免費,用起來還挺高效,很快就會讓人欲罷不能。
![]()
![]()
物理AI當然不會僅限制在機器人。黃仁勛在現場正式發布了自動駕駛智能體Alpamayo,這是一個會思考的自動駕駛,現場的DEMO視頻演示了一段搭載Alpamayo的自動駕駛系統由馳騁在舊金山,從傍晚的夕陽落日到華燈初上,這套自動駕駛系統很好的規避了所有可能出現的意外狀況,并且一邊開車一邊用自然語言解釋駕駛邏輯,比如前方施工時,如何做出一個類似人類的自然判斷,進而給出合理解決方案。
![]()
![]()
![]()
在發布Alpamayo的同時,NVIDIA也同步宣布Alpamayo R1模型開源,提供權重、數據集、訓練腳本、CarSim/CarMaker接口,2025款梅賽德斯奔馳CLA已經展開測試,并將在北美地展開OTA推送。
![]()
![]()
在Alpamayo R1開源的同時,NVIDIA還放出了多個開源模型,包括蛋白質復合體結構預測的OpenFold3,多蛋白相互作用生成預測的Evolve2,兩公里內的氣象模擬模型Eath-2,12小時化學污染擴散模型ForecastNet-Chem。10T token多模態開源數據集中包含了45.5萬蛋白質結構、100TB車載傳感器數據,鼓勵學術機構自由下載。
![]()
AI生態的開源進階時
黃仁勛在現場強烈表揚了AI的開源生態。在2024年,開源AI落后閉源AI有18個月的差距,在2026年的現在,這個差距只剩6個月,來自中國的DeepSeek-R1、Qwen2.5、Kimi k1.5為開源AI創造出了無數可能。
![]()
當開源與閉源無限接近,黃仁勛表示,任何企業和個人都有機會推動AI從語言理解的拐點,轉向理解物理的拐點,NVIDIA也將從數據中心AI公司,變成物理世界AI基礎設施的公司。
![]()
![]()
無論如何,NVIDIA都在扮演制造工具的角色,從最初制造游戲運行的工具,到現在制造AI加速的工具,推動一個生態往更廣闊的領域發展。有意思的是,在近幾十年中,AI概念被嘗試和熱捧了數次,而只有這一次AI的火把終于被完全點燃,成功從虛擬世界走向現實的物理世界,成為人類文明進程中的一個全新注腳,這一刻的星光閃耀時,無論是NVIDIA還是無數研究AI領域的工作者們,都值得稱贊。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.