![]()
在2026年CES的聚光燈下,黃仁勛沒(méi)有僅僅談?wù)撔酒乃懔Γ敲枥L了一個(gè)即將被智能體深度融入的現(xiàn)實(shí)世界。
“AI的第二個(gè)拐點(diǎn)已經(jīng)到來(lái)——從理解語(yǔ)言到理解物理世界,從軟件智能體到具身智能體”。
當(dāng)?shù)貢r(shí)間1月5日,英偉達(dá)CEO黃仁勛身穿標(biāo)志性皮衣登臺(tái),圍繞“物理AI”展開了一場(chǎng)90分鐘的主題演講。
![]()
英偉達(dá)CEO黃仁勛
他指出,物理AI不僅涵蓋視覺與語(yǔ)言理解,更融合重力、摩擦、慣性等物理動(dòng)態(tài),能夠在真實(shí)世界中執(zhí)行復(fù)雜任務(wù),未來(lái)將重塑全球1000萬(wàn)家工廠與20萬(wàn)個(gè)倉(cāng)庫(kù)的運(yùn)作模式。
這一愿景背后,依托三大技術(shù)支撐:Newton物理引擎,實(shí)時(shí)計(jì)算物理世界模型,響應(yīng)時(shí)間低于0.01秒,適用于機(jī)器人及自動(dòng)駕駛場(chǎng)景;Cosmos基礎(chǔ)模型平臺(tái),支持多模態(tài)物理世界理解,已訓(xùn)練1000億參數(shù),推理延遲降至1毫秒;GPU+LPU混合算力架構(gòu),GPU負(fù)責(zé)訓(xùn)練,LPU專注低延遲推理,效率提升100倍,成本降低90%。
黃仁勛強(qiáng)調(diào):“AI的價(jià)值不再僅由算力決定,而由場(chǎng)景定義。物理世界正是AI最大的應(yīng)用場(chǎng)景。”
為此,英偉達(dá)將持續(xù)提供算力基石,并在自動(dòng)駕駛、機(jī)器人等領(lǐng)域推動(dòng)開源產(chǎn)品落地。黃仁勛指出,“開放模型已觸及前沿,雖然仍穩(wěn)固地落后前沿模型六個(gè)月,但每隔六個(gè)月,一個(gè)新的模型就會(huì)出現(xiàn)。英偉達(dá)不僅開源模型,還將開源訓(xùn)練數(shù)據(jù),讓開發(fā)者真正理解模型的構(gòu)建過(guò)程。”
01
Rubin架構(gòu)正式登場(chǎng),下半年量產(chǎn)
任何技術(shù)革命都離不開底層算力的支撐。“我們必須每年推動(dòng)計(jì)算技術(shù)向前進(jìn)步,一刻也不能延遲。”發(fā)布會(huì)上,黃仁勛正式發(fā)布了英偉達(dá)下一代AI數(shù)據(jù)中心機(jī)柜架構(gòu)——Vera Rubin。
該架構(gòu)命名致敬天文學(xué)家Vera Rubin,她在暗物質(zhì)研究領(lǐng)域取得了突破性進(jìn)展,其研究成果徹底改變了人類對(duì)宇宙的認(rèn)知。
![]()
而這,也是每一代英偉達(dá)GPU架構(gòu)的命名習(xí)慣。
黃仁勛此次披露了Rubin架構(gòu)的更多細(xì)節(jié):它由六類芯片構(gòu)成,包括Vera CPU、Rubin GPU、NVLink 6交換機(jī)、ConnectX-9 SuperNIC、BlueField-4數(shù)據(jù)處理單元和Spectrum-6以太網(wǎng)交換機(jī),共同組成Vera Rubin NVL72機(jī)架。
![]()
作為首款定制CPU+GPU協(xié)同設(shè)計(jì)的產(chǎn)品,采用臺(tái)積電2nm工藝,集成了Rubin GPU與專為智能體推理打造的Vera CPU,算力實(shí)現(xiàn)顯著躍升。
Rubin架構(gòu)包含3360億個(gè)晶體管,NVFP4數(shù)據(jù)類型下,Rubin GPU推理性能達(dá)到50 PFLOPS,是Blackwell GB200的5倍;NVFP4訓(xùn)練性能高達(dá)35 PFLOPS,是Blackwell的3.5倍。
![]()
為滿足龐大的計(jì)算資源需求,每款Rubin GPU都配備了8個(gè)HBM4顯存堆棧,提供288GB的容量和22 TB/s的帶寬。
與此同時(shí),隨著大型語(yǔ)言模型從激活所有參數(shù)以生成給定輸出詞元的密集架構(gòu),轉(zhuǎn)向每個(gè)詞元僅激活部分可用參數(shù)的專家混合(MoE)架構(gòu),這些模型的擴(kuò)展效率得以相對(duì)提高。然而,模型內(nèi)部專家之間的通信需要大量的節(jié)點(diǎn)間帶寬。
為此,Vera Rubin數(shù)據(jù)中心架構(gòu)引入了用于規(guī)模內(nèi)擴(kuò)展網(wǎng)絡(luò)的NVLink 6,將單GPU的互連帶寬提升至3.6 TB/s(雙向)。每顆NVLink 6交換芯片提供28 TB/s的帶寬,而每個(gè)Vera Rubin NVL72機(jī)架配備9顆這樣的交換芯片,總規(guī)模內(nèi)帶寬達(dá)到260 TB/s。
![]()
NVIDIAVera CPU集成了88個(gè)定制的Olympus Arm核心,采用“spatial multi-threading”(空間多線程)設(shè)計(jì),最多可同時(shí)運(yùn)行176個(gè)線程。用于將Vera CPU與Rubin GPU進(jìn)行一致性連接的NVLink C2C互連,其帶寬提升了一倍,達(dá)到1.8 TB/s。每顆Vera CPU可尋址最多1.5 TB的SOCAMM LPDDR5X內(nèi)存,內(nèi)存帶寬最高可達(dá)1.2 TB/s。
為了將Vera Rubin NVL72機(jī)架擴(kuò)展為每組包含八個(gè)機(jī)架的DGX SuperPod,英偉達(dá)推出了兩款采用Spectrum-6芯片的Spectrum-X以太網(wǎng)交換機(jī),每顆Spectrum-6芯片可提供102.4 Tb/s的帶寬,Nvidia將其應(yīng)用于兩款交換機(jī)中。
![]()
據(jù)黃仁勛介紹,每個(gè)Vera Rubin NVL72機(jī)架可提供3.6 exaFLOPS的NVFP4推理性能、2.5 exaFLOPS的NVFP4訓(xùn)練性能,連接至Vera CPU的54 TBLPDDR5X內(nèi)存,以及20.7 TB的HBM4內(nèi)存,帶寬達(dá)1.6 PB/s。
“與Blackwell相比,Vera Rubin在訓(xùn)練MoE模型時(shí)所需的GPU數(shù)量?jī)H為四分之一;在MoE推理場(chǎng)景下,其每token成本最高可降低10倍”。黃仁勛表示,Rubin能在相同機(jī)架空間內(nèi)大幅提升訓(xùn)練速度,并輸出更多token。
他透露,Rubin系列芯片已經(jīng)全面投產(chǎn),并將于今年下半年推出,重要應(yīng)用于物理AI訓(xùn)練、機(jī)器人模擬、自動(dòng)駕駛仿真等領(lǐng)域,其訂單規(guī)模已達(dá)3000億美元,微軟下一代Fairwater AI超級(jí)工廠、CoreWeave等將成為首批應(yīng)用者。
除了發(fā)布新產(chǎn)品,黃仁勛也公布了一些“老朋友”的進(jìn)展:Blackwell Ultra量產(chǎn)加速,2026年Q2全面供貨,單機(jī)算力提升50%的同時(shí)功耗降低30%,適配機(jī)器人邊緣計(jì)算場(chǎng)景。
02
從自動(dòng)駕駛到機(jī)器人,構(gòu)建開放技術(shù)棧
芯片是算力的基石,場(chǎng)景則是“物理AI”的價(jià)值所在。其中,自動(dòng)駕駛是核心落地場(chǎng)景之一。
在黃仁勛看來(lái),當(dāng)前輔助駕駛系統(tǒng)在應(yīng)對(duì)“長(zhǎng)尾場(chǎng)景”時(shí)仍面臨挑戰(zhàn)。傳統(tǒng)將感知與規(guī)劃分離的輔助駕駛架構(gòu),在突發(fā)或異常情況下存在泛化與可解釋性不足的問(wèn)題。
為此,英偉達(dá)發(fā)布首個(gè)專為自動(dòng)駕駛汽車設(shè)計(jì)的“推理”AI:Alpamayo,這是一個(gè)新系列的開放模型、模擬工具和數(shù)據(jù)集,專為基于推理的駕駛系統(tǒng)而設(shè)計(jì)。該系列引入基于思維鏈的VLA(Vision-Language-Action)推理模型,用于對(duì)復(fù)雜駕駛場(chǎng)景進(jìn)行逐步推演和邏輯表達(dá),以提升決策透明度。
![]()
Alpamayo系列包括三部分:
一是Alpamayo1,一款約100億參數(shù)規(guī)模的思維鏈推理模型,已在Hugging Face上開源,以使汽車能夠理解周圍環(huán)境并解釋其行動(dòng),用于研究、模型蒸餾及開發(fā)輔助工具。
二是AlpaSim,一套完全開源的端到端輔助駕駛仿真框架,已在GitHub發(fā)布,支持在多種環(huán)境和邊緣案例中進(jìn)行閉環(huán)訓(xùn)練和評(píng)估。
三是物理AI開放數(shù)據(jù)集,包含超過(guò)1700小時(shí)的真實(shí)道路駕駛數(shù)據(jù),覆蓋不同區(qū)域和環(huán)境條件,并包含一定比例的復(fù)雜和罕見場(chǎng)景。
這些工具共同構(gòu)成了一個(gè)自我強(qiáng)化的開發(fā)閉環(huán),助力構(gòu)建基于推理的自動(dòng)駕駛技術(shù)棧。
不過(guò),Alpamayo模型并非直接在車端運(yùn)行,而是作為大規(guī)模的“教師模型”。開發(fā)者可以對(duì)其進(jìn)行微調(diào)和蒸餾,轉(zhuǎn)化為各自完整自動(dòng)駕駛技術(shù)棧的核心骨架。黃仁勛指出,Alpamayo系列為一個(gè)內(nèi)聚的開放生態(tài)系統(tǒng),任何汽車開發(fā)商或研究團(tuán)隊(duì)都可以在此基礎(chǔ)上進(jìn)行開發(fā)。
![]()
據(jù)黃仁勛透露,Alpamayo將率先搭載于2025款梅賽德斯-奔馳CLA車型,后續(xù)通過(guò)OTA升級(jí)逐步推送高速公路脫手駕駛、城市全場(chǎng)景自動(dòng)駕駛、端到端自動(dòng)泊車等功能,并逐步登陸美、歐、亞市場(chǎng)。“Lucid、捷豹路虎、Uber和DeepDrive等企業(yè)也希望基于Alpamayo實(shí)現(xiàn)L4級(jí)自動(dòng)駕駛。”
有意思的是,知名特斯拉投資者Sawyer Merritt分享了英偉達(dá)發(fā)布會(huì)視頻和相關(guān)細(xì)節(jié),指出Alpamayo將率先搭載梅賽德斯CLA。特斯拉CEO馬斯克很快回復(fù)道:“這正是特斯拉正在做的。他們會(huì)發(fā)現(xiàn),達(dá)到99%很容易,但解決分布的長(zhǎng)尾問(wèn)題超級(jí)難。”
此外,黃仁勛還指出,升級(jí)后的Drive Thor算力達(dá)到2000TOPS,已斬獲15+車企訂單,將于2027年量產(chǎn)。
![]()
“我們的愿景是,未來(lái)有一天,每一輛汽車、每一輛卡車都將實(shí)現(xiàn)自動(dòng)駕駛。”黃仁勛指出,自動(dòng)駕駛汽車的時(shí)代已經(jīng)全面到來(lái),自動(dòng)駕駛汽車將成為“首個(gè)大規(guī)模的、面向主流市場(chǎng)”的物理AI應(yīng)用場(chǎng)景。
除了自動(dòng)駕駛以外,具身智能也是物理AI的一大應(yīng)用市場(chǎng)。英偉達(dá)為機(jī)器人推出的“大腦”Cosmos也再度升級(jí),它主要被用來(lái)生成符合現(xiàn)實(shí)世界物理規(guī)律的合成數(shù)據(jù)。
![]()
此次Cosmos主要升級(jí)了三部分。
CosmosTransfer 2.5和Cosmos Predict 2.5:開源、完全可定制的世界模型,為物理AI實(shí)現(xiàn)基于物理原理的合成數(shù)據(jù)生成與機(jī)器人策略評(píng)估的仿真支持。
Cosmos Reason 2:開源推理視覺語(yǔ)言模型(VLM),使智能機(jī)器能夠像人類一樣看見、理解物理世界并采取行動(dòng)。
IsaacGR00T N1.6:專為人形機(jī)器人打造的開放式推理視覺語(yǔ)言行動(dòng)(VLA)模型,可解鎖全身控制能力,并借助Cosmos Reason增強(qiáng)推理和上下文理解。
從重新定義算力極限的Rubin架構(gòu),到為自動(dòng)駕駛注入思維鏈的Alpamayo,機(jī)器人“大腦”Cosmos升級(jí),英偉達(dá)的戰(zhàn)略圖譜清晰顯現(xiàn):它正致力于成為智能體理解并行動(dòng)于物理世界的“使能層”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.