英偉達在CES展會推出新一代Rubin AI平臺,標志著其在人工智能(AI)芯片領(lǐng)域保持年度更新節(jié)奏。該平臺通過六款新芯片的集成設(shè)計,在推理成本和訓(xùn)練效率上實現(xiàn)大幅躍升,將于2026年下半年交付首批客戶。
![]()
美東時間5日周一,英偉達CEO黃仁勛在拉斯維加斯表示,六款Rubin芯片已從合作制造方處回廠,并已通過部分關(guān)鍵測試,正按計劃推進。他指出"AI競賽已經(jīng)開始,所有人都在努力達到下一個水平"。英偉達強調(diào),基于Rubin的系統(tǒng)運行成本將低于Blackwell版本,因為它們用更少組件即可實現(xiàn)相同結(jié)果。
微軟和其他大型云計算提供商將成為下半年首批部署新硬件的客戶。微軟的下一代Fairwater AI超級工廠將配備NVIDIA Vera Rubin NVL72機架級系統(tǒng),規(guī)模可擴展至數(shù)十萬顆NVIDIA Vera Rubin超級芯片。CoreWeave也將是首批提供Rubin系統(tǒng)的供應(yīng)商之一。
該平臺的推出正值華爾街部分人士擔(dān)憂英偉達面臨競爭加劇,并懷疑AI領(lǐng)域的支出能否維持當(dāng)前速度。但英偉達保持長期看漲預(yù)測,認為總市場規(guī)模可達數(shù)萬億美元。
性能提升瞄準新一代AI需求
據(jù)英偉達公告,Rubin平臺的訓(xùn)練性能是前代Blackwell的3.5倍,運行AI軟件的性能則提升5倍。與Blackwell平臺相比,Rubin可將推理代幣生成成本降低至多10倍,訓(xùn)練混合專家模型(MoE)所需GPU數(shù)量減少4倍。
新平臺配備的Vera CPU擁有88個核心,性能是其替代產(chǎn)品的兩倍。這款CPU專為代理推理設(shè)計,是大規(guī)模AI工廠中能效最高的處理器,采用88個定制Olympus核心、完整Armv9.2兼容性和超快NVLink-C2C連接。
Rubin GPU配備第三代Transformer引擎,具備硬件加速自適應(yīng)壓縮功能,可提供50 petaflops的NVFP4計算能力用于AI推理。每個GPU提供3.6TB/s的帶寬,而Vera Rubin NVL72機架則提供260TB/s帶寬。
芯片測試進展順利
黃仁勛披露,全部六款Rubin芯片已從制造合作伙伴處返回,并已通過顯示其可按計劃部署的關(guān)鍵測試。這一表態(tài)表明英偉達正維持其作為AI加速器領(lǐng)先制造商的優(yōu)勢地位。
該平臺包含五大創(chuàng)新技術(shù):第六代NVLink互連技術(shù)、Transformer引擎、機密計算、RAS引擎以及Vera CPU。其中第三代機密計算技術(shù)使Vera Rubin NVL72成為首個提供跨CPU、GPU和NVLink域數(shù)據(jù)安全保護的機架級平臺。
第二代RAS引擎橫跨GPU、CPU和NVLink,具備實時健康檢查、容錯和主動維護功能,以最大化系統(tǒng)生產(chǎn)力。機架采用模塊化、無線纜托盤設(shè)計,組裝和維護速度比Blackwell快18倍。
廣泛生態(tài)系統(tǒng)支持
英偉達表示,包括亞馬遜的AWS、谷歌云、微軟和甲骨文云在2026年將率先部署基于Vera Rubin的實例,云合作伙伴CoreWeave、Lambda、Nebius和Nscale也將跟進。
OpenAI CEO Sam Altman表示:“智能隨計算擴展。當(dāng)我們增加更多計算時,模型變得更強大,能解決更難的問題,為人們帶來更大影響。英偉達Rubin平臺幫助我們持續(xù)擴展這一進展。”
Anthropic聯(lián)合創(chuàng)始人兼CEO Dario Amodei稱,英偉達“Rubin平臺的效率提升代表了能夠?qū)崿F(xiàn)更長記憶、更好推理和更可靠輸出的基礎(chǔ)設(shè)施進步”。
Meta CEO扎克伯格表示,英偉達的“Rubin平臺有望帶來性能和效率的階躍式變化,這是將最先進模型部署給數(shù)十億人所需要的”。
英偉達還稱,思科、戴爾、惠普企業(yè)、聯(lián)想和超微預(yù)計將推出基于Rubin產(chǎn)品的各類服務(wù)器。包括Anthropic、Cohere、Meta、Mistral AI、OpenAI和xAI等AI實驗室正期待利用Rubin平臺訓(xùn)練更大型、更強大的模型。
提前公布產(chǎn)品細節(jié)
評論稱,英偉達今年比往年更早披露新產(chǎn)品的細節(jié),這是該司保持行業(yè)依賴其硬件的舉措之一。因為英偉達通常在每年春季加州圣何塞舉行的GTC活動上深入介紹產(chǎn)品細節(jié)。
對黃仁勛而言,CES只是其馬拉松式出席活動的又一站。他要在各類活動中宣布產(chǎn)品、合作和投資,均旨在為AI系統(tǒng)部署增添動力。
英偉達公布的新硬件還包括網(wǎng)絡(luò)和連接組件,將成為DGX SuperPod超級計算機的一部分,同時也可作為單獨產(chǎn)品供客戶以更模塊化的方式使用。這一性能提升是必需的,因為AI已轉(zhuǎn)向更專業(yè)化的模型網(wǎng)絡(luò),不僅要篩選海量輸入,還需通過多階段流程解決特定問題。
英偉達正在推動面向整個經(jīng)濟領(lǐng)域的AI應(yīng)用,包括機器人、醫(yī)療保健和重工業(yè)。作為這一努力的一部分,英偉達宣布了一系列旨在加速自動駕駛汽車和機器人開發(fā)的工具。目前,基于英偉達的計算機支出大部分來自少數(shù)客戶的資本支出預(yù)算,包括微軟、Alphabet旗下的谷歌云和亞馬遜旗下的AWS。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.