<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      逐項(xiàng)解讀黃仁勛GTC演講:Vera Rubin、token王、英偉達(dá)“龍蝦”、太空計(jì)算和雪寶|甲子光年

      0
      分享至



      AI工廠啟動(dòng),人類歷史上最大基礎(chǔ)設(shè)施建設(shè)正在發(fā)生。

      作者|蘇霍伊 周悅

      編輯|王博

      美國當(dāng)?shù)貢r(shí)間3月16日上午11點(diǎn)15分,英偉達(dá)創(chuàng)始人、CEO黃仁勛出現(xiàn)在了圣何塞SAP中心的舞臺(tái)上,開始GTC 2026的主題演講。

      面對全場的歡呼聲,黃仁勛說:“我想提醒大家,這是一場科技大會(huì)。”

      這里距離英偉達(dá)總部辦公室只有10分鐘車程,是每年英偉達(dá)GTC主題演講的舉辦地。雖然黃仁勛經(jīng)常出現(xiàn)在各種場合發(fā)表演講,但是在這里,他明顯更自然、放松。

      圣何塞才是黃仁勛的主場。

      雖然圣何塞的酒店價(jià)格飛漲,會(huì)場周邊的酒店甚至超過了2000美元一晚,但仍有大量的參會(huì)者來到這里,希望聽到AI行業(yè)最前沿的分享,尋找更多合作機(jī)會(huì)。

      “GTC已經(jīng)不只是一個(gè)技術(shù)大會(huì),而是觀察全球AI產(chǎn)業(yè)趨勢的重要窗口。”北大學(xué)生人工智能創(chuàng)新會(huì)創(chuàng)始理事長謝小璇Valeri告訴「甲子光年」,“這次主要是看黃仁勛會(huì)怎么定義未來一年AI行業(yè)的重點(diǎn)方向,尤其是算力平臺(tái)、Agent、機(jī)器人和企業(yè)級應(yīng)用這些領(lǐng)域。”

      Eigen AI聯(lián)合創(chuàng)始人、麻省理工學(xué)院計(jì)算機(jī)科學(xué)博士金帝則告訴「甲子光年」,他最關(guān)注的是LPU會(huì)給AI推理帶來多大的重塑。

      這次,黃仁勛的主題演講主要有五項(xiàng)重要技術(shù)發(fā)布。

      第一,下一代AI計(jì)算平臺(tái)Vera Rubin。該平臺(tái)將7款芯片整合在一起協(xié)同運(yùn)行,通過5種機(jī)架組成一臺(tái)強(qiáng)大的AI超級計(jì)算機(jī),能夠支持從大規(guī)模預(yù)訓(xùn)練、后訓(xùn)練和測試階段擴(kuò)展,到實(shí)時(shí)的Agent式推理等階段的AI計(jì)算需求。

      第二,下一代AI工廠參考設(shè)計(jì)Vera Rubin DSX。英偉達(dá)為企業(yè)和數(shù)據(jù)中心運(yùn)營商提供一套完整指南,用于設(shè)計(jì)、建設(shè)和運(yùn)營下一代AI工廠。

      第三,“企業(yè)版OpenClaw”——NemoClaw。NemoClaw是英偉達(dá)為OpenClaw Agent平臺(tái)提供的企業(yè)級運(yùn)行與管理軟件棧,可理解為OpenClaw的企業(yè)版運(yùn)行環(huán)境。

      第四,太空計(jì)算計(jì)劃。英偉達(dá)計(jì)劃將AI計(jì)算能力從地面數(shù)據(jù)中心延伸到軌道空間。通過將數(shù)據(jù)中心級計(jì)算能力部署到體積、重量和功耗受限的航天環(huán)境中,英偉達(dá)希望支持軌道數(shù)據(jù)中心、地理空間情報(bào)處理以及自主航天任務(wù)等新型應(yīng)用。

      第五,全新物理AI數(shù)據(jù)藍(lán)圖——NVIDIA Physical AI Data Factory Blueprint。這是一種開放參考架構(gòu),可統(tǒng)一并自動(dòng)化訓(xùn)練數(shù)據(jù)的生成、增強(qiáng)與評估,從而降低大規(guī)模訓(xùn)練物理AI系統(tǒng)的成本、時(shí)間和復(fù)雜性。

      「甲子光年」注意到,在今天演講中,除了“AI”一詞之外,黃仁勛說得最多的詞就是“token”:“token是新的商品”“英偉達(dá)的token成本是世界級的,無人能及”……甚至他舉起雙拳說:“古有美猴王,今有Token王。

      從前段時(shí)間黃仁勛發(fā)布“AI是一塊五層蛋糕(AI is a five-layer cake)”理論到今天GTC上的發(fā)布,可以看出,黃仁勛想要擺脫芯片公司的標(biāo)簽,把英偉達(dá)打造成一家AI基礎(chǔ)設(shè)施公司。在他眼中,AI就是“人類歷史上規(guī)模最大的基礎(chǔ)設(shè)施建設(shè)”。


      演講現(xiàn)場,圖片來源:「甲子光年」拍攝

      1.揭秘Vera Rubin

      去年GTC,黃仁勛就提到了Vera Rubin平臺(tái);今年GTC,黃仁勛揭秘了Vera Rubin平臺(tái)的詳細(xì)構(gòu)成。

      “Vera Rubin是一次跨時(shí)代的飛躍,它是由7款突破性芯片、5種機(jī)架組成的一臺(tái)巨型超級計(jì)算機(jī),旨在為AI的每一個(gè)階段提供動(dòng)力,”黃仁勛說,“隨著Vera Rubin的推出,Agentic AI的拐點(diǎn)已經(jīng)到來,也將引發(fā)史上規(guī)模最大的基礎(chǔ)設(shè)施建設(shè)浪潮。”

      其中,7款芯片指的是:

      • NVIDIA Vera CPU

      • NVIDIA Rubin GPU

      • NVIDIA NVLink 6 交換機(jī)

      • NVIDIA ConnectX-9 SuperNIC

      • NVIDIA BlueField-4 DPU

      • NVIDIA Spectrum-6 以太網(wǎng)交換機(jī)

      • NVIDIA Groq 3 LPU

      5種機(jī)架指的是:

      • Vera Rubin NVL72 GPU機(jī)架

      • Vera CPU機(jī)架

      • NVIDIA Groq 3 LPX推理加速器機(jī)架

      • NVIDIA BlueField-4 STX存儲(chǔ)機(jī)架

      • NVIDIA Spectrum-6 SPX 以太網(wǎng)機(jī)架


      黃仁勛發(fā)布NVIDIA Vera Rubin,圖片來源:「甲子光年」拍攝

      在這7款芯片中,最受關(guān)注的是此次新發(fā)布的Vera CPU和Groq 3 LPU。

      Vera CPU是全球首款為agentic AI和強(qiáng)化學(xué)習(xí)專門打造的處理器,在效率上達(dá)到傳統(tǒng)機(jī)架級CPU的兩倍,并且速度提高了50%。目前Vera CPU已進(jìn)入全面量產(chǎn),并將于今年下半年向合作伙伴提供。

      Vera CPU的發(fā)布意味著傳統(tǒng)CPU的設(shè)計(jì)路徑正在被AI重新定義。

      過去,游戲CPU追求單核性能,云CPU強(qiáng)調(diào)多核并發(fā),移動(dòng)設(shè)備的CPU則優(yōu)先能效,而三者往往難以兼得。但AI工作負(fù)載同時(shí)要求高并發(fā)、低延遲和高能效,使得CPU必須在“多核、單核性能與能效”三者之間實(shí)現(xiàn)平衡。

      這也就是說,AI需要一款全新的CPU,它不再沿用傳統(tǒng)CPU的單一優(yōu)化邏輯,而是面向AI工廠,成為一個(gè)融合多核擴(kuò)展性、單線程性能和能效的系統(tǒng)級調(diào)度中樞。

      Vera CPU的創(chuàng)新之處在于與GPU和網(wǎng)絡(luò)架構(gòu)的深度協(xié)同。在Vera Rubin 平臺(tái)中,CPU、GPU、DPU和高速網(wǎng)絡(luò)被設(shè)計(jì)為一個(gè)整體系統(tǒng)。通過高速互聯(lián)和統(tǒng)一的數(shù)據(jù)流管理,Vera CPU可以更高效地協(xié)調(diào)AI推理請求、模型加載以及大規(guī)模Agent任務(wù)的執(zhí)行,從而提升整個(gè)AI工廠的吞吐效率和資源利用率。

      從已披露的規(guī)格來看,Vera CPU采用88核設(shè)計(jì),支持高達(dá)1.5TB內(nèi)存與1.2TB/s帶寬,并通過 NVLink實(shí)現(xiàn)與GPU之間高達(dá)1.8GB/s的互聯(lián)。這種帶寬和互聯(lián)能力,使CPU首次成為AI系統(tǒng)中的核心數(shù)據(jù)調(diào)度節(jié)點(diǎn),而不再只是外圍控制單元。

      “Vera CPU專為極高的單線程性能、極高的數(shù)據(jù)輸出能力、卓越的數(shù)據(jù)處理能力和極致的能效而設(shè)計(jì)。它是全球唯一一款數(shù)據(jù)中心專用中央處理器。”黃仁勛說。

      而在本次GTC開幕前夕,就有媒體爆料英偉達(dá)將帶來一款“世界從未見過的芯片”

      答案也很快揭曉——Groq 3 LPU,這是一款專門用于大語言模型推理的處理器。

      在大模型推理過程中,通常可以拆分為兩個(gè)階段:一是Prefill(預(yù)填充)階段,即在輸入prompt后進(jìn)行大規(guī)模矩陣計(jì)算;二是Decode(解碼)階段,模型按token逐步生成輸出內(nèi)容。GPU在前一個(gè)階段中具備顯著優(yōu)勢,但在后一個(gè)階段中,由于生成過程具有強(qiáng)順序性、對延遲高度敏感,且難以形成高效并行,往往導(dǎo)致算力利用率下降。

      Groq 3 LPU就是專門為解碼階段優(yōu)化。在Vera Rubin平臺(tái)中,Groq 3 LPU會(huì)與GPU協(xié)同工作。

      從硬件指標(biāo)來看,Groq 3 LPU采用約500MB片上SRAM,并提供高達(dá)150TB/s的片上帶寬,遠(yuǎn)高于傳統(tǒng)依賴外部HBM內(nèi)存的GPU架構(gòu),從而顯著降低數(shù)據(jù)訪問延遲。同時(shí),其FP8算力達(dá)到約1.2 PFLOPs,晶體管規(guī)模達(dá)980億,體現(xiàn)出較強(qiáng)的計(jì)算能力與集成度。


      Rubin GPU與Groq 3 LPU,圖片來源:「甲子光年」拍攝

      相比單純追求算力規(guī)模,Groq 3 LPU更強(qiáng)調(diào)通過大容量片上存儲(chǔ)與超高帶寬的數(shù)據(jù)流架構(gòu),將數(shù)據(jù)“留在芯片內(nèi)”高速流動(dòng),從根本上優(yōu)化大模型推理過程中最關(guān)鍵的延遲瓶頸。

      Groq此前是一家獨(dú)立的公司,成立于2016年,長期專注于AI推理基礎(chǔ)設(shè)施,除了LPU之外,也自建了GroqCloud推理平臺(tái)。2025年12月,英偉達(dá)與Groq達(dá)成一項(xiàng)非獨(dú)家推理技術(shù)授權(quán)協(xié)議,吸納部分核心成員加入英偉達(dá),以推進(jìn)相關(guān)技術(shù)規(guī)模化。

      英偉達(dá)引入Groq并推出Groq 3 LPU,本質(zhì)上是為了補(bǔ)齊其在“推理時(shí)代”的關(guān)鍵短板。隨著 AI 從訓(xùn)練轉(zhuǎn)向推理,尤其是Agent AI的興起,低延遲token生成成為核心瓶頸。英偉達(dá)構(gòu)建GPU+LPU的異構(gòu)推理體系,本質(zhì)上是在從“訓(xùn)練芯片公司”升級為“推理基礎(chǔ)設(shè)施公司”。

      而在5種機(jī)架中,Vera Rubin NVL72機(jī)架的發(fā)布吸引了廣泛關(guān)注。

      黃仁勛將Vera Rubin NVL72明確定位為新一代“AI工廠核心單元”。這一系統(tǒng)以機(jī)架為單位,集成72個(gè)Rubin GPU與36個(gè)Vera CPU,并通過NVLink 6、高速網(wǎng)絡(luò)與DPU構(gòu)建統(tǒng)一計(jì)算架構(gòu),實(shí)現(xiàn)計(jì)算、存儲(chǔ)與數(shù)據(jù)流的深度耦合。

      本質(zhì)上,NVL72已不再是傳統(tǒng)服務(wù)器,而是一臺(tái)面向AI全流程的“整機(jī)級超級計(jì)算機(jī)”。


      Vera Rubin NVL72,圖片來源:「甲子光年」拍攝

      Vera Rubin NVL72單機(jī)可提供高達(dá)3600 PFLOPS推理性能,并通過NVLink 6實(shí)現(xiàn)260TB/s的機(jī)架級互聯(lián)帶寬,顯著降低跨GPU通信瓶頸。 同時(shí),HBM4內(nèi)存容量與帶寬大幅提升,使其能夠支持更大上下文和更復(fù)雜的Agent推理任務(wù)。相比上一代架構(gòu),整體推理性能提升數(shù)倍,token成本也顯著下降。


      黃仁勛介紹NVIDIA Vera Rubin NVL72,圖片來源:GTC 2026

      而Vera CPU機(jī)架則是一個(gè)為AgenticAI和強(qiáng)化學(xué)習(xí)任務(wù)設(shè)計(jì)的CPU機(jī)架系統(tǒng),單機(jī)架包含 256個(gè)Vera CPU、400TB內(nèi)存、300TB/s LPDDR5x 帶寬,以及64個(gè)BlueField-4 DPU。

      通過與Spectrum-X以太網(wǎng)網(wǎng)絡(luò)深度集成,Vera CPU機(jī)架可以在AI工廠內(nèi)部實(shí)現(xiàn)多節(jié)點(diǎn)環(huán)境的高效同步,使強(qiáng)化學(xué)習(xí)與Agent系統(tǒng)能夠在大規(guī)模分布式環(huán)境中穩(wěn)定運(yùn)行。

      官方數(shù)據(jù)顯示,相比傳統(tǒng)數(shù)據(jù)中心CPU,該系統(tǒng)在性能與能效上實(shí)現(xiàn)約2倍效率提升和50%性能提升。這一架構(gòu)不僅為大規(guī)模Agentic AI 提供了基礎(chǔ)支撐,也標(biāo)志著CPU在AI數(shù)據(jù)中心中的角色,從通用計(jì)算單元轉(zhuǎn)向“環(huán)境生成與調(diào)度引擎”。

      英偉達(dá)還同步推出Groq 3 LPX推理加速器機(jī)架,專門面向大模型推理階段的低延遲需求。該機(jī)架集成了256個(gè)LPU處理器,提供高達(dá)128GB片上SRAM和640TB/s機(jī)架級帶寬。在這一架構(gòu)中,大量LPU被組織為一個(gè)統(tǒng)一的“邏輯處理器”,以確定性數(shù)據(jù)流方式執(zhí)行推理任務(wù),使token生成過程具備更高吞吐與更低延遲。


      NVIDIA Groq 3 LPX,圖片來源:「甲子光年」拍攝

      這釋放出一個(gè)更加清晰的信號:在英偉達(dá)的設(shè)想里,未來的計(jì)算單元,將不只是GPU機(jī)架,而會(huì)出現(xiàn)GPU機(jī)架、CPU 機(jī)架、LPU機(jī)架、存儲(chǔ)機(jī)架、網(wǎng)絡(luò)機(jī)架等分工更細(xì)的模塊化組合。

      黃仁勛表示,Vera Rubin的發(fā)布代表著計(jì)算能力在10年內(nèi)提升了4000萬倍。至于交付情況,他提到Grace Blackwell當(dāng)初因?yàn)镹VLink 72的整合,早期送樣很復(fù)雜,“但Vera Rubin的送樣進(jìn)展非常順利”。“

      事實(shí)上,微軟的CEO薩提亞·納德拉(Satya Nadella)應(yīng)該已經(jīng)對外公布了,第一臺(tái)Vera Rubin已在微軟Azure上點(diǎn)亮運(yùn)行了。”黃仁勛說。


      NVIDIA Vera Rubin,圖片來源:GTC 2026

      「甲子光年」認(rèn)為,Vera Rubin標(biāo)志著AI計(jì)算從單一芯片競爭,邁向以整機(jī)系統(tǒng)為核心的“AI 工廠級基礎(chǔ)設(shè)施”時(shí)代。

      2.建設(shè)AI工廠,成為token王

      AI工廠是英偉達(dá)近兩年一直在強(qiáng)調(diào)的概念。

      AI工廠本質(zhì)上就是把數(shù)據(jù)中心重新定義成“智能產(chǎn)線”:輸入是電力、數(shù)據(jù)、模型和調(diào)度系統(tǒng),輸出則是 token、智能體執(zhí)行能力和行業(yè)場景中的實(shí)際生產(chǎn)率。

      圍繞這一概念,英偉達(dá)發(fā)布了下一代AI工廠參考設(shè)計(jì)Vera Rubin DSX,這一參考設(shè)計(jì)覆蓋計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、電力和冷卻等整個(gè)基礎(chǔ)設(shè)施棧,并通過軟硬件協(xié)同設(shè)計(jì),實(shí)現(xiàn)更高的token 產(chǎn)出效率和能源利用率。

      同時(shí),英偉達(dá)還推出 Omniverse DSX Blueprint,利用數(shù)字孿生技術(shù)對AI工廠進(jìn)行高精度建模與仿真,使開發(fā)者能夠在實(shí)際建設(shè)前模擬數(shù)據(jù)中心運(yùn)行、優(yōu)化性能并降低部署風(fēng)險(xiǎn)。通過這一架構(gòu),英偉達(dá)希望將AI數(shù)據(jù)中心從傳統(tǒng)IT設(shè)施升級為“生產(chǎn)智能token的工廠”。


      Vera Rubin DSX,圖片來源:「甲子光年」拍攝

      黃仁勛在演講中稱:“英偉達(dá)正在從一家芯片公司,轉(zhuǎn)向一家AI工廠公司、AI 基礎(chǔ)設(shè)施公司。”


      黃仁勛談AI工廠,圖片來源:「甲子光年」拍攝

      在黃仁勛看來,AI時(shí)代真正重要的是誰能把整套系統(tǒng)做得更好,讓AI工廠以更低成本持續(xù)運(yùn)行。這樣看,Rubin的意義也就不只是Blackwell的下一代,英偉達(dá)想借此定義AI工廠這套新基礎(chǔ)設(shè)施。

      黃仁勛提出了一套更鮮明的觀點(diǎn)AI工廠是AI時(shí)代的工業(yè)基礎(chǔ)設(shè)施,推理是核心負(fù)載,Token 是新的商品,算力就是收入。這意味著,未來的數(shù)據(jù)中心不再只是堆放服務(wù)器的機(jī)房,而是生產(chǎn)智能的工廠。衡量這座工廠效率的關(guān)鍵,不只是算力有多強(qiáng),而是能以多高效率、多少成本持續(xù)產(chǎn)出Token。

      在今天的演講中,黃仁勛反復(fù)強(qiáng)調(diào)token成本,并援引SemiAnalysis的測算稱,英偉達(dá)目前在這一指標(biāo)上處于世界領(lǐng)先位置。他還半開玩笑地說,過去大家講“美猴王(Monkey King)”,現(xiàn)在更值得爭奪的是Token王(Token King。他稱:“我們的token成本是全球最低的。”暗示英偉達(dá)是當(dāng)之無愧的“Token王”。


      黃仁勛表示英偉達(dá)Token成本全球最低,揮手示意為“Token King”,圖片來源:GTC 2026

      黃仁勛強(qiáng)調(diào),相較上一代GPU Blackwell,Rubin將帶來更大的商業(yè)空間,并有望釋放高達(dá)1500億美元的收入。


      黃仁勛展示Rubin與Blackwell收入對比,圖片來源:「甲子光年」拍攝

      黃仁勛以一座1吉瓦級AI數(shù)據(jù)中心為例,將算力按免費(fèi)、中端、高端和旗艦服務(wù)分層,各占25%,強(qiáng)調(diào)不同token服務(wù)對應(yīng)不同商業(yè)價(jià)值,并以此說明AI工廠的收入結(jié)構(gòu)正在發(fā)生變化。

      他指出,隨著架構(gòu)升級,單位功耗可產(chǎn)生的token數(shù)量持續(xù)提升,而token成本不斷下降,從而顯著放大整體收入空間。

      在這一框架下,Blackwell相比Hopper在吞吐與效率上的提升,已帶來顯著的收入能力增長,而Vera Rubin平臺(tái)在此基礎(chǔ)上進(jìn)一步提升系統(tǒng)級性能,使AI工廠的商業(yè)模型繼續(xù)向高密度、高效率演進(jìn)。與此同時(shí),通過引入GPU與LPU的異構(gòu)架構(gòu),對推理流程進(jìn)行分工優(yōu)化,還可以進(jìn)一步提升低延遲場景下的token產(chǎn)出效率,從而釋放更高價(jià)值的應(yīng)用收入。

      他建議用戶“盡快遷移到Vera Rubin”,因?yàn)閠oken成本持續(xù)下降的同時(shí)吞吐量還在上升。如果進(jìn)一步將25%的數(shù)據(jù)中心配備Groq用于高速編程類token生成,收入還能進(jìn)一步提升。


      NVIDIA Rubin NVL72與Blackwell NVL72推理速度及效率對比,圖片來源:「甲子光年」拍攝

      “但要真正爆發(fā),吞吐量和單token成本還需要持續(xù)優(yōu)化。”Eigen AI聯(lián)合創(chuàng)始人金帝在GTC現(xiàn)場告訴「甲子光年」。

      在主題演講中,黃仁勛展示了各推理服務(wù)商在Kimi K2.5 Reasoning模型上的輸出速度排名中,其中Eigen AI以439 tokens/s位列第一。“我們是一家專注于高性能、低成本的大模型訓(xùn)練與推理的全棧基礎(chǔ)設(shè)施公司,感到很幸運(yùn)黃仁勛Cue到了。”金帝說。


      截至2026年3月14日全球領(lǐng)先的推理服務(wù)商,左一為Eigen AI。圖片來源:「甲子光年」拍攝

      從商業(yè)視角看,這意味著英偉達(dá)的天花板正在被重新打開。一旦機(jī)架成為產(chǎn)品單位,英偉達(dá)可售賣的就不只是芯片本身,還包括整機(jī)、網(wǎng)絡(luò)、存儲(chǔ)、軟件棧、調(diào)度框架,乃至AI工廠的設(shè)計(jì)藍(lán)圖。對于黃仁勛來說,這比賣一代又一代GPU的故事,要大得多。

      在GTC現(xiàn)場,GMI Cloud創(chuàng)始人&CEO Alex Yeh告訴「甲子光年」:“我們會(huì)開始買Vera Rubin平臺(tái)的硬件來在各國開展sovereign AI(主權(quán)AI)的AI數(shù)據(jù)中心建設(shè)。”

      3.每家公司都該有自己的OpenClaw策略

      黃仁勛在介紹Vera Rubin、AI工廠時(shí),經(jīng)常提到的一個(gè)詞是Agentic AI。

      OpenClaw(龍蝦)在硅谷熱度不減,GTC現(xiàn)場經(jīng)常能看到頭戴龍蝦裝飾的觀眾,甚至黃仁勛的Keynote頁面上還引用了國內(nèi)社交媒體上流傳很廣的一張“龍蝦主題”線下聚會(huì)圖。

      就在黃仁勛演講開始前,OpenClaw創(chuàng)始人彼得·斯坦伯格(Peter Steinberger)出現(xiàn)在了GTC的場外直播中。他表示,Agent已經(jīng)徹底改變了他的日常工作方式:那些無聊的重復(fù)性任務(wù)現(xiàn)在全由Agent搞定,他自己已經(jīng)不怎么寫代碼了,更多時(shí)間花在思考架構(gòu)和方向上。


      彼得·斯坦伯格做客GTC現(xiàn)場直播節(jié)目,圖片來源:「甲子光年」拍攝

      “現(xiàn)在最大的挑戰(zhàn)反而是‘不’,因?yàn)闁|西太容易實(shí)現(xiàn)了,一句prompt就能做出來,但你還是得想清楚到底要往哪走。”斯坦伯格分享,他的Agent甚至能自動(dòng)把郵件、issue tracker和各種討論線索關(guān)聯(lián)起來,讓他一眼看到該做什么,然后只專注在真正有意思的事情上。

      而在演講中,黃仁勛花了很長時(shí)間分享OpenClaw的作用及價(jià)值,他對OpenClaw評價(jià)極高:“OpenClaw是人類歷史上排名第一,也是最受歡迎的開源項(xiàng)目。”他認(rèn)為,OpenClaw的意義“就像當(dāng)年的Linux、HTML和Kubernetes”,甚至稱它在短短幾周內(nèi)做到的事,“超過了Linux 30年做到的事”。

      黃仁勛認(rèn)為,OpenClaw不只是一個(gè)agent,而更像是“Agentic Computer的操作系統(tǒng)”:它能連接大模型、調(diào)用工具、訪問文件系統(tǒng)、執(zhí)行任務(wù)調(diào)度、拆解復(fù)雜問題,還能調(diào)用子代理,通過多模態(tài)方式與人交互。

      由此,黃仁勛拋出一個(gè)判斷:“現(xiàn)在,每一家軟件公司、每一家技術(shù)公司,都必須有自己的OpenClaw策略和Agent策略。


      “推理的拐點(diǎn)到來”,圖片來源:「甲子光年」拍攝

      但他隨即強(qiáng)調(diào),Agentic AI一旦進(jìn)入企業(yè)網(wǎng)絡(luò),也會(huì)帶來全新的安全問題——它可以接觸敏感信息、執(zhí)行代碼、并對外通信。

      為了解決這方面的問題,英偉達(dá)推出了NemoClaw。這并不是英偉達(dá)版的OpenClaw,而是英偉達(dá)為OpenClaw提供的企業(yè)級運(yùn)行與管理軟件棧。

      通過NemoClaw,開發(fā)者可以安裝NVIDIA Nemotron開源模型和OpenShell運(yùn)行環(huán)境,為AI Agent提供安全隔離的執(zhí)行環(huán)境,并加入數(shù)據(jù)隱私、網(wǎng)絡(luò)訪問和策略控制等安全機(jī)制,使長期運(yùn)行的AI Agent更加可靠和可擴(kuò)展。

      NemoClaw可以在任何專用平臺(tái)上運(yùn)行,包括配備NVIDIA GeForce RTX的臺(tái)式機(jī)和筆記本電腦或配備NVIDIA RTX PRO的工作站,以及NVIDIA DGX Station和 NVIDIA DGX Spark人工智能超級計(jì)算機(jī)。它可為自主化Agent提供本地計(jì)算,使其能夠全天候運(yùn)行。


      NemoClaw,圖片來源:「甲子光年」拍攝

      “知識(shí)型工作的苦活正在被徹底轉(zhuǎn)移,有些公司已經(jīng)完全理解了這一點(diǎn),但有些還沒有意識(shí)到我們能做到的和實(shí)際做到的之間,差距是驚人的。”斯坦伯格描述了他作為開發(fā)者的切身體會(huì)。

      圍繞這一點(diǎn),黃仁勛進(jìn)一步判斷:“未來每一家SaaS公司都會(huì)成為AaaS(Agentic as a Service)公司。”在他看來,軟件公司未來賣的不再只是工具,而是能執(zhí)行任務(wù)的“數(shù)字員工”或“專業(yè)Agent”;工程師除了工資,甚至還會(huì)擁有自己的token預(yù)算,而這些token,則將由各家的AI工廠持續(xù)生產(chǎn)。

      果殼CEO、未來光錐前沿科技基金創(chuàng)始合伙人姬十三聽完黃仁勛演講后也對此感觸很深:“我這幾天在硅谷聊下來,發(fā)現(xiàn)OpenClaw生態(tài)已經(jīng)繁榮,有人做專屬硬件,有人做更好的OpenClaw,有人做垂直行業(yè)版。2026年應(yīng)該妥妥是Agent元年了。”

      而英偉達(dá)的合作伙伴也做好了準(zhǔn)備,作為首批與英偉達(dá)Dynamo合作并支持OpenShell運(yùn)行時(shí)的云提供商之一,GMI Cloud的創(chuàng)始人&CEO Alex Yeh告訴「甲子光年」,GMI Cloud正在為NemoClaw提供基礎(chǔ)設(shè)施服務(wù)。

      4.奔向太空,走進(jìn)物理世界

      這次黃仁勛的主題演講中還有兩個(gè)值得關(guān)注的發(fā)布。

      太空計(jì)算計(jì)劃。英偉達(dá)計(jì)劃將AI計(jì)算能力從地面數(shù)據(jù)中心延伸到軌道空間。通過將數(shù)據(jù)中心級計(jì)算能力部署到體積、重量和功耗受限的航天環(huán)境中,英偉達(dá)希望支持軌道數(shù)據(jù)中心、地理空間情報(bào)處理以及自主航天任務(wù)等新型應(yīng)用。

      例如,新的Space-1 Vera Rubin Module可在太空環(huán)境中提供高性能AI推理能力,這一專為太空環(huán)境設(shè)計(jì)的AI計(jì)算模塊,搭載新一代Rubin GPU,其AI推理性能比H100高出25倍,支持在軌道上運(yùn)行大型語言模型和實(shí)時(shí)數(shù)據(jù)處理。而IGX Thor和Jetson Orin平臺(tái)則為衛(wèi)星和航天器提供實(shí)時(shí)AI處理與邊緣計(jì)算能力。

      通過這些技術(shù),AI可以在數(shù)據(jù)產(chǎn)生的地方——包括衛(wèi)星、軌道設(shè)施和航天器上,直接進(jìn)行分析和決策,從而減少數(shù)據(jù)回傳延遲,并推動(dòng)太空基礎(chǔ)設(shè)施向“智能化、自主化”演進(jìn)。


      NVIDIA Space-1 Vera Rubin Module發(fā)布,圖片來源:GTC 2026

      另外就是全新物理AI數(shù)據(jù)藍(lán)圖——NVIDIA Physical AI Data Factory Blueprint。這是一種開放參考架構(gòu),可統(tǒng)一并自動(dòng)化訓(xùn)練數(shù)據(jù)的生成、增強(qiáng)與評估,從而降低大規(guī)模訓(xùn)練物理AI系統(tǒng)的成本、時(shí)間和復(fù)雜性。

      通過該架構(gòu),開發(fā)者可以利用NVIDIA Cosmos開放世界基礎(chǔ)模型和編碼Agent,將有限的真實(shí)數(shù)據(jù)擴(kuò)展為大規(guī)模、多樣化的數(shù)據(jù)集,并生成現(xiàn)實(shí)中難以采集的極端或長尾場景,從而大幅降低訓(xùn)練物理AI系統(tǒng)的成本與復(fù)雜度。該藍(lán)圖還將與云平臺(tái)結(jié)合,把大規(guī)模計(jì)算資源轉(zhuǎn)化為高效的數(shù)據(jù)生產(chǎn)引擎,幫助機(jī)器人、自動(dòng)駕駛和視覺 AI 應(yīng)用更快迭代與部署。

      圍繞機(jī)器人,英偉達(dá)形成了完整的三層計(jì)算體系:用于訓(xùn)練的計(jì)算機(jī)、用于合成數(shù)據(jù)和仿真的計(jì)算機(jī),以及部署在機(jī)器人本體內(nèi)部的計(jì)算機(jī);同時(shí)配套 Isaac Lab、Newton、Cosmos、GR00T等軟件和模型棧。黃仁勛反復(fù)強(qiáng)調(diào),真實(shí)世界過于復(fù)雜,“我們需要從AI和仿真中獲得新的數(shù)據(jù)”,單靠真機(jī)數(shù)據(jù)永遠(yuǎn)不夠。


      黃仁勛與機(jī)器人同臺(tái),圖片來源:「甲子光年」拍攝

      在自動(dòng)駕駛和機(jī)器人部分,黃仁勛表示:“自動(dòng)駕駛迎來了ChatGPT 時(shí)刻。”英偉達(dá)宣布新增比亞迪、現(xiàn)代、日產(chǎn)、吉利等車企加入RoboTaxi Ready平臺(tái),并與ABB、Universal-Robots、Kuka、Caterpillar、Foxconn、Disney Research等公司合作,把物理AI推向制造、物流、自動(dòng)駕駛和娛樂等更具體的現(xiàn)實(shí)場景。


      黃仁勛宣布新增比亞迪等車企加入RoboTaxi Ready Platform,圖片來源:GTC 2026

      在演講的壓軸環(huán)節(jié),黃仁勛請出了一位特別嘉賓——由英偉達(dá)、迪士尼、谷歌DeepMind聯(lián)合打造的《冰雪奇緣》雪寶(Olaf)機(jī)器人。


      雪寶機(jī)器人亮相GTC,圖片來源:GTC 2026

      這個(gè)可愛的角色機(jī)器人能夠自主行走,還能與黃仁勛俏皮互動(dòng)。雪寶通過NVIDIA Newton物理引擎在Omniverse中以深度強(qiáng)化學(xué)習(xí)訓(xùn)練而成,黃仁勛開玩笑說:“你的電腦是我給的——Jetson,就在你肚子里。”他還暢想未來迪士尼樂園里各種角色機(jī)器人自由漫步的場景。

      最后,黃仁勛放了一部機(jī)器人唱歌、演奏的短片,如釋重負(fù)地坐在舞臺(tái)上,和雪寶一起享受這場機(jī)器人的表演。


      黃仁勛和雪寶一起看機(jī)器人演出視頻,圖片來源:「甲子光年」拍攝

      謝幕時(shí)他感慨道:“I still love Disney (我還是最喜歡迪士尼)。”

      5.如何看黃仁勛這次演講

      每年GTC,整個(gè)AI產(chǎn)業(yè)都在等待黃仁勛再一次定義這場技術(shù)革命的敘事。

      過去兩年,圍繞生成式AI的討論大多集中在模型能力和算力規(guī)模,但最近黃仁勛發(fā)文,給出了一個(gè)更系統(tǒng)的框架——AI是一塊“五層蛋糕”(AI is a five-layer cake):從底部的能源,到芯片、AI基礎(chǔ)設(shè)施,再到模型與應(yīng)用,層層疊加,構(gòu)成一整套新的工業(yè)體系。


      五層蛋糕框架,圖片來源:英偉達(dá)

      這個(gè)比喻背后的含義很清晰:AI是一場基礎(chǔ)設(shè)施革命。如果說過去的互聯(lián)網(wǎng)時(shí)代主要改變的是信息流,那么AI時(shí)代改變的則是算力、能源、數(shù)據(jù)中心和軟件系統(tǒng)共同構(gòu)成的“生產(chǎn)系統(tǒng)”。在這個(gè)體系中,GPU只是其中一層,而真正決定產(chǎn)業(yè)規(guī)模的,是整塊蛋糕的協(xié)同生長。

      黃仁勛認(rèn)為,在過去的一年里,AI跨越了一個(gè)重要的門檻。模型性能顯著提升,可以大規(guī)模投入使用。推理能力增強(qiáng),幻覺現(xiàn)象減少,落地應(yīng)用能力大幅提升。基于AI構(gòu)建的應(yīng)用首次開始創(chuàng)造真實(shí)的經(jīng)濟(jì)價(jià)值。

      黃仁勛透露,去年GTC DC時(shí)他看到的高確信需求和訂單是5000億美元(覆蓋Blackwell和Rubin到2026年),而僅僅一年后,“站在今天這個(gè)位置,到2027年我看到的至少是1萬億美元”,而且他確信實(shí)際需求會(huì)遠(yuǎn)高于此。

      推動(dòng)這一增長的核心是推理拐點(diǎn)的到來:AI從能感知、能生成,進(jìn)化到能推理、能執(zhí)行任務(wù),每一次思考都要消耗推理算力,過去兩年所需的計(jì)算量增長了大約一萬倍。

      與此同時(shí),英偉達(dá)的客戶基礎(chǔ)也在快速擴(kuò)大,他特別提到Anthropic和MSL(Meta)在過去一年選擇了英偉達(dá)平臺(tái),加上多家開源模型廠商的加入,合計(jì)占據(jù)全球約三分之一的AI算力。從業(yè)務(wù)構(gòu)成看,60%來自前五大超大規(guī)模云廠商,其中既包括內(nèi)部AI消費(fèi)(推薦系統(tǒng)、搜索等工作負(fù)載正在向大模型遷移),也包括通過英偉達(dá)生態(tài)落地的AI原生公司;另外40%則遍布區(qū)域云、主權(quán)AI、企業(yè)、工業(yè)、機(jī)器人和邊緣計(jì)算。黃仁勛強(qiáng)調(diào),“AI的多樣性就是它的韌性,這不是一個(gè)單一應(yīng)用的技術(shù),這是一次根本性的計(jì)算平臺(tái)遷移。”


      黃仁勛展示推理拐點(diǎn)驅(qū)動(dòng)的增長,圖片來源:「甲子光年」拍攝

      今年是CUDA的二十周年,黃仁勛認(rèn)為,CUDA真正的壁壘在于二十年間積累的數(shù)以億計(jì)的GPU裝機(jī)量,覆蓋了全球每一家云廠商和幾乎每一個(gè)行業(yè)。

      龐大的裝機(jī)量吸引開發(fā)者,開發(fā)者帶來算法突破,如深度學(xué)習(xí)等。而突破催生新市場,新市場又進(jìn)一步擴(kuò)大裝機(jī)量,形成持續(xù)加速的飛輪。

      他以六年前發(fā)貨的Ampere GPU為例,稱其云端定價(jià)不降反升,原因是CUDA生態(tài)下可運(yùn)行的應(yīng)用極其豐富,基礎(chǔ)設(shè)施的有效使用壽命遠(yuǎn)超預(yù)期。英偉達(dá)也因此愿意持續(xù)為所有在役GPU更新軟件,每一次優(yōu)化都能惠及數(shù)百萬用戶,不斷壓低計(jì)算成本,而更低的成本又反過來刺激新的增長。


      CUDA20周年,圖片來源:「甲子光年」拍攝

      一直以來,憑借GPU架構(gòu)和CUDA生態(tài)的壁壘,英偉達(dá)締造了AI時(shí)代的算力帝國,占據(jù)全球90%的算力市場份額。

      但未來呢?

      「甲子光年」認(rèn)為,觀察今年GTC的一個(gè)重要視角,是看英偉達(dá)如何在這五層結(jié)構(gòu)中守住并繼續(xù)擴(kuò)展自己的位置。從下一代GPU架構(gòu)、機(jī)架級AI系統(tǒng),到推理時(shí)代的數(shù)據(jù)中心設(shè)計(jì),再到Agent與物理AI應(yīng)用,英偉達(dá)正在堅(jiān)定把自己從一家芯片公司,重新定義為AI基礎(chǔ)設(shè)施的核心平臺(tái)提供者

      這是一次必須要做的轉(zhuǎn)型,也是一次充滿意味的新敘事。

      (封面圖來源:GTC 2026)

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      鄧華妻子向梁興初求助,梁興初瞪著副政委:敢動(dòng)老紅軍,你掂量下

      鄧華妻子向梁興初求助,梁興初瞪著副政委:敢動(dòng)老紅軍,你掂量下

      觀史搜尋著
      2026-03-07 02:10:58
      男子讓女友跟朋友纏綿,女友告朋友強(qiáng)奸,2011年倆哥們打架死1個(gè)

      男子讓女友跟朋友纏綿,女友告朋友強(qiáng)奸,2011年倆哥們打架死1個(gè)

      漢史趣聞
      2026-03-28 16:42:18
      央視發(fā)文銳評《逐玉》,狠狠替張凌赫出了口惡氣,劉宇寧全說對了

      央視發(fā)文銳評《逐玉》,狠狠替張凌赫出了口惡氣,劉宇寧全說對了

      曉鰀愛八卦
      2026-03-27 15:24:35
      55年授銜,當(dāng)主席看到名單中有個(gè)熟悉的名字,大筆一揮:他不是少將

      55年授銜,當(dāng)主席看到名單中有個(gè)熟悉的名字,大筆一揮:他不是少將

      睡前講故事
      2025-12-12 13:58:11
      31歲李夢決絕留洋!拒四川頂薪,簽費(fèi)內(nèi)巴切1+1合同,只為打動(dòng)宮魯鳴?

      31歲李夢決絕留洋!拒四川頂薪,簽費(fèi)內(nèi)巴切1+1合同,只為打動(dòng)宮魯鳴?

      海闊山遙YAO
      2026-03-28 10:10:12
      遼寧一女子擁有3個(gè)身份證號?證件修改遇阻,當(dāng)?shù)兀簳?huì)盡快幫忙辦好

      遼寧一女子擁有3個(gè)身份證號?證件修改遇阻,當(dāng)?shù)兀簳?huì)盡快幫忙辦好

      瀟湘晨報(bào)
      2026-03-28 20:36:18
      CBA歷史第二長紀(jì)錄!廣廈連續(xù)19年晉級季后賽 僅輸廣東連續(xù)30年

      CBA歷史第二長紀(jì)錄!廣廈連續(xù)19年晉級季后賽 僅輸廣東連續(xù)30年

      醉臥浮生
      2026-03-29 09:36:06
      NVIDIA新一代顯卡RTX 60系列爆料匯總

      NVIDIA新一代顯卡RTX 60系列爆料匯總

      小柱解說游戲
      2026-03-29 10:05:52
      上海電影院現(xiàn)場被捉奸,帶情夫當(dāng)老公面出軌,狗血女主角真容曝光

      上海電影院現(xiàn)場被捉奸,帶情夫當(dāng)老公面出軌,狗血女主角真容曝光

      靜若梨花
      2026-03-01 16:25:46
      新華社發(fā)聲魯山孫女士案:有人坐立難安,長夜注定無眠

      新華社發(fā)聲魯山孫女士案:有人坐立難安,長夜注定無眠

      娛樂圈的筆娛君
      2026-03-28 12:04:48
      40歲確診腫瘤,4個(gè)月走到盡頭——?jiǎng)e用無知賭生命

      40歲確診腫瘤,4個(gè)月走到盡頭——?jiǎng)e用無知賭生命

      陪老公抗AI
      2026-03-28 16:29:18
      淺色系穿搭!這個(gè)組合讓你在健身房瞬間吸引眼球!

      淺色系穿搭!這個(gè)組合讓你在健身房瞬間吸引眼球!

      獨(dú)角showing
      2025-12-31 21:08:57
      38歲老板娘淪為陪睡工具:揭秘黑茶高端騙局,入局者10有9個(gè)離婚

      38歲老板娘淪為陪睡工具:揭秘黑茶高端騙局,入局者10有9個(gè)離婚

      云景侃記
      2026-02-12 22:21:30
      伊朗武裝部隊(duì)發(fā)言人:伊朗正在制定戰(zhàn)爭結(jié)束條件

      伊朗武裝部隊(duì)發(fā)言人:伊朗正在制定戰(zhàn)爭結(jié)束條件

      財(cái)聯(lián)社
      2026-03-28 04:50:19
      打擊巨大!庫拉索召回辭職33天老帥:國足已把3位主帥打下課

      打擊巨大!庫拉索召回辭職33天老帥:國足已把3位主帥打下課

      邱澤云
      2026-03-28 13:45:29
      “當(dāng)代福爾摩斯”李昌鈺逝世,曾同時(shí)打三份工才完成博士學(xué)業(yè),親手送進(jìn)監(jiān)牢的犯人寫信稱希望成為他的學(xué)生

      “當(dāng)代福爾摩斯”李昌鈺逝世,曾同時(shí)打三份工才完成博士學(xué)業(yè),親手送進(jìn)監(jiān)牢的犯人寫信稱希望成為他的學(xué)生

      極目新聞
      2026-03-28 10:47:15
      劉昊然郭麒麟商K風(fēng)波升級!被質(zhì)疑參加拖鞋場,畫面細(xì)節(jié)對上了

      劉昊然郭麒麟商K風(fēng)波升級!被質(zhì)疑參加拖鞋場,畫面細(xì)節(jié)對上了

      萌神木木
      2026-03-28 15:34:37
      為什么中國不軍事援助伊朗?看完發(fā)現(xiàn),印度三哥才是最牛逼的

      為什么中國不軍事援助伊朗?看完發(fā)現(xiàn),印度三哥才是最牛逼的

      番外行
      2026-03-14 08:55:36
      遼寧一小伙認(rèn)50歲女教師做干媽,每周去其家中補(bǔ)課,最后釀成悲劇

      遼寧一小伙認(rèn)50歲女教師做干媽,每周去其家中補(bǔ)課,最后釀成悲劇

      紅豆講堂
      2024-09-24 10:14:37
      忍無可忍!英格蘭該放棄昔日最佳了,全場噓聲太扎心

      忍無可忍!英格蘭該放棄昔日最佳了,全場噓聲太扎心

      奶蓋熊本熊
      2026-03-29 03:49:02
      2026-03-29 10:56:49
      甲子光年
      甲子光年
      中國科技產(chǎn)業(yè)化前沿智庫
      3388文章數(shù) 9262關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克承認(rèn)xAI"建錯(cuò)了",11位創(chuàng)始人均離職

      頭條要聞

      副部級高官任上落馬 十天前仍參加省政協(xié)會(huì)議

      頭條要聞

      副部級高官任上落馬 十天前仍參加省政協(xié)會(huì)議

      體育要聞

      全球第二大車企,也救不了這支德甲隊(duì)?

      娛樂要聞

      陳牧馳陳冰官宣得子 曬一家三口握拳照

      財(cái)經(jīng)要聞

      Kimi、Minimax 們的算力荒

      汽車要聞

      嵐圖泰山X8配置曝光 四激光雷達(dá)/華為新一代座艙

      態(tài)度原創(chuàng)

      教育
      旅游
      健康
      本地
      時(shí)尚

      教育要聞

      “家破成這樣,還好意思拍視頻?”家長曬學(xué)霸孩子,反被嘲太邋遢

      旅游要聞

      【春游記】東北“報(bào)春第一花”冰上綻放

      干細(xì)胞抗衰4大誤區(qū),90%的人都中招

      本地新聞

      在濰坊待了三天,沒遇到一個(gè)“濰坊人”

      和田曦薇一樣嫩嘟嘟,這3個(gè)變美技巧你一定不能錯(cuò)過!

      無障礙瀏覽 進(jìn)入關(guān)懷版