<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      黃仁勛GTC演講全文:推理時代到來,不想被淘汰,馬上行動起來……

      0
      分享至


      剛剛黃仁勛在GTC2026大會上兩個多小時的演講,刷屏了整個科技圈。

      很多人看完,都在聊1萬億美元的營收預期,聊2年350倍性能躍升的Vera Rubin系統。

      但我要告訴你:這些都不是這場演講里,最顛覆、最和你息息相關的內容。

      真正決定未來3年,你的企業能不能活下去、你的職場之路能不能往上走的,是黃仁勛花了近三分之一篇幅講的智能體革命,以及他那句石破天驚的判斷:智能體(Agent)會完全改變企業和每個人的工作方式。

      在這場被視為“AI行業年度朝圣”的大會上,黃仁勛闡述了英偉達從一家“芯片公司”向“AI基礎設施和工廠公司”的蛻變。面對市場最關心的業績持續性與增長空間問題,黃仁勛詳細拆解了驅動未來增長的底層商業邏輯——“Token工廠經濟學”。

      01
      業績指引極度樂觀, “2027年至少1萬億美元的需求”

      過去兩年,全球AI計算需求呈指數級爆炸。隨著大模型從“感知”、“生成”進化到“推理”與“行動(執行任務)”,算力的消耗量急劇攀升。針對市場高度關注的訂單與營收天花板,黃仁勛給出了極為強勁的預期。

      黃仁勛在演講中直言:

      去年這個時候,我說過,我們看到了5000億美元的高確信度需求,覆蓋Blackwell和Rubin直到2026年。現在,就在此時此地,我看到到2027年至少有1萬億美元的需求(at least $1 trillion)。


      黃仁勛的萬億預期一度推動英偉達股價漲超4.3%。


      不僅如此,他更是對這一數字做出了補充:

      這合理嗎?這就是我接下來要講的。事實上,我們甚至會供不應求。我確定,實際的計算需求會比這高得多。

      黃仁勛指出,如今的英偉達系統已經證明了自己是全球“成本最低的基礎設施”。由于英偉達能運行幾乎所有領域的AI模型,這種通用性使得客戶投入的這1萬億美元能夠被充分利用并保持長久的生命周期。

      目前,英偉達60%的業務來自排名前五的超大型云服務商,而另外40%的業務則廣泛分布于主權云、企業、工業、機器人和邊緣計算等各個領域。

      02

      Token工廠經濟學, 每瓦性能決定商業命脈

      為了解釋這1萬億需求的合理性,黃仁勛向全球企業CEO展示了一套全新的商業思維。他指出,未來的數據中心不再是存儲文件的倉庫,而是生產Token(AI生成的基本單位)的“工廠”。


      黃仁勛強調:

      每一座數據中心、每一座工廠,從定義上來說都是受電力限制的。一座1GW(吉瓦)的工廠永遠不會變成2GW,這是物理和原子的定律。在固定的功率下,誰的每瓦Token吞吐量最高,誰的生產成本就最低。

      黃仁勛將未來的AI服務分為以下商業層級:

      免費層(高吞吐、低速度) 中級層(~每百萬token 3美元) 高級層(~每百萬token 6美元) 高速層(~每百萬token 45美元) 超高速層(~每百萬token 150美元)

      他指出,隨著模型越來越大、上下文越來越長,AI會變得更聰明,但Token的生成速率會降低。黃仁勛表示:

      在這個Token工廠里,你的吞吐量和Token生成速度,將直接轉化為你明年的精確收入。

      黃仁勛強調英偉達的架構能夠讓客戶在免費層實現極高的吞吐量,同時在最高價值的推理層級上,將性能提升驚人的35倍。


      03

      Vera Rubin兩年實現350倍加速, Groq填補極速推理

      在這個物理極限的約束下,英偉達介紹其有史以來最復雜的AI計算系統,Vera Rubin。黃仁勛表示:

      過去提到Hopper,我會舉起一塊芯片,那很可愛。但提到Vera Rubin,大家想到的是整個系統。在這個100%液冷、完全消滅了傳統線纜的系統中,過去需要兩天安裝的機架,現在只需兩小時。

      黃仁勛指出,通過極致的端到端軟硬件協同設計,Vera Rubin在同一座1GW數據中心里創造了驚人的數據跨越:

      在短短兩年時間內,我們將Token的生成速率從2200萬提升到了7億,實現了350倍的增長。摩爾定律在同時期僅能帶來約1.5倍的提升。

      為了解決極速推理(如1000 Tokens/秒)條件下的帶寬瓶頸,英偉達給出了整合被收購公司Groq的最終方案:非對稱式的分離推理。黃仁勛解釋:

      這兩款處理器的特點截然不同。Groq芯片擁有500MB的SRAM,而一顆Rubin芯片擁有288GB的內存。


      黃仁勛指出,英偉達通過Dynamo軟件系統,將需要海量計算和顯存的“預填充(Pre-fill)”階段交給Vera Rubin,將對延遲極度敏感的“解碼”階段交給Groq。黃仁勛還對企業算力配置給出了建議:

      如果你的工作主要是高吞吐,100%使用Vera Rubin;如果你有大量高價值的編程級別的Token生成需求,拿出25%的數據中心規模給Groq。

      據透露,由三星代工的Groq LP30芯片已在量產,預計第三季度出貨,而首個Vera Rubin機架已在微軟Azure云上運行。

      此外,針對光互聯技術,黃仁勛展示了全球首款量產的共封裝光學(CPO)交換機Spectrum X,并平息了市場對于“銅退光進”的路線之爭:

      我們需要更多的銅纜產能,更多的光芯片產能,更多的CPO產能。

      04

      Agent終結傳統SaaS, “年薪+Token”成硅谷標配

      除了硬件壁壘,黃仁勛把大量篇幅留給了AI軟件和生態的革命,特別是Agent(智能體)的爆發。

      他將開源項目OpenClaw形容為“人類歷史上最受歡迎的開源項目”,稱其僅用幾周時間就超越了Linux在過去30年取得的成就。黃仁勛直言,OpenClaw本質上就是Agent計算機的“操作系統”。

      黃仁勛斷言:

      每一個SaaS(軟件即服務)公司都將變成AaaS(Agent-as-a-Service,智能體即服務)公司。毫無疑問,為了讓這種具備訪問敏感數據和執行代碼能力的智能體安全落地,英偉達推出了企業級的NeMo Claw參考設計,增加了策略引擎和隱私路由器。

      對于普通職場人,這場變革同樣近在咫尺。黃仁勛描繪了未來的職場新形態:

      在未來,我們公司的每一位工程師都需要一個年度Token預算。他們的基礎年薪可能是幾十萬美元,我會在此基礎上再拿出大約一半的金額作為Token額度給他們,讓他們實現10x的效率提升。這已經是硅谷的新招聘籌碼了:你的offer里帶多少Token?

      演講最后,黃仁勛還“劇透”了下一代計算架構Feynman,它將首次實現銅線與CPO的共同水平擴展。更引人遐想的是,英偉達正在研發部署在太空的數據中心計算機“Vera Rubin Space-1”,徹底打開了AI算力向地球之外延伸的想象空間。

      黃仁勛GTC 2026演講全文,全文翻譯如下(AI工具輔助):

      主持人: 歡迎英偉達創始人兼首席執行官黃仁勛上臺。

      黃仁勛,創始人兼首席執行官:

      歡迎來到GTC。我想提醒大家,這是一場技術大會。能看到這么多人一大早排隊入場,能看到在座的各位,我感到非常高興。

      在GTC,我們將聚焦三大主題:技術、平臺和生態系統。英偉達目前擁有三大平臺:CUDA-X平臺、系統平臺,以及我們最新推出的AI工廠平臺。

      在正式開始之前,我要感謝我們的預熱環節主持人——Conviction的Sarah Guo、紅杉資本的Alfred Lin(英偉達的第一位風險投資人),以及英偉達的第一位主要機構投資人Gavin Baker。這三位對技術有深刻的洞見,在整個技術生態系統中擁有極廣的影響力。當然,我還要感謝今天所有我親自邀請出席的貴賓們。感謝這支全明星團隊。

      我同樣要感謝今天到場的所有企業。英偉達是一家平臺公司,我們擁有技術、平臺和豐富的生態系統。今天到場的企業代表了價值100萬億美元行業中幾乎全部的參與者,共有450家公司贊助了本次活動,在此深表感謝。

      本次大會共設有1,000場技術論壇、2,000位演講嘉賓,將覆蓋人工智能"五層蛋糕"架構的每一個層級——從土地、電力與機房等基礎設施,到芯片、平臺、模型,以及最終推動整個行業騰飛的各類應用。

      CUDA:二十年的技術積淀

      一切的起點,就在這里。今年是CUDA誕生二十周年。

      二十年來,我們始終致力于這一架構的研發。CUDA是一項革命性的發明——SIMT(單指令多線程)技術允許開發者以標量代碼編寫程序,并將其擴展為多線程應用,其編程難度遠低于此前的SIMD架構。我們最近還新增了Tiles功能,幫助開發者更便捷地編程張量核心(Tensor Core),以及當今人工智能所依賴的各類數學運算結構。目前,CUDA已擁有數千種工具、編譯器、框架和庫,在開源社區中存在數十萬個公開項目,并已深度集成到每一個技術生態系統之中。

      這張圖表揭示了英偉達100%的戰略邏輯,我從最初就一直在講這張幻燈片。其中最難實現、也是最核心的要素,是圖表底部的"裝機量"。歷經二十年,我們已在全球范圍內積累了數億塊運行CUDA的GPU和計算系統。

      我們的GPU覆蓋所有云平臺,服務于幾乎所有計算機廠商和行業。CUDA龐大的裝機量,正是這個飛輪不斷加速的根本原因。裝機量吸引開發者,開發者創造新算法并取得突破,突破催生全新市場,新市場形成新生態并吸引更多企業加入,進而擴大裝機量——這個飛輪正在持續加速。

      英偉達庫的下載量正以驚人的速度增長,規模龐大且增速不斷提升。這個飛輪使我們的計算平臺能夠支撐海量應用和層出不窮的新突破。

      更重要的是,它還賦予了這些基礎設施極長的使用壽命。原因顯而易見:NVIDIA CUDA上可運行的應用極為豐富,涵蓋AI生命周期的每個階段、各類數據處理平臺,以及各種科學原理求解器。因此,一旦安裝了英偉達GPU,其實際使用價值極高。這也是為何我們六年前發布的Ampere架構GPU,其云端價格反而在上漲。

      這一切的根本原因在于:裝機量龐大,飛輪強勁,開發者生態廣泛。當這些因素共同發揮作用,加之我們持續更新軟件,計算成本便會不斷下降。加速計算在大幅提升應用性能的同時,隨著我們長期維護和迭代軟件,用戶不僅能在初期獲得性能躍升,還能持續享受計算成本的下降。我們愿意為全球每一塊GPU提供長期支持,因為它們在架構上完全兼容。

      我們之所以愿意這樣做,是因為裝機量如此龐大——每發布一次新的優化,便能惠及數百萬用戶。這種動態組合,使得英偉達架構在持續擴大覆蓋范圍、加速自身成長的同時,不斷壓低計算成本,最終刺激新的增長。CUDA是這一切的核心。

      從GeForce到CUDA:二十五年的演進之路

      而我們與CUDA的旅程,實際上早在二十五年前就已開始。

      GeForce——相信在座有很多人是伴隨著GeForce長大的。GeForce是英偉達最成功的市場推廣項目。我們從你們還買不起產品的時候就開始培養未來的客戶——是你們的父母代替你們成為了英偉達最早的用戶,年復一年地購買我們的產品,直到有一天,你們成長為優秀的計算機科學家,成為真正意義上的客戶和開發者。

      這是二十五年前GeForce奠定的基業。二十五年前,我們發明了可編程著色器——這是讓加速器實現可編程化的一項顯而易見卻意義深遠的發明,也是世界上第一款可編程加速器,即像素著色器。這五年后,我們創造了CUDA——這是我們有史以來最重要的投資之一。當時公司財力有限,但我們將絕大部分利潤押注于此,致力于將CUDA從GeForce延伸到每一臺計算機。我們之所以如此堅定,是因為我們深信其潛力。盡管初期歷經艱辛,公司堅守這一信念長達13代、整整二十年,如今CUDA已無處不在。

      正是像素著色器推動了GeForce的革命。而大約八年前,我們推出了RTX——為現代計算機圖形時代對架構進行了全面革新。GeForce將CUDA帶給了全世界,也正因如此,讓Alex Krizhevsky、Ilya Sutskever、Geoffrey Hinton、Andrew Ng等眾多學者發現,GPU可以成為加速深度學習的利器,由此點燃了十年前人工智能的大爆炸。

      十年前,我們決定將可編程著色與兩個全新理念相融合:一是硬件光線追蹤(Ray Tracing),這在技術上極具挑戰;二是一個當時頗具前瞻性的想法——大約十年前,我們就預見到AI將徹底變革計算機圖形。正如GeForce將AI帶給了全世界,AI如今也將反過來重塑整個計算機圖形的實現方式。

      今天,我要向大家展示未來。這是我們的下一代圖形技術,我們稱之為神經渲染(Neural Rendering)——3D圖形與人工智能的深度融合。這就是DLSS 5,請看。

      神經渲染:結構化數據與生成式AI的融合

      這是不是令人嘆為觀止?計算機圖形就此煥發生機。

      我們做了什么?我們將可控的3D圖形(虛擬世界的真實基礎)與其結構化數據相結合,再融入生成式AI和概率計算。一個完全確定性,另一個概率性卻高度逼真——我們將這兩種理念融為一體,通過結構化數據實現精準可控,同時進行實時生成。最終,內容既美觀驚艷,又完全可控。

      結構化信息與生成式AI融合這一理念,將在一個又一個行業中不斷復現。結構化數據是可信AI的基石。

      結構化數據與非結構化數據的加速平臺

      現在我要帶大家看一張技術架構圖。

      結構化數據——大家熟悉的SQL、Spark、Pandas、Velox,以及Snowflake、Databricks、Amazon EMR、Azure Fabric、Google BigQuery等重要平臺,都在處理數據框(Data Frame)。這些數據框就像巨型電子表格,承載著商業世界的全部信息,是企業計算的基本事實(Ground Truth)。

      在AI時代,我們需要讓AI來使用結構化數據,并對其實現極致加速。過去,加速結構化數據處理是為了讓企業更高效地運轉。而未來,AI將以遠超人類的速度使用這些數據結構,AI智能體也將大量調用結構化數據庫。

      非結構化數據方面,向量數據庫、PDF、視頻、音頻等構成了世界上絕大多數的數據形態——每年生成的數據中,約90%是非結構化數據。過去,這些數據幾乎完全無法被利用:我們讀取它們,存入文件系統,僅此而已。我們無法查詢,也難以檢索,原因在于非結構化數據缺乏簡單的索引方式,必須理解其含義與語境。而現在,AI可以做到這一點——借助多模態感知與理解技術,AI能夠讀取PDF文檔、理解其含義,并將其嵌入可供查詢的更大結構之中。

      英偉達為此創建了兩個基礎庫:

      cuDF:用于數據框、結構化數據的加速處理

      cuVS:用于向量存儲、語義數據和非結構化AI數據的處理

      這兩個平臺將成為未來最重要的基礎平臺之一。

      今天,我們宣布與多家企業達成合作。IBM——SQL語言的發明者,將使用cuDF加速其WatsonX Data平臺。Dell與我們聯合打造了Dell AI數據平臺,整合cuDF與cuVS,并在NTT Data的實際項目中實現了大幅性能提升。Google Cloud方面,我們現在不僅加速Vertex AI,還加速BigQuery,并與Snapchat合作將其計算成本降低了近80%。

      加速計算帶來的好處是三位一體的:速度、規模、成本。這與摩爾定律的邏輯一脈相承——通過加速計算實現性能飛躍,同時持續優化算法,讓所有人都能享受到持續下降的計算成本。

      英偉達構建了加速計算平臺,其上匯聚了眾多庫:RTX、cuDF、cuVS等等。這些庫整合進全球云服務和OEM體系,共同觸達全球用戶。

      與云服務商的深度合作

      與主要云服務商的合作

      Google Cloud:我們加速Vertex AI和BigQuery,與JAX/XLA深度集成,同時在PyTorch上表現卓越——英偉達是全球唯一一家在PyTorch和JAX/XLA上均表現出色的加速器。我們將Base10、CrowdStrike、Puma、Salesforce等客戶引入Google Cloud生態。

      AWS:我們加速EMR、SageMaker和Bedrock,與AWS有著深度集成。今年令我格外興奮的是,我們將把OpenAI引入AWS,這將大幅推動AWS云計算的消耗增長,幫助OpenAI擴展區域部署和計算規模。

      Microsoft Azure:英偉達100 PFLOPS超算是我們構建的第一臺超級計算機,也是第一臺部署在Azure上的超算,這奠定了與OpenAI合作的重要基礎。我們加速Azure云服務和AI Foundry,合作推進Azure區域擴展,并在Bing搜索上深度協作。值得一提的是,我們的**保密計算(Confidential Computing)**能力——確保即便是運營商也無法查看用戶數據和模型——英偉達GPU是全球首批支持保密計算的GPU,可支持OpenAI和Anthropic模型在全球各地區云環境中的保密部署。以Synopsys為例,我們加速其全部EDA和CAD工作流,并部署于Microsoft Azure。

      Oracle:我們是Oracle的第一個AI客戶,我為能夠第一次向Oracle解釋AI云的概念感到自豪。此后他們發展迅猛,我們也為其引入了Cohere、Fireworks、OpenAI等眾多合作伙伴。

      CoreWeave:全球第一家AI原生云,專為GPU托管和AI云服務而生,擁有出色的客戶群,增長勢頭強勁。

      Palantir + Dell:三方聯合打造了全新的AI平臺,基于Palantir的本體論平臺(Ontology Platform)和AI平臺,可在任何國家、任何氣隙隔離環境下、完全本地化地部署AI——從數據處理(向量化或結構化)到AI的完整加速計算棧,無所不包。

      英偉達與全球云服務商建立了這種特殊的合作關系——我們將客戶引入云端,這是一種互利共贏的生態。

      垂直整合,橫向開放:英偉達的核心戰略

      英偉達是全球第一家垂直整合、橫向開放的公司。

      這一模式的必要性非常簡單:加速計算不是芯片問題,也不是系統問題,其完整表述應為應用加速。CPU可以讓計算機整體運行得更快,但這條路已走到瓶頸。未來,唯有通過應用或領域特定的加速,才能持續帶來性能飛躍和成本下降。

      這正是英偉達必須深耕一個又一個庫、一個又一個領域、一個又一個垂直行業的原因。我們是一家垂直整合的計算公司,沒有其他路可走。我們必須理解應用,理解領域,深刻理解算法,并能夠將其部署在任何場景下——數據中心、云端、本地、邊緣乃至機器人系統。

      同時,英偉達保持橫向開放,愿意將技術整合進任何合作伙伴的平臺,讓全世界都能享受到加速計算的紅利。

      本屆GTC的參會者結構充分體現了這一點。本次參會者中,金融服務行業的比例最高——希望來的是開發者,不是交易員。我們的生態系統覆蓋了上游和下游供應鏈。無論是成立50年、70年還是150年的企業,去年都迎來了歷史最佳年份。我們正處于某件非常、非常重大的事情的起點。

      CUDA-X:各行業的加速計算引擎

      在各個垂直領域,英偉達均已深度布局:

      自動駕駛:覆蓋范圍廣泛,影響深遠

      金融服務:量化投資正從人工特征工程轉向超級計算機驅動的深度學習,迎來其"Transformer時刻"

      醫療健康:正在迎來屬于自己的"ChatGPT時刻",涵蓋AI輔助藥物發現、AI智能體支持診斷、醫療客服等方向

      工業:全球規模最大的建設浪潮正在展開,AI工廠、芯片廠、數據中心廠紛紛落地

      娛樂與游戲:實時AI平臺支持翻譯、直播、游戲互動,以及智能購物代理

      機器人:深耕十余年,三大計算機架構(訓練計算機、仿真計算機、機載計算機)齊備,本次展會共有110款機器人亮相

      電信:約2萬億美元規模的行業,基站將從單一通信功能演進為AI基礎設施平臺,相關平臺名為Aerial,與諾基亞、T-Mobile等企業均有深度合作

      以上所有領域的核心,正是我們的CUDA-X庫——這是英偉達作為算法公司的根本所在。這些庫是公司最核心的資產,讓計算平臺得以在各個行業發揮實際價值。

      其中最重要的庫之一,是cuDNN(CUDA深度神經網絡庫),它徹底革新了人工智能,引發了現代AI的大爆炸。

      大家剛才看到的一切都是仿真——包括基于物理原理的求解器、AI代理物理模型,以及物理AI機器人模型。一切均為仿真,沒有任何手工動畫或關節綁定。這正是英偉達的核心能力所在:通過對算法的深刻理解與計算平臺的有機結合,解鎖這些機遇。

      AI原生企業與新計算時代

      你們剛才看到了沃爾瑪、歐萊雅、摩根大通、羅氏、豐田等定義當今社會的行業巨頭,也有一大批大家從未聽說過的公司——我們稱之為AI原生企業。這份名單極為龐大,里面有OpenAI、Anthropic,以及眾多服務于不同垂直領域的新興企業。

      過去兩年,這一行業經歷了驚人的騰飛。風險投資流入初創企業的資金規模達到1,500億美元,創人類歷史之最。更重要的是,單筆投資規模首次從數百萬美元躍升至數億乃至數十億美元。原因只有一個:這是史上第一次,每一家此類公司都需要大量計算資源和大量token。這個行業正在創造、生成token,或者為來自Anthropic、OpenAI等機構的token增值。

      正如PC革命、互聯網革命、移動云革命各自孕育出一批劃時代的企業,這一代計算平臺變革同樣將誕生一批極具影響力的公司,成為未來世界的重要力量。

      推動這一切的三大歷史性突破

      過去兩年究竟發生了什么?三件大事。

      第一:ChatGPT,開啟生成式AI時代(2022年底至2023年)

      它不僅能感知和理解,還能生成獨特內容。我展示了生成式AI與計算機圖形的融合。生成式AI從根本上改變了計算的方式——計算從檢索式轉變為生成式,這深刻影響著計算機架構、部署方式和整體意義。

      第二:推理AI(Reasoning AI),以o1為代表

      推理能力使AI能夠自我反思、規劃、分解問題——將它無法直接理解的問題拆解為可處理的步驟。o1讓生成式AI變得可信,能夠依據真實信息進行推理。為此,輸入context的token量和用于思考的輸出token量大幅增加,計算量隨之顯著提升。

      第三:Claude Code,首個智能體模型

      它能讀取文件、編寫代碼、編譯、測試、評估并迭代。Claude Code徹底革新了軟件工程——英偉達100%的工程師都在使用Claude Code、Codex和Cursor中的一種或多種,沒有一位軟件工程師不借助AI助力。

      這是一個全新的拐點——你不再是詢問AI"是什么、在哪里、怎么做",而是讓它"創建、執行、構建",讓它主動使用工具、讀取文件、分解問題、付諸行動。AI從感知,到生成,到推理,再到如今真正能夠完成工作。

      過去兩年,推理所需的計算量增長了約10,000倍,使用量增長了約100倍。我一直認為,過去兩年計算需求增長了100萬倍——這是所有人的共同感受,是OpenAI的感受,是Anthropic的感受。如果能獲得更多算力,就能生成更多token,收入就會提升,AI就會變得更智能。推理拐點已然到來。

      萬億美元的AI基礎設施時代

      去年此時,我在這里表示,我們對Blackwell和Rubin在2026年之前的需求和采購訂單有高度信心,規模約為5,000億美元。今天,在GTC一年之后,我站在這里告訴大家:展望到2027年,我看到的數字至少是1萬億美元。而且我確信,實際的計算需求將遠不止于此。

      2025:英偉達推理年

      2025年是英偉達的推理年(Year of Inference)。我們希望確保,在訓練和后訓練之外,也能在AI生命周期的每個階段都保持卓越,使已投資的基礎設施能夠持續高效運轉,且有效使用壽命越長,單位成本越低。

      與此同時,Anthropic和Meta正式加入NVIDIA平臺,與此共同代表了全球三分之一的AI算力需求。開源模型已接近前沿水平,無處不在。

      英偉達是目前全球唯一一個能夠運行所有AI領域——語言、生物學、計算機圖形、計算機視覺、語音、蛋白質與化學、機器人等——所有AI模型的平臺,無論邊緣還是云端,無論何種語言。英偉達架構對所有這些場景均具備通用性,這使我們成為成本最低、置信度最高的平臺。

      目前,英偉達60%的業務來自全球前五大超大規模云服務商,剩余40%遍布區域云、主權云、企業、工業、機器人、邊緣計算等各個領域。AI的覆蓋廣度本身就是其韌性所在——這毫無疑問是一次全新的計算平臺變革。

      Grace Blackwell與NVLink 72:大膽的架構革新

      在Hopper架構還處于鼎盛時期,我們就決定徹底重新架構系統,將NVLink從8路擴展為NVLink 72,對計算系統進行全面分解重構。Grace Blackwell NVLink 72是一次巨大的技術押注,對所有合作伙伴而言都不容易,在此向所有人表示誠摯感謝。

      同時,我們推出了NVFP4——不只是普通的FP4,而是一種全新類型的張量核心和計算單元。我們已經證明,NVFP4可以在無精度損失的情況下實現推理,同時帶來巨大的性能提升和能效提升,并且同樣適用于訓練。此外,Dynamo和TensorRT-LLM等一系列新算法相繼問世,我們甚至為優化內核而專門投入數十億美元建造了一臺超級計算機,稱之為DGX Cloud。

      結果證明,我們的推理性能令人矚目。來自Semi Analysis的數據——這是迄今為止最全面的AI推理性能評測——顯示英偉達在每瓦token數和每token成本兩個維度上均遙遙領先。原本摩爾定律可能給H200帶來1.5倍的性能提升,但我們做到了35倍。Semi Analysis的Dylan Patel甚至說:"黃仁勛保守了,實際上是50倍。"他說得沒錯。

      我在此援引他的話:"Jensen sandbagged(黃仁勛保守報數)。"

      英偉達的每token成本是全球最低,目前無人能及。原因正在于極致協同設計(Extreme Co-design)。

      以Fireworks為例,在英偉達更新全套軟件和算法之前,其平均token速度約為每秒700個;更新后接近每秒5,000個,提升約7倍。這就是極致協同設計的力量。

      AI工廠:從數據中心到token工廠

      數據中心過去是存儲文件的地方,現在它是生產token的工廠。每一家云服務商、每一家AI公司,未來都將以"token工廠效率"作為核心經營指標。

      這是我的核心論點:

      縱軸:吞吐量(Throughput)——在固定功率下每秒生成的token數

      橫軸:交互速度(Token Speed)——每次推理的響應速度,速度越快,可使用的模型越大、context越長,AI越智能

      token是新的大宗商品,一旦成熟,將分層定價:

      免費層(高吞吐、低速度)

      中級層(~每百萬token 3美元)

      高級層(~每百萬token 6美元)

      高速層(~每百萬token 45美元)

      超高速層(~每百萬token 150美元)

      與Hopper相比,Grace Blackwell在最高價值層提升了35倍吞吐量,并引入全新層級。以簡化模型估算,將25%功率分別分配給四個層級,Grace Blackwell可比Hopper多產生5倍的收入。

      Vera Rubin:下一代AI計算系統

      (播放Vera Rubin系統介紹視頻)

      Vera Rubin是一個完整的、端到端優化的系統,專為智能體(Agentic)工作負載設計:

      大型語言模型計算核心:NVLink 72 GPU集群,處理前填充(Prefill)和KV Cache

      全新Vera CPU:專為極高單線程性能設計,采用LPDDR5內存,兼具卓越能效,是全球唯一使用LPDDR5的數據中心CPU,適合AI智能體工具調用

      存儲系統:BlueField 4 + CX 9,面向AI時代的全新存儲平臺,全球存儲行業100%加入

      CPO Spectrum X交換機:全球首款共封裝光學以太網交換機,已全面量產

      Kyber機架:全新機架系統,支持144塊GPU組成單一NVLink域,前端計算、后端NVLink交換,形成一臺巨型計算機

      Rubin Ultra:下一代超算節點,豎插式設計,配合Kyber機架,支持更大規模NVLink互聯

      Vera Rubin已100%液冷,安裝時間從兩天縮短至兩小時,采用45°C熱水冷卻,大幅降低數據中心冷卻壓力。這次Satya(納德拉)已發文確認,首臺Vera Rubin機架已在微軟Azure上線運行,我為此深感振奮。

      Groq整合:推理性能的極致延伸

      我們收購了Groq團隊并獲得其技術授權。Groq是一種確定性數據流處理器(Deterministic Dataflow Processor),采用靜態編譯和編譯器調度,擁有大量SRAM,專為推理單一工作負載優化,具備極低延遲和極高token生成速度。

      然而,Groq的內存容量有限(500MB片上SRAM),難以獨立承載大模型的參數和KV Cache,限制了其大規模應用。

      解決方案正是Dynamo——一套推理調度軟件。我們通過Dynamo將推理管線解聚(Disaggregate):

      **前填充(Prefill)及注意力機制的解碼(Decode)**在Vera Rubin上完成(需要大量算力和KV Cache存儲)

      **前饋網絡解碼(Feed-Forward Network Decode)**即token生成部分,在Groq上完成(需要極高帶寬和低延遲)

      兩者通過以太網緊密耦合,借助特殊模式將延遲減少約一半。在Dynamo這一"AI工廠操作系統"的統一調度下,整體性能提升35倍,并開辟了NVLink 72此前無法觸及的全新推理性能層級。

      Groq與Vera Rubin的組合建議:

      若工作負載以高吞吐為主,使用100% Vera Rubin

      若大量工作負載為代碼生成等高價值token生成,可引入Groq,建議比例約為25% Groq + 75% Vera Rubin

      Groq LP30由三星代工,目前已進入量產,預計Q3開始出貨。感謝三星的全力配合。

      推理性能的歷史性飛躍

      將此前技術進步量化:在2年時間內,1吉瓦AI工廠的token生成速率將從2,200萬token/秒提升至7億token/秒,提升350倍。這就是極致協同設計的力量。

      技術路線圖

      Blackwell:當前在產,Oberon標準機架系統,銅纜擴展至NVLink 72,可選光學擴展至NVLink 576

      Vera Rubin(當前):Kyber機架,NVLink 144(銅纜);Oberon機架,NVLink 72 + 光學,擴展至NVLink 576;Spectrum 6,全球首款CPO交換機

      Vera Rubin Ultra(即將推出):新一代Rubin Ultra GPU,LP35芯片(首次集成NVFP4),進一步提升數倍性能

      Feynman(下一代):全新GPU,LP40芯片(由英偉達與Groq團隊聯合打造,集成NVFP4);全新CPU——Rosa(Rosalyn);BlueField 5;CX 10;同時支持銅纜和CPO兩種擴展方式的Kyber機架

      路線圖明確:銅纜擴展、光學擴展(Scale-Up)、光學擴展(Scale-Out)三條路線并行推進,我們需要所有合作伙伴在銅纜、光纖和CPO方面持續擴產。

      NVIDIA DSX:AI工廠的數字孿生平臺

      AI工廠越來越復雜,但組成它的各類技術供應商過去從未在設計階段相互協作,直到在數據中心才"相遇"——這顯然不夠。

      為此,我們創建了Omniverse,以及基于其上的NVIDIA DSX平臺——一個供所有合作伙伴在虛擬世界中共同設計和運營吉瓦級AI工廠的平臺。DSX提供:

      機架級機械、熱學、電氣、網絡仿真系統

      與電網的連接,實現協同節能調度

      數據中心內基于Max-Q的動態功耗和冷卻優化

      保守估計,這套系統可將能源利用效率提升約2倍,在我們談論的規模上,這是非常可觀的收益。Omniverse從數字地球開始,將承載各種規模的數字孿生,我們正與全球合作伙伴共同構建人類歷史上最大的計算機。

      此外,英偉達正在進軍太空。Thor芯片已通過輻射認證,正在衛星中運行。我們正與合作伙伴開發Vera Rubin Space-1,用于建設太空數據中心。在太空中只能依靠輻射散熱,熱管理是核心挑戰,我們正集結頂尖工程師攻關。

      OpenClaw:智能體時代的操作系統

      Peter Steinberger開發了一款名為OpenClaw的軟件。這是人類歷史上最受歡迎的開源項目,在短短幾周內便超越了Linux三十年的成就。

      OpenClaw本質上是一個智能體系統(Agentic System),能夠:

      管理資源,訪問工具、文件系統和大型語言模型;執行調度、定時任務;將問題逐步分解,并調用子智能體;支持任意模態的輸入輸出(語音、視頻、文字、郵件等)。

      用操作系統的語法來描述,它確實就是一個操作系統——智能體計算機的操作系統。Windows讓個人計算機成為可能,OpenClaw讓個人智能體成為可能。

      每一家企業都需要制定自己的OpenClaw戰略,正如我們都需要Linux策略、HTML策略、Kubernetes策略一樣。

      企業IT的全面重塑

      OpenClaw之前的企業IT:數據和文件進入系統,流經工具和工作流,最終變成供人類使用的工具。軟件公司創建工具,系統集成商(GSI)和咨詢公司幫助企業使用這些工具。

      OpenClaw之后的企業IT:每一家SaaS公司都將轉變為AaaS(Agentic as a Service,智能體即服務)公司——不只是提供工具,而是提供專精特定領域的AI智能體。

      但這里有一個關鍵挑戰:企業內部的智能體可以訪問敏感數據、執行代碼、與外部通信。這在企業環境中必須得到嚴格管控。

      為此,我們與Peter合作,將安全性融入企業級版本,推出了:

      NeMo Claw(參考設計):基于OpenClaw的企業級參考框架,集成NVIDIA的全套智能體AI工具包

      Open Shield(安全層):已集成至OpenClaw,提供策略引擎、網絡護欄、隱私路由,確保企業數據安全

      NeMo Cloud:可下載使用,并與所有SaaS企業的策略引擎對接

      這是企業IT的文藝復興,一個原本2萬億美元規模的產業,即將成長為數萬億美元規模,從提供工具轉向提供專業化的AI智能體服務。

      我完全可以預見:未來,公司里的每一位工程師都將擁有年度token預算。他們年薪可能是幾十萬美元,我會額外給他們相當于薪資一半的token配額,讓他們的產出放大10倍。"入職附帶多少token配額"已經成為硅谷的新晉招聘話題。

      每一家企業未來都將既是token的使用者(供工程師使用),也是token的生產者(為其客戶提供服務)。OpenClaw的意義不可低估,它和HTML、Linux一樣重要。

      NVIDIA開放模型倡議

      在自定義智能體(Custom Claw)方面,我們提供了NVIDIA自研的前沿模型:

      模型領域Nemotron大型語言模型Cosmos世界基礎模型(World Foundation Model)GROOT通用人形機器人模型Alpamayo自動駕駛BioNeMo數字生物學Phys-AIAI物理

      我們在每一個領域都處于技術前沿,并承諾持續迭代——Nemotron 3之后有Nemotron 4,Cosmos 1之后有Cosmos 2,Groq也將迭代到第二代。

      Nemotron 3在OpenClaw中名列全球三大最佳模型之列,處于前沿水平。Nemotron 3 Ultra將成為有史以來最強的基礎模型,支持各國構建主權AI。

      今天,我們宣布成立Nemotron聯盟,投資數十億美元推進AI基礎模型研發。聯盟成員包括:BlackForest Labs、Cursor、LangChain、Mistral、Perplexity、Reflection、Sarvam(印度)、Thinking Machines(Mira Murati的實驗室)等。一個又一個企業軟件公司加入,將NeMo Claw參考設計和NVIDIA智能體AI工具包整合到自身產品中。

      物理AI與機器人

      數字智能體在數字世界中行動——撰寫代碼、分析數據;而物理AI則是具身化的智能體,也就是機器人。

      本次GTC共有110款機器人亮相,幾乎囊括了全球所有機器人研發企業。英偉達提供三臺計算機(訓練計算機、仿真計算機、機載計算機)和完整的軟件棧及AI模型。

      自動駕駛方面,自動駕駛的"ChatGPT時刻"已經到來。今天,我們宣布四家新合作伙伴加入英偉達RoboTaxi Ready平臺:比亞迪、現代、日產、吉利,合計年產量1,800萬輛。加上此前的奔馳、豐田、通用,陣容進一步壯大。我們同時宣布與Uber達成重大合作,將在多個城市部署并接入RoboTaxi Ready車輛。

      工業機器人方面,ABB、Universal Robotics、KUKA等眾多機器人企業與我們合作,將物理AI模型與仿真系統相結合,推動機器人在全球制造產線的落地。

      電信方面,卡特彼勒(Caterpillar)和T-Mobile也在其列。未來,無線基站將不再只是一個通信節點,而是一個NVIDIA Aerial AI RAN——能夠實時感知流量、調整波束成形,實現節能增效的智能化邊緣計算平臺。

      特別環節:Olaf機器人亮相

      (播放Disney Olaf機器人演示視頻)

      黃仁勛: 雪人登場!Newton運行正常!Omniverse也運行正常!Olaf,你好嗎?

      Olaf: 見到你我真的太開心了。

      黃仁勛: 是的,因為是我給了你計算機——Jetson!

      Olaf: 那是什么?

      黃仁勛: 就在你的肚子里。

      Olaf: 太神奇了。

      黃仁勛: 你是在Omniverse里學會走路的。

      Olaf: 我喜歡走路。這比騎馴鹿仰望美麗的天空好多了。

      黃仁勛: 這正是因為物理仿真——基于NVIDIA Warp運行的Newton求解器,這是我們與Disney和DeepMind聯合開發的,讓你能夠適應真實的物理世界。

      Olaf: 我正想說這個。

      黃仁勛: 這就是你聰明的地方。我是雪人,不是雪球。

      黃仁勛: 你能想象嗎?未來的迪士尼樂園——所有這些機器人角色在園區里自由漫步。不過說實話,我以為你會更高一些。我從沒見過這么矮的雪人。

      Olaf: (不置可否)

      黃仁勛: 來幫我結束今天的演講好嗎?

      Olaf: 太棒啦!

      主題演講總結

      黃仁勛:今天,我們共同探討了以下核心主題:

      推理拐點的到來:推理已成為AI最核心的工作負載,token是新的大宗商品,推理性能直接決定收入

      AI工廠時代:數據中心已從文件存儲設施演變為token生產工廠,未來每家公司都將以"AI工廠效率"來衡量自身競爭力

      OpenClaw智能體革命:OpenClaw開啟了智能體計算時代,企業IT正在從工具時代走向智能體時代,每家企業都需要制定OpenClaw戰略

      物理AI與機器人:具身智能正在規模化落地,自動駕駛、工業機器人、人形機器人共同構成物理AI的下一個重大機遇

      感謝大家,GTC愉快!

      杰克?韋爾奇說:“你可以拒絕學習,但你的競爭對手不會!”

      2026年,我們一起走進知名企業參訪交流學習。


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      為啥全球都在打仗,亞太卻安然無恙,如果中國軍力不強,后果是啥

      為啥全球都在打仗,亞太卻安然無恙,如果中國軍力不強,后果是啥

      比利
      2026-03-19 22:54:16
      癌癥“源頭”已發現?油炸食品沒上榜,第1名大家或天天都在吃!

      癌癥“源頭”已發現?油炸食品沒上榜,第1名大家或天天都在吃!

      垚垚分享健康
      2026-03-03 13:22:06
      湖北多地公布春假安排

      湖北多地公布春假安排

      極目新聞
      2026-03-20 21:01:02
      庫克回應OpenClaw帶動Mac Mini大賣

      庫克回應OpenClaw帶動Mac Mini大賣

      界面新聞
      2026-03-21 13:02:22
      山姆被曝冷鮮豬肉是數月前屠宰,顧客質疑后“溯源信息”消失

      山姆被曝冷鮮豬肉是數月前屠宰,顧客質疑后“溯源信息”消失

      大象新聞
      2026-03-21 09:57:04
      違規走私AI服務器,超微電腦聯合創始人被捕

      違規走私AI服務器,超微電腦聯合創始人被捕

      芯智訊
      2026-03-20 12:37:54
      內塔尼亞胡:推翻伊朗政權需要“地面”戰爭

      內塔尼亞胡:推翻伊朗政權需要“地面”戰爭

      參考消息
      2026-03-21 21:46:09
      石英石臺面正退出中國家庭?醒醒!巖板、不銹鋼,用了也上當!

      石英石臺面正退出中國家庭?醒醒!巖板、不銹鋼,用了也上當!

      裝修秀
      2026-03-20 10:20:03
      蘋果折疊屏 iPhone Ultra 將延遲發售!

      蘋果折疊屏 iPhone Ultra 將延遲發售!

      XCiOS俱樂部
      2026-03-21 17:00:19
      以軍空襲伊朗德黑蘭導彈設施 美以擬加大打擊力度

      以軍空襲伊朗德黑蘭導彈設施 美以擬加大打擊力度

      煮茶煮酒煮時光Ii
      2026-03-22 01:47:40
      轟36分9助,砍27分6助,被迫又當球隊老大!你的運氣可真不太好

      轟36分9助,砍27分6助,被迫又當球隊老大!你的運氣可真不太好

      老梁體育漫談
      2026-03-21 22:53:31
      注意!這些病也能申請“殘疾證”,別白白錯過國家福利!

      注意!這些病也能申請“殘疾證”,別白白錯過國家福利!

      另子維愛讀史
      2026-03-17 22:12:15
      20萬彩禮娶回個“祖宗”!班不上、活不干,一網友哭訴只會買買買

      20萬彩禮娶回個“祖宗”!班不上、活不干,一網友哭訴只會買買買

      火山詩話
      2026-03-21 09:38:42
      美容院老板娘大實話:脫了衣服,女人的差距根本不在臉上!

      美容院老板娘大實話:脫了衣服,女人的差距根本不在臉上!

      夜深愛雜談
      2026-03-08 21:28:24
      反差感拉滿!比安卡洛杉磯街頭大變樣,優雅知性美到認不出

      反差感拉滿!比安卡洛杉磯街頭大變樣,優雅知性美到認不出

      述家娛記
      2026-03-06 20:06:01
      1979年,越軍躲進山洞負隅頑抗,解放軍灌入12噸炸藥加2噸汽油,唯一幸存者說出那個數字,現場鴉雀無聲

      1979年,越軍躲進山洞負隅頑抗,解放軍灌入12噸炸藥加2噸汽油,唯一幸存者說出那個數字,現場鴉雀無聲

      起飛做故事
      2026-03-19 18:13:11
      何潔自曝養家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

      何潔自曝養家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

      扒點半吃瓜
      2026-03-10 07:00:13
      去泰國“性 旅游”?這場被誤讀的狂歡,其實挺畸形的

      去泰國“性 旅游”?這場被誤讀的狂歡,其實挺畸形的

      番外行
      2026-03-21 13:07:02
      青島跨海高鐵引熱議,網友建議改造十幾分鐘到西站真能實現?

      青島跨海高鐵引熱議,網友建議改造十幾分鐘到西站真能實現?

      天氣觀察站
      2026-03-21 19:20:32
      淪為共享單車的女色虎

      淪為共享單車的女色虎

      深度報
      2026-03-05 22:39:27
      2026-03-22 03:52:49
      跨界標桿研習社 incentive-icons
      跨界標桿研習社
      傳播名企管理經驗走進企業訪學
      1793文章數 16448關注度
      往期回顧 全部

      科技要聞

      宇樹招股書拆解,人形機器人出貨量第一!

      頭條要聞

      伊朗發射3800公里射程的導彈 最令美軍戰栗的細節披露

      頭條要聞

      伊朗發射3800公里射程的導彈 最令美軍戰栗的細節披露

      體育要聞

      誰在決定字母哥未來?

      娛樂要聞

      田栩寧終于涼了?出軌風波影響惡劣

      財經要聞

      通脹警報拉響,加息潮要來了?

      汽車要聞

      小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

      態度原創

      房產
      本地
      教育
      旅游
      軍事航空

      房產要聞

      全城狂送1000杯咖啡!網易房產【早C計劃】,即刻啟動!

      本地新聞

      春色滿城關不住|紹興春日頂流,這片櫻花海藏不住了

      教育要聞

      南師附中舉行2026年31公里步行者行動

      旅游要聞

      【花Young貴陽】春日限定!十里河灘海棠花盛開引客來

      軍事要聞

      特朗普:正考慮逐步降級對伊朗的軍事行動

      無障礙瀏覽 進入關懷版