<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      CES2026黃仁勛: 物理AI進入“ChatGPT 時刻”倒計時 | 前沿在線

      0
      分享至



      在 CES 2026 的舞臺上,黃仁勛并沒有急于用某一款產(chǎn)品“點燃情緒”。

      這場長時間的主題演講,更像一次系統(tǒng)性的時代復(fù)盤與方向校準:從 AI 平臺的根本性轉(zhuǎn)變,到 Agent 架構(gòu)、物理 AI、自動駕駛、機器人,再到算力、網(wǎng)絡(luò)、存儲與能源效率,英偉達試圖回答的不是“下一代芯片有多強”,而是——未來十年,計算與智能將如何被重新組織。



      (完整實錄見文末)

      編輯:前沿在線 編輯部

      拉斯維加斯,新年快樂。

      NVIDIA 創(chuàng)始人兼 CEO 黃仁勛一上臺就把 CES 的現(xiàn)場氛圍點燃:這個可容納 3000 人的禮堂坐滿了人,外場還有 2000 人圍觀,甚至樓上也擠滿了觀眾。



      黃仁勛笑稱,自己“帶了 15 公斤材料要講”,而全世界將有數(shù)以百萬計的人通過直播一起進入 2026 的開年第一場科技主題演講。

      但這場演講的核心并不是“熱鬧”,而是一個更明確的信號:計算產(chǎn)業(yè)又一次來到平臺重置點,而且這一次是“雙平臺轉(zhuǎn)換”同時發(fā)生。



      每 10~15 年一次平臺重置:這一次,AI 讓“軟件本身”變了

      黃仁勛把計算產(chǎn)業(yè)的歷史復(fù)盤了一遍:從主機到 PC、PC 到互聯(lián)網(wǎng)、互聯(lián)網(wǎng)到云、云到移動……每一次平臺轉(zhuǎn)換,都會帶來一次應(yīng)用世界的重寫。

      而今天發(fā)生的變化更徹底:不僅平臺在變,應(yīng)用的構(gòu)建方式也在變



      過去我們寫軟件、編譯軟件、讓軟件運行在 CPU 上;今天我們在 GPU 上運行模型,應(yīng)用不再是“預(yù)先寫好的邏輯”,而是能理解上下文、并在每一次交互中從頭生成內(nèi)容——生成每一個像素、每一個 token。

      黃仁勛用“計算五層堆棧”來概括這種變化:從硬件到系統(tǒng)到軟件再到應(yīng)用,整個堆棧正在被 AI 重新塑形。這意味著過去十多年累計的、以“經(jīng)典計算方式”為基礎(chǔ)的巨大技術(shù)資產(chǎn)——他用“十萬億美元級別”來形容——正在被整體現(xiàn)代化。

      錢從哪里來?黃仁勛給出的答案很直接:來自各行各業(yè)的研發(fā)預(yù)算遷移。經(jīng)典方法的預(yù)算正在轉(zhuǎn)向 AI 方法,這就是這波 AI 現(xiàn)代化的燃料。



      從 ChatGPT 到“推理模型”,再到 Agent:2025 的關(guān)鍵轉(zhuǎn)折已經(jīng)發(fā)生

      黃仁勛把 2025 形容為“不可思議的一年”,因為一切都像同時發(fā)生。

      他回顧了幾個關(guān)鍵節(jié)點:2015 年左右,語言模型開始真正產(chǎn)生影響;

      2017 年 Transformer 出現(xiàn);

      2022 年“ChatGPT 時刻”讓世界被喚醒;

      而一年后,一個重要的新階段到來——推理模型開始成為主角。



      他重點提到一種思路:測試時擴展(test-time scaling)。直白說,就是AI 不僅在訓(xùn)練前學(xué)習(xí)、訓(xùn)練后再用強化學(xué)習(xí)學(xué)技能;在推理階段,它也需要“實時思考”——思考越多、計算越大、答案通常越好。

      緊接著,2024~2025 年,代理系統(tǒng)(Agent)開始遍地開花:它能查找信息、做研究、使用工具、規(guī)劃未來、模擬結(jié)果,開始解決“以前不可能由一個模型獨立完成”的重要問題。

      黃仁勛還點名了一個“他很喜歡的代理工具”:Cursor。他說它徹底改變了 NVIDIA 內(nèi)部的軟件編程方式。



      AI不只有語言:物理 AI、世界模型與“開放模型的大爆發(fā)”

      黃仁勛強調(diào),大語言模型并不是宇宙中唯一重要的信息形態(tài)。只要世界里存在結(jié)構(gòu),就可以訓(xùn)練一種“語言模型式”的系統(tǒng)去理解它的表示并形成智能。

      其中最關(guān)鍵的一類,是理解自然規(guī)律的物理 AI:它不僅要理解物理定律,還要能與物理世界互動。



      而 2025 年另一個最重要的事件,是開放模型的進步與爆發(fā)。黃仁勛認為:一旦開源、開放創(chuàng)新全面啟動,智能會在任何地方激增——每個公司、每個行業(yè)、每個國家,都能同時被激活。

      他特別提到一個讓世界震驚的開放推理系統(tǒng)進展,并用“它激活了整個運動”來形容開源推理浪潮的引爆效應(yīng)。

      在他看來,開放模型已經(jīng)逼近前沿:也許仍落后幾個月,但每隔幾個月就會出現(xiàn)新一代進展,下載量呈爆炸式增長——因為創(chuàng)業(yè)公司、研究者、學(xué)生、甚至國家都想?yún)⑴c這場革命。



      NVIDIA 為什么自己建 AI 超算:DGX Cloud、開源模型與Nemo 全家桶

      黃仁勛提到,幾年前 NVIDIA 開始構(gòu)建并運營自己的 AI 超級計算機體系(DGX Cloud)。外界常問:你們要做云嗎?他的回答是否定的——它是為 NVIDIA 自己而建,用來做前沿模型研發(fā)。



      他舉了很多例子:數(shù)字生物學(xué)、蛋白質(zhì)結(jié)構(gòu)理解與生成、地球與天氣預(yù)測相關(guān)模型、以及一些“能長時間思考或快速思考”的新架構(gòu)探索。

      更關(guān)鍵的是,他強調(diào)NVIDIA 不只是開源模型,還開源訓(xùn)練這些模型的一套體系:包括用于數(shù)據(jù)處理、數(shù)據(jù)生成、訓(xùn)練、評估、護欄到部署的生命周期管理庫——他稱之為 Nemo 系列庫,并延展到物理、醫(yī)療、生物等不同領(lǐng)域版本。



      他把 NVIDIA 定位成一種“前沿 AI 模型構(gòu)建者”,并強調(diào)他們以“盡可能開放”的方式構(gòu)建,讓每家公司、每個行業(yè)、每個國家都能參與 AI 革命。



      Agent 的真正形態(tài):多模型、多云、混合部署,以及“意圖路由器”

      黃仁勛把“現(xiàn)代 AI 應(yīng)用的基本架構(gòu)”講得非常直白:未來的 AI 應(yīng)用天然就是多模態(tài)(語音、圖像、文字、視頻、3D、甚至蛋白質(zhì)),也天然是多模型的——因為不同任務(wù)需要不同模型。



      因此,它也必然是多云的、混合云的:有的模型在云端,有的要跑在企業(yè)內(nèi)網(wǎng),有的要在邊緣設(shè)備上,甚至要在醫(yī)院、基站或機器人本體旁邊跑,以獲得實時數(shù)據(jù)與低延遲。

      在這個框架里,他提出一個關(guān)鍵組件:基于意圖的模型路由器。路由器像一個“經(jīng)理”,決定哪個任務(wù)該調(diào)用哪個模型:該留在本地執(zhí)行的就留在本地,需要最強前沿模型的再去調(diào)用云端。



      他順勢給了一個輕量但完整的示例:做一個個人助理,處理日歷、郵件、待辦事項,甚至連接家里的設(shè)備。為了保護隱私,郵件相關(guān)任務(wù)可以調(diào)用本地運行的開放模型;其它任務(wù)再調(diào)用前沿模型 API。



      現(xiàn)場還演示了一個“會說話的小機器人助理”,能把待辦事項同步給 Jensen,能把草圖生成建筑渲染并做視頻導(dǎo)覽,還能遠程看家、提醒寵物不要上沙發(fā)。

      黃仁勛用一句話概括這種震撼感:幾年之前這幾乎不可想象,而現(xiàn)在“已經(jīng)變得微不足道”。



      他隨后點名了多家企業(yè)平臺合作,核心意思是:這種 Agent 架構(gòu)不僅改變開發(fā)方式,也將成為企業(yè)平臺的全新交互界面——從“填表格、點按鈕”轉(zhuǎn)向“像與人對話那樣使用系統(tǒng)”。



      下一站:物理 AI。三臺計算機、Omniverse、Isaac,以及 Cosmos 的合成數(shù)據(jù)路線

      如果說 Agent 是“軟件世界的重構(gòu)”,那黃仁勛認為,物理 AI將把 AI 從屏幕帶進真實世界。

      他強調(diào),物理 AI 的難點在于“常識”——物體恒常性、因果關(guān)系、摩擦力與重力、慣性……對孩子是常識,對 AI 卻是未知。要讓 AI 學(xué)會這些規(guī)律,必須構(gòu)建一整套系統(tǒng)。



      他用“三臺計算機”描述物理 AI 的基礎(chǔ)架構(gòu):一臺用于訓(xùn)練,一臺用于推理部署,還有一臺專門用于模擬——因為沒有模擬,就無法評估動作與世界反應(yīng)的一致性,數(shù)據(jù)也永遠不夠。

      在 NVIDIA 的體系里,模擬是核心:Omniverse 是數(shù)字孿生與基于物理的仿真世界;Isaac Sim / Isaac Lab 是機器人學(xué)習(xí)與訓(xùn)練的關(guān)鍵環(huán)境;而數(shù)據(jù)上最大的突破,是把計算變成數(shù)據(jù):通過基于物理規(guī)律的合成數(shù)據(jù)生成,規(guī)模化制造訓(xùn)練樣本,覆蓋長尾與邊緣情況。



      黃仁勛在演講中拋出了一個更強的判斷:物理 AI 的 ChatGPT 時刻即將到來。

      因為現(xiàn)實世界的數(shù)據(jù)收集太慢、太貴、永遠不夠,答案只能是合成數(shù)據(jù),而這一切在 Cosmos 上開始成型。



      自動駕駛的“推理 AI”:AlphaMyo 與端到端訓(xùn)練、可解釋駕駛

      演講的另一條重要線索,是自動駕駛。



      黃仁勛宣布了AlphaMyo,強調(diào)它是端到端訓(xùn)練的自動駕駛 AI:從攝像頭輸入到控制輸出,訓(xùn)練數(shù)據(jù)包含人類示范駕駛與 Cosmos 生成的大規(guī)模合成里程,再疊加大量精細標注樣本。



      他特別強調(diào)一個“可解釋性”的點:AlphaMyo 不只是“做動作”,它會解釋它將采取什么行動、為什么這么做,并把行動與軌跡耦合起來。

      這在長尾駕駛場景里尤其關(guān)鍵——你不可能收集世界上每一個國家、每一種極端情況的真實數(shù)據(jù),但如果能把復(fù)雜長尾拆解成若干常見的物理交互片段,推理系統(tǒng)就可能在未見過的情境下做出合理決策。



      他還談到NVIDIA 為什么做自動駕駛:因為 AI 會重塑整個計算堆棧,NVIDIA 必須理解并構(gòu)建從芯片到基礎(chǔ)設(shè)施到模型到應(yīng)用的完整系統(tǒng)能力,才能引導(dǎo)產(chǎn)業(yè)走向未來。



      在他的敘述里,車就是“機器人系統(tǒng)”的一種:它需要為安全設(shè)計的處理器、冗余的傳感器體系、可追蹤的全棧軟件,以及一個在低置信場景會回退到更安全護欄系統(tǒng)的“雙堆棧鏡像”策略。



      機器人登場:在 Omniverse 里學(xué)會成為機器人

      接下來,他把鏡頭轉(zhuǎn)向更廣義的機器人產(chǎn)業(yè):機械臂、移動機器人、人形機器人……尺寸不同、形態(tài)不同,但核心問題相似——都需要物理 AI、仿真與數(shù)據(jù)。



      現(xiàn)場還出現(xiàn)了多個機器人“朋友”,他開玩笑說“沒有誰像你們這么可愛”,并強調(diào) Isaac、Omniverse 這類訓(xùn)練體系,會成為未來機器人產(chǎn)業(yè)的通用底座。



      把物理 AI 帶進工業(yè):Cadence / Synopsys / Siemens,工業(yè)生命周期的 AI 化

      黃仁勛把物理 AI 的落點指向工業(yè)體系:EDA、系統(tǒng)設(shè)計、系統(tǒng)仿真、工廠制造與生產(chǎn)線。



      他點到 Cadence 和 Synopsys 在芯片設(shè)計世界中的核心地位,并提出一種未來圖景:



      未來我們不僅會有“代理軟件工程師”,還會有“代理芯片設(shè)計師”和“代理系統(tǒng)設(shè)計師”。芯片會在電腦里設(shè)計,系統(tǒng)會在電腦里仿真,工廠產(chǎn)線會在電腦里搭建并測試——在真正落到重力世界之前,先在數(shù)字世界完成大部分驗證。



      隨后他引出 Siemens 的合作內(nèi)容:將 NVIDIA CUDA-X 庫、AI 模型與 Omniverse 納入其工業(yè)軟件產(chǎn)品組合,把物理 AI 帶入整個工業(yè)生命周期——從設(shè)計與仿真,到生產(chǎn),再到運營。他把這稱為“新工業(yè)革命的起點”。



      Vera Rubin:為 AI 新前沿而生的下一代計算平臺(以及為什么必須“極端協(xié)同設(shè)計”)

      演講后半段,黃仁勛把重頭戲交給了新一代平臺:Vera Rubin。



      他先講了“為什么叫 Vera Rubin”:這位天文學(xué)家通過星系旋轉(zhuǎn)曲線的異常發(fā)現(xiàn)暗物質(zhì)存在。



      黃仁勛借此引出“看不見但影響巨大的東西”,并把它對應(yīng)到 AI時代的計算挑戰(zhàn):模型規(guī)模與推理計算暴漲,token 生成量爆發(fā),成本競爭每年劇烈下探——一切最終都變成計算問題。



      在他看來,摩爾定律放緩意味著:單靠工藝進步,不可能跟上模型規(guī)模的增長與 token 需求的增長。要跟上,行業(yè)必須做“極端協(xié)同設(shè)計”——同時在整個堆棧的所有關(guān)鍵芯片上創(chuàng)新。

      因此,這一代他們幾乎“別無選擇”,只能重新設(shè)計每一個芯片與系統(tǒng)組件。黃仁勛強調(diào):僅僅系統(tǒng)里每一個芯片拿出來都可以單獨開發(fā)布會。



      他在臺上展示了多個實物部件,講到了 CPU 與 GPU 的聯(lián)合設(shè)計、極高的 I/O 能力、以及在張量計算上通過新型數(shù)值/引擎實現(xiàn)的吞吐與精度平衡

      除此之外,他還用大量篇幅談到數(shù)據(jù)中心系統(tǒng)工程:

      從“線纜地獄”到“零線纜”、從兩小時組裝到五分鐘、從風(fēng)冷到全液冷、熱水冷卻(45℃)仍能保持高能效;



      以及 Spectrum-X 以太網(wǎng)在 AI 時代的關(guān)鍵作用、BlueField DPU 在虛擬化與安全卸載上的角色、NVLink 交換與超高帶寬互聯(lián)在“讓每個 GPU 同時與所有 GPU 交流”上的意義。



      他給出了一個很具沖擊力的系統(tǒng)性判斷:在千兆瓦級 AI 工廠里,網(wǎng)絡(luò)每提升一點吞吐都可能對應(yīng)數(shù)十億美元的價值;因此網(wǎng)絡(luò)能力不是“配角”,而是 AI 工廠的關(guān)鍵生產(chǎn)力。



      他最后用一組“給造 AI 超算的人看的圖表”來總結(jié) Vera Rubin 的意義:訓(xùn)練吞吐、工廠吞吐、token 成本、能效與成本效益,都被推到了下一階段。



      他把這歸結(jié)為NVIDIA 的新定位:從“做芯片的公司”,變成“構(gòu)建完整 AI 堆棧的公司”,覆蓋從芯片到基礎(chǔ)設(shè)施、從模型到應(yīng)用的全鏈路重構(gòu)。



      黃仁勛的“失控花絮”與 CES 的真實感

      演講結(jié)束前,黃仁勛還放了一段“外景/花絮”式的片段:麥克風(fēng)、攝像、滑稽的臺詞、卡頓的幻燈片、現(xiàn)場的笑點……他說有一堆內(nèi)容不得不剪掉,但正是這些不完美,讓 CES 的現(xiàn)場變得更“人類”。



      在一片喧鬧與掌聲里,他以一句樸素的收束結(jié)束了當(dāng)天的敘事:NVIDIA 的工作,是把整個堆棧搭出來,讓所有人都能在此之上創(chuàng)造應(yīng)用,推動 AI 進入下一個前沿。

      完整實錄如下:

      大家好,拉斯維加斯,新年快樂。

      歡迎來到 CES。我們今天在這里,其實要“塞進來”的內(nèi)容非常多,大概有15 公斤那么重。但能在現(xiàn)場看到你們所有人,我真的非常開心。

      此刻,這個主會場里坐著3000 人。外面的庭院,還有2000 人在同步觀看。據(jù)我所知,四樓原本用于視頻轉(zhuǎn)播的區(qū)域里,也還有1000 人在看這場演講。

      基本上,整棟樓的每一層,都在觀看這場主題演講。當(dāng)然,還有全世界數(shù)以百萬計的人,正通過直播,與我們一起開啟新的一年。

      10 到 15 年,計算機產(chǎn)業(yè)就會迎來一次平臺級重置

      我們經(jīng)歷過這樣的周期:從大型機個人電腦;從個人電腦互聯(lián)網(wǎng);從互聯(lián)網(wǎng)云計算;再從云計算移動計算

      每一次變化,都會誕生一個全新的平臺。而所謂“平臺遷移”,真正的含義在于:應(yīng)用的目標發(fā)生了改變。你不再是為舊的計算機寫程序,而是為一套全新的計算范式,重新構(gòu)建應(yīng)用。

      但這一次,情況有些不同。這一次,并不是一次平臺遷移,而是兩次平臺遷移,同時發(fā)生。第一條遷移路徑,是我們正在從“傳統(tǒng)應(yīng)用”,走向AI 原生應(yīng)用

      一開始,人們以為“AI 本身就是應(yīng)用”。而事實上,AI 確實是應(yīng)用的一種。但更重要的是:我們正在把應(yīng)用構(gòu)建在 AI 之上。AI 正在成為新的應(yīng)用運行平臺。

      而第二條遷移路徑,則更加根本。它不是“你做什么應(yīng)用”,而是“你如何開發(fā)軟件、如何運行軟件”。整個計算產(chǎn)業(yè)的五層技術(shù)棧,正在被徹底重塑。

      在這個新世界里:你不再是“編程”軟件,而是訓(xùn)練軟件。你不再主要運行在 CPU 上,而是運行在GPU上。

      過去,應(yīng)用是預(yù)先寫好、預(yù)先編譯的,然后在設(shè)備上執(zhí)行;而現(xiàn)在,應(yīng)用能夠理解上下文,并且在每一次運行時,從零生成每一個像素、每一個 token

      也就是說——每一次運行,都是一次全新的生成。正因為加速計算的出現(xiàn),正因為人工智能的出現(xiàn),整個計算體系正在被從底層到頂層,全部重建。這五層“計算蛋糕”的每一層,如今都在被重新發(fā)明。

      這意味著什么?這意味著,在過去十年中,大約10 萬億美元規(guī)模的傳統(tǒng)計算基礎(chǔ)設(shè)施,正在被整體現(xiàn)代化,遷移到這種全新的計算方式之中。

      這也解釋了為什么:每一年,有數(shù)千億美元的風(fēng)險投資,持續(xù)流入這個行業(yè);為什么,一個總規(guī)模達到100 萬億美元的產(chǎn)業(yè),其中相當(dāng)比例的研發(fā)預(yù)算,正在從傳統(tǒng)方法,轉(zhuǎn)向人工智能方法。

      人們經(jīng)常問我:“這些錢到底是從哪里來的?”答案就在這里。它們來自于:對既有計算體系的現(xiàn)代化改造;來自于研發(fā)預(yù)算從傳統(tǒng)路徑,轉(zhuǎn)向 AI 路徑;來自于整個世界,正在押注一種全新的計算范式。

      這就是為什么,我們會如此忙碌。而過去這一年,也完全不例外。

      過去這一年,真的非常不可思議。很多事情幾乎是在同一時間同時發(fā)生的。回頭看,它們并不是巧合,而是一次集中式的技術(shù)躍遷。

      首先發(fā)生的,是規(guī)模定律(scaling laws)的持續(xù)推進。如果回到 2015 年,我第一次看到一個真正可能改變世界的語言模型。它叫BERT。那是第一次讓我意識到,自然語言模型不只是一個研究方向,而是一種即將改變計算方式的技術(shù)。

      隨后,在2017 年Transformer 架構(gòu)出現(xiàn)了。但直到五年之后,也就是 2022 年,我們才真正迎來了那個被稱為 “ChatGPT 時刻”的轉(zhuǎn)折點。

      那一刻,世界第一次被真正喚醒。人們開始意識到,人工智能不只是一個工具,而是一種全新的能力平臺。

      而在那之后,又發(fā)生了一件極其重要的事情

      大約一年后,ChatGPT 推出了第一個O1 推理模型。那是第一個真正意義上的“推理模型”

      它并不是簡單地生成答案,而是在生成答案之前,進行內(nèi)部推理。這一次突破,幾乎是革命性的。

      它引入了一個新的概念,叫做測試時擴展(test-time scaling)

      從直覺上講,這其實非常符合常識。我們不僅在預(yù)訓(xùn)練階段讓模型學(xué)習(xí)知識,也在后訓(xùn)練階段通過強化學(xué)習(xí),讓模型學(xué)會技能,而現(xiàn)在,我們進一步讓模型在推理階段進行“思考”

      換句話說:模型開始在實時運行中,動態(tài)地分配計算資源,用于推理本身。

      而這三種階段——預(yù)訓(xùn)練、后訓(xùn)練、測試時推理——每一個階段,都需要極其龐大的計算資源

      計算定律并沒有停止。大語言模型仍在持續(xù)變得更強。與此同時,另一個重要突破出現(xiàn)了。這個突破,發(fā)生在2024 年,并在2025 年開始迅速擴散、全面滲透。

      那就是:智能體系統(tǒng)(Agentic Systems)的出現(xiàn)。智能體模型,具備一整套全新的能力。

      它們能夠推理,能夠查找信息,能夠做研究,能夠使用工具,能夠規(guī)劃未來,能夠模擬不同結(jié)果

      突然之間,AI 開始能夠解決一大類過去幾乎無法自動化的重要問題。在英偉達內(nèi)部,我個人最喜歡的一個智能體模型,叫做Cursor

      它幾乎徹底改變了我們在英偉達內(nèi)部進行軟件開發(fā)的方式。

      而這,僅僅是開始。從現(xiàn)在開始,智能體系統(tǒng)將真正迎來爆發(fā)式增長

      當(dāng)然,我們也很清楚一件事:大語言模型并不是信息世界的全部。信息并不只存在于文本之中。

      只要這個世界中存在信息,存在結(jié)構(gòu),存在規(guī)律,我們就可以訓(xùn)練一種“語言模型”,去理解這種信息的表示方式,并把它轉(zhuǎn)化為 AI。

      換句話說,語言模型并不局限于語言。

      只要世界中存在“可學(xué)習(xí)的結(jié)構(gòu)”,就存在 AI 的空間。在所有這些方向中,最重要、也最具挑戰(zhàn)性的一個方向,就是——物理 AI(Physical AI)

      物理 AI,是理解自然規(guī)律的 AI。它不是只理解符號、文本或圖像,而是理解這個世界如何真實運作。

      當(dāng)然,物理 AI 的核心,并不僅僅在于“理解”。更重要的是——與世界交互。當(dāng) AI 不再只存在于屏幕中,而是開始與現(xiàn)實世界發(fā)生互動時,一切都會改變。

      這里,我們需要區(qū)分兩個相關(guān)但不同的概念。

      第一種,是物理 AI。也就是那些能夠感知、決策、并與物理世界互動的 AI 系統(tǒng),比如機器人、自動駕駛汽車等。

      第二種,是AI Physics(物理規(guī)律 AI)。這是理解物理定律本身的 AI,能夠?qū)W習(xí)和推斷自然界的基本規(guī)則。

      這兩者是相互配合的。

      一個與世界互動的 AI,需要理解物理規(guī)律;而一個理解物理規(guī)律的 AI,最終也必須被用來指導(dǎo)真實世界中的行動。

      而在過去一年中,最重要、也最令人振奮的另一件事情,是開放模型的全面進展

      當(dāng)模型是開放的,當(dāng)創(chuàng)新是開放的,當(dāng)每一家企業(yè)、每一個行業(yè)、每一個國家,都能夠在同一時間參與進來,人工智能就不可能只屬于少數(shù)人。

      正是在這種背景下,AI 才會真正實現(xiàn)無處不在的普及

      去年,開放模型真正迎來了爆發(fā)。

      其中一個最具代表性的事件,是DeepSeek R1的發(fā)布。這是第一個真正意義上的開放推理模型

      它讓整個世界感到震驚。

      不僅因為它的性能,更因為它證明了一件事:推理能力,并不一定只存在于封閉模型中。

      DeepSeek R1 的出現(xiàn),幾乎點燃了整個開放模型生態(tài)。一個真正的開放 AI 運動,就此被激活。

      從那之后,我們看到世界各地涌現(xiàn)出各種各樣的開放模型系統(tǒng)。不同架構(gòu)、不同規(guī)模、不同目標,但共同點只有一個:開放正在加速智能的擴散。

      我們現(xiàn)在已經(jīng)可以非常確定地說:開放模型,已經(jīng)觸及 AI 的技術(shù)前沿。

      是的,它們?nèi)匀宦浜笥谧钋把氐姆忾]模型,大約六個月左右。但每過六個月,就會有新的開放模型出現(xiàn),而且它們變得越來越聰明。

      正因為如此,你可以看到一個非常明顯的現(xiàn)象:下載量正在爆炸式增長。

      初創(chuàng)公司希望參與 AI 革命;大型企業(yè)希望構(gòu)建自己的能力;研究人員希望探索新的邊界;學(xué)生希望學(xué)習(xí);幾乎每一個國家,都希望參與其中。

      因為一個問題擺在所有人面前:數(shù)字形態(tài)的智能,怎么可能把任何人留在身后?正是在這樣的背景下,開放模型在過去一年中,真正重塑了人工智能產(chǎn)業(yè)。而這,也正是我們在英偉達很早之前就隱約意識到的一件事。

      幾年前,你們可能聽說過,我們開始自己構(gòu)建并運營 AI 超級計算機。我們把它們稱為DGX Cloud。當(dāng)時,很多人問我們:“你們是不是要進入云計算業(yè)務(wù)?”答案是否定的。

      我們構(gòu)建這些 DGX 超級計算機,并不是為了成為云服務(wù)商,而是為了我們自己使用

      事實證明,這是一個非常正確的決定。如今,我們已經(jīng)在全球范圍內(nèi),運營著價值數(shù)十億美元的 AI 超級計算機集群。它們的核心用途之一,就是用于開發(fā)開放模型

      我對這項工作的進展感到非常自豪。因為它正在吸引來自世界各地、各個行業(yè)的關(guān)注。

      原因很簡單:我們正在多個不同領(lǐng)域,同時推進前沿 AI 模型的研究。

      在這樣的基礎(chǔ)之上,我們構(gòu)建的這些模型,不僅是前沿級的,而且在客觀評測中同樣處于世界領(lǐng)先位置。我們在多個排行榜上長期名列前茅,這也是我們非常自豪的一點。

      這些模型覆蓋了多個關(guān)鍵方向:它們能夠理解多模態(tài)文檔——也就是我們每天最常見、也最有價值的內(nèi)容載體,PDF。世界上大量重要的信息都被封裝在 PDF 中,但只有借助人工智能,我們才能真正理解其中的結(jié)構(gòu)、語義和含義,幫助人類高效閱讀與使用這些內(nèi)容。

      我們的 PDF 檢索模型、PDF 解析模型,都處于世界一流水平。

      與此同時,我們的語音識別模型同樣是世界級的;我們的檢索模型,本質(zhì)上就是現(xiàn)代 AI 時代的語義搜索與 AI 搜索引擎,其能力也同樣位居全球前列。我們幾乎在所有關(guān)鍵基準上,都處在領(lǐng)先位置,而這一切,最終都是為了一個目標——讓你們能夠真正構(gòu)建 AI 智能體

      這正是一個極其關(guān)鍵、也是極具突破性的階段。

      回想 ChatGPT 剛出現(xiàn)的時候,很多人都會說:“它生成的結(jié)果很有意思,但經(jīng)常會出現(xiàn)幻覺。”而幻覺的根源其實并不復(fù)雜。模型可以記住過去,卻不可能記住現(xiàn)在和未來發(fā)生的一切。

      因此,如果它沒有被扎根在現(xiàn)實信息之中,沒有在回答問題之前進行檢索、查證和推理,就必然會產(chǎn)生不可靠的輸出。

      真正重要的能力,在于模型能否判斷:我現(xiàn)在是否需要做研究?是否需要調(diào)用工具?是否需要把一個復(fù)雜問題拆解成多個步驟?而這些步驟本身,又是否是模型已經(jīng)學(xué)會、可以勝任的任務(wù)。

      當(dāng)模型具備了這種能力之后,它就可以把這些步驟組合成一個完整的行動鏈條,去完成一件它從未被直接訓(xùn)練過的事情。這正是“推理”的本質(zhì),也是智能體真正令人驚嘆的地方。

      人類也是如此。我們經(jīng)常會遇到從未經(jīng)歷過的情境,但我們可以把它拆解成一系列我們熟悉的規(guī)則、經(jīng)驗和知識,并據(jù)此做出判斷和行動。

      如今,AI 模型終于開始具備類似的能力。這種推理能力,為無數(shù)新的應(yīng)用場景打開了大門。我們不再需要在第一天就教會 AI 一切;就像人類一樣,它可以在面對具體問題時,通過推理找到解決路徑。

      大語言模型在這一點上實現(xiàn)了真正的飛躍——強化學(xué)習(xí)、思維鏈、搜索、規(guī)劃,這一整套方法體系,讓這種能力第一次變得系統(tǒng)化、可工程化,而且現(xiàn)在,這些能力也正在被逐步開源

      而真正讓我感到震撼的,是另一個關(guān)鍵突破。我第一次清楚意識到這一點,是在看到Aravind創(chuàng)辦的Perplexity時。

      Perplexity 是一家做 AI 搜索的公司,非常具有創(chuàng)新性。當(dāng)我意識到他們在同一個推理鏈條中,同時調(diào)用多個模型時,我覺得這簡直是天才般的設(shè)計。

      仔細想想,這其實再合理不過了:如果 AI 要解決一個復(fù)雜問題,為什么不在推理的不同階段,調(diào)用世界上最適合那個任務(wù)的 AI 呢?

      這正是為什么,現(xiàn)代 AI 天生就是多模態(tài)的——它理解語音、圖像、文本、視頻、三維結(jié)構(gòu),甚至蛋白質(zhì);

      同時,它也是多模型的——它會根據(jù)任務(wù)選擇最合適的模型;它天然是多云的,因為這些模型分布在不同的地方;同時,它也必然是混合云的

      如果你是一家企業(yè),或者你正在構(gòu)建一臺機器人,那么有些計算發(fā)生在云端,有些發(fā)生在邊緣,有些發(fā)生在工廠,有些發(fā)生在醫(yī)院——數(shù)據(jù)必須就在你身邊,實時可用。

      因此,這正是未來 AI 應(yīng)用的基本形態(tài)。換一種說法:既然未來的應(yīng)用是構(gòu)建在 AI 之上的,那么這套智能體架構(gòu),就是未來應(yīng)用的基礎(chǔ)結(jié)構(gòu)。正是這種多模型、多模態(tài)、可推理、可調(diào)用工具的架構(gòu),極大地加速了各類 AI 創(chuàng)業(yè)公司的成長。

      再加上開放模型與開放工具的出現(xiàn),你現(xiàn)在不僅可以使用最前沿的能力,還可以定制屬于你自己的 AI,教會它只有你才掌握的技能——那些來自你所在行業(yè)、你所在公司的深度知識。這正是我們在 Nemotron、NeMo,以及整個開放模型體系中所要實現(xiàn)的目標。

      在這種架構(gòu)下,你通常會在前面放置一個智能路由器。這個路由器就像一個管理者,它會根據(jù)你給出的提示意圖,判斷當(dāng)前任務(wù)最適合由哪一個模型來完成。

      需要處理郵件的請求,就留在本地運行;需要通用推理的部分,就調(diào)用前沿模型。這樣一來,你既擁有高度定制化的 AI,又始終站在技術(shù)前沿——一端是你獨有的領(lǐng)域能力,另一端是不斷進化的前沿智能,而這一切,只需要“讓它跑起來”即可。

      為了讓大家真正理解這種智能體架構(gòu)在現(xiàn)實中的樣子,我們做了一件事:把它完整地搭建出來,而且不是作為一個概念演示,而是作為一個真實可運行的系統(tǒng)。

      我們把這種可復(fù)用的系統(tǒng)設(shè)計,稱之為Blueprints。Blueprint 并不是某一個模型,而是一整套經(jīng)過驗證的 AI 系統(tǒng)組合方式,它包括模型選擇、推理流程、工具調(diào)用、數(shù)據(jù)路徑,以及最終如何把結(jié)果交付給用戶。

      其中一個 Blueprint,就是個人 AI 助理。這個助理并不是一個聊天機器人,而是一個能夠真正幫你完成任務(wù)的系統(tǒng)。它可以幫你讀取郵件、總結(jié)信息、安排日程、檢索資料、生成內(nèi)容,并在必要時主動調(diào)用外部工具。

      當(dāng)你向它提出一個請求時,它不會立刻給你一個答案,而是先判斷:這是不是一個需要研究的問題?是不是一個需要多步推理的問題?是不是一個需要訪問你個人數(shù)據(jù)的問題?然后,它會把這個請求拆解成多個子任務(wù),分別交給最合適的模型來完成,最后再把結(jié)果整合起來,形成一個你真正能用的輸出。

      在這個過程中,有些模型運行在云端,有些運行在本地,有些運行在你自己的服務(wù)器上。

      對你來說,這一切都是透明的;你只看到結(jié)果,但背后是一整套復(fù)雜而精密的系統(tǒng)在協(xié)同運作。這正是我們所說的混合 AI,也是未來所有嚴肅 AI 應(yīng)用的基本形態(tài)。

      為了支持這種架構(gòu),我們構(gòu)建了一整代全新的計算系統(tǒng)。你們可能已經(jīng)聽說過DGX Spark。它并不是一臺傳統(tǒng)意義上的服務(wù)器,而是一個為 AI 原生應(yīng)用而生的計算節(jié)點。它足夠小,可以放在辦公室、實驗室,甚至工廠里;同時,它又足夠強,可以支撐本地推理、數(shù)據(jù)處理和智能體運行。當(dāng)你把 DGX Spark 與云端的 DGX 系統(tǒng)連接起來時,你就擁有了一套真正意義上的端云協(xié)同 AI 基礎(chǔ)設(shè)施。

      這件事之所以重要,是因為物理 AI的時代已經(jīng)到來。機器人、自動化系統(tǒng)、工業(yè)設(shè)備,它們不可能把所有計算都放到云端。它們必須在本地感知環(huán)境、實時做出決策,同時又能夠在需要時,調(diào)用云端的更強算力進行規(guī)劃、學(xué)習(xí)和更新。這種“本地即智能、云端即大腦”的架構(gòu),是物理 AI 唯一可行的路徑。

      在舞臺上,我們展示了多個這樣的 Blueprint 示例,包括機器人系統(tǒng)。你會看到,機器人并不是被一行一行代碼“寫”出來的,而是通過感知、推理、規(guī)劃和執(zhí)行,完成復(fù)雜動作。

      它們可以理解語言指令,把語言映射為物理行動;可以在環(huán)境變化時重新規(guī)劃路徑;可以在失敗之后進行自我修正。這并不是一個單一模型的能力,而是一整套 AI 系統(tǒng)協(xié)同工作的結(jié)果。

      而這,正是為什么我們?nèi)绱藦娬{(diào)系統(tǒng)級創(chuàng)新。單一模型的性能提升固然重要,但真正改變世界的,是這些模型如何被組合、如何被部署、如何在現(xiàn)實環(huán)境中長期穩(wěn)定運行。Blueprint 的意義就在這里——它把復(fù)雜性封裝起來,讓開發(fā)者、企業(yè)和研究人員,可以在此基礎(chǔ)之上快速構(gòu)建自己的 AI 應(yīng)用,而不必從零開始。

      當(dāng)我們真正開始構(gòu)建這些 AI 系統(tǒng)時,有一件事變得異常清晰:AI 已經(jīng)不再是某一層的軟件問題,而是整個計算體系的問題。如果計算基礎(chǔ)設(shè)施不能被徹底重構(gòu),那么所有關(guān)于智能體、物理 AI、自動駕駛和機器人的設(shè)想,最終都會卡在現(xiàn)實世界的瓶頸上。

      這也是為什么,我們必須從最底層開始重新思考計算。

      AI 的計算負載,與傳統(tǒng)計算完全不同。它不是穩(wěn)定、線性的,而是高度動態(tài)的;不是以單次執(zhí)行為主,而是以持續(xù)推理為核心。模型在“思考”的時候,會在極短時間內(nèi)拉滿算力、內(nèi)存和網(wǎng)絡(luò)帶寬,然后又迅速回落。這種計算模式,對芯片、互連、系統(tǒng)、電力和散熱,提出了前所未有的要求。

      因此,我們不再把 GPU、CPU、網(wǎng)絡(luò)、存儲視為彼此獨立的部件,而是把它們當(dāng)作一個整體系統(tǒng)來設(shè)計。這正是我們反復(fù)強調(diào)的——極限協(xié)同設(shè)計。

      在這個體系中,芯片不再只是追求單點性能,而是為整個系統(tǒng)服務(wù);網(wǎng)絡(luò)不再只是連接,而是成為計算的一部分;系統(tǒng)不再只是承載,而是主動參與調(diào)度與優(yōu)化。只有在這樣的前提下,AI 才能真正擴展到前所未有的規(guī)模。

      這正是Blackwell 之后,我們?yōu)槭裁幢仨氃傧蚯斑~出一大步

      過去幾年里,Blackwell 為 AI 訓(xùn)練和推理奠定了一個全新的基線。但很快我們就意識到,如果只是沿著同樣的路徑繼續(xù)前進,是遠遠不夠的。模型規(guī)模在加速增長,推理復(fù)雜度在急劇上升,token 的生成方式正在從“回答”轉(zhuǎn)向“思考”,所有這些變化,都在逼迫我們重新發(fā)明整個計算平臺。

      于是,我們開始設(shè)計一個全新的系統(tǒng)。不是一塊芯片。不是一臺服務(wù)器。而是一個完整的 AI 超級計算平臺

      這就是Vera Rubin

      Vera Rubin 并不是某一代產(chǎn)品的代號,而是一個象征。它象征著我們已經(jīng)進入一個階段:計算的瓶頸,不再在單一部件上,而在系統(tǒng)整體的協(xié)同效率上。在這個平臺中,每一個決策——從晶體管如何使用,到數(shù)據(jù)如何流動——都是圍繞 AI 的真實負載來做出的。

      在設(shè)計 Vera Rubin 的過程中,我們面臨的最大挑戰(zhàn),并不是“如何把性能再提升一點”,而是:如何在物理極限逐漸逼近的情況下,仍然實現(xiàn)數(shù)量級的躍遷。摩爾定律正在放緩,單靠晶體管數(shù)量的增長,已經(jīng)無法支撐 AI 的發(fā)展速度。

      如果模型規(guī)模每年增長 10 倍,如果推理 token 每年增長 5 倍,如果成本還要持續(xù)以數(shù)量級下降,那么整個計算體系就必須發(fā)生質(zhì)變。

      答案只有一個:在整個系統(tǒng)層面進行同時創(chuàng)新

      這也是為什么,在這一代平臺中,我們選擇重新設(shè)計所有關(guān)鍵組件。CPU、GPU、網(wǎng)絡(luò)芯片、交換機、系統(tǒng)結(jié)構(gòu)、電力與散熱——沒有任何一層可以保持不變。因為只要其中任何一層跟不上,整個系統(tǒng)都會被拖慢。

      Vera Rubin 正是在這樣的背景下誕生的。它不是一次漸進式升級,而是一次系統(tǒng)級重構(gòu)。它的目標非常明確:為 AI 的下一個十年,提供一個足夠強大、足夠高效、足夠可擴展的計算基礎(chǔ)。

      當(dāng)我們真正開始定義 Vera Rubin 這個平臺時,我們首先要解決的,不是“性能還能不能再快一點”,而是一個更根本的問題:數(shù)據(jù)在系統(tǒng)中,究竟應(yīng)該如何流動

      在 AI 計算中,真正昂貴的,并不是計算本身,而是數(shù)據(jù)的移動。每一次跨芯片、跨節(jié)點、跨機架的數(shù)據(jù)傳輸,都會帶來延遲、功耗和效率損失。而隨著模型規(guī)模的不斷擴大,這個問題會被無限放大。

      因此,在 Vera Rubin 中,我們從一開始就選擇了一條非常激進的路線:把多個關(guān)鍵計算單元,作為一個整體來協(xié)同設(shè)計

      這也是為什么,Vera Rubin 并不是一顆“更大的 GPU”,而是一個由六顆核心芯片組成的協(xié)同系統(tǒng)。這六顆芯片并不是簡單地堆疊在一起,而是通過極高帶寬、極低延遲的互連,被設(shè)計成一個幾乎“不可分割”的整體。

      在這個系統(tǒng)中,GPU、CPU、內(nèi)存控制邏輯、網(wǎng)絡(luò)接口,不再是松散拼接的模塊,而是圍繞 AI 負載進行深度融合。它們共享統(tǒng)一的視圖,能夠以極高效率訪問彼此的數(shù)據(jù),就像是在同一塊硅片上工作一樣。

      為了實現(xiàn)這一點,我們在互連技術(shù)上投入了極大的精力。NVLink在這一代平臺中,已經(jīng)不再只是 GPU 之間的高速通道,而是整個系統(tǒng)的“神經(jīng)網(wǎng)絡(luò)”。數(shù)據(jù)不需要繞遠路,不需要經(jīng)過多層轉(zhuǎn)發(fā),而是可以在需要的時刻,直接流向需要它的地方。

      這件事情聽起來很抽象,但它的結(jié)果非常直觀:模型在推理時,可以更長時間地保持“思考狀態(tài)”;更多的上下文可以常駐在高速內(nèi)存中;系統(tǒng)不再頻繁地因為等待數(shù)據(jù)而空轉(zhuǎn)。

      與此同時,網(wǎng)絡(luò)本身也發(fā)生了根本變化。

      在傳統(tǒng)數(shù)據(jù)中心中,網(wǎng)絡(luò)只是負責(zé)把機器連在一起。但在 AI 數(shù)據(jù)中心中,網(wǎng)絡(luò)本身就是計算的一部分

      在 Vera Rubin 平臺中,我們把Spectrum-X網(wǎng)絡(luò)體系深度嵌入到整體設(shè)計之中。交換機、網(wǎng)卡、拓撲結(jié)構(gòu)、調(diào)度邏輯,全都圍繞 AI 的通信模式來優(yōu)化。模型在訓(xùn)練和推理過程中,會不斷進行大規(guī)模的梯度同步、參數(shù)廣播和上下文交換,而這些操作,已經(jīng)成為系統(tǒng)的主要負載之一。

      因此,我們不再允許網(wǎng)絡(luò)成為瓶頸。在這個平臺上,網(wǎng)絡(luò)的吞吐、延遲和可預(yù)測性,必須與計算本身同等重要。

      同樣重要的,還有內(nèi)存系統(tǒng)。在 AI 推理時代,內(nèi)存的角色已經(jīng)發(fā)生了變化。它不再只是用來“存放權(quán)重”,而是用來承載推理過程本身。KV cache、上下文窗口、中間狀態(tài),這些內(nèi)容必須盡可能長時間地留在高速內(nèi)存中,才能支持更復(fù)雜、更長鏈路的推理。

      因此,Vera Rubin 的內(nèi)存體系,是為“持續(xù)推理”而設(shè)計的。我們追求的不是峰值容量,而是可持續(xù)、高帶寬、低延遲的訪問能力。只有這樣,模型才能真正“停下來思考”,而不是被迫在計算與數(shù)據(jù)移動之間來回切換。

      當(dāng)你把這些因素放在一起看,就會發(fā)現(xiàn)一件事:Vera Rubin 并不是在追求某一個指標的極限,而是在追求整個系統(tǒng)效率的極限

      這也是為什么,我們必須同時重構(gòu)計算、互連、網(wǎng)絡(luò)、內(nèi)存、電力和散熱。因為在這個規(guī)模上,任何一處效率損失,都會被成千上萬倍地放大。

      最終,我們得到的,不只是一個更快的平臺,而是一個為 AI 原生設(shè)計的計算生態(tài)系統(tǒng)。它能夠隨著模型規(guī)模的增長而擴展,能夠隨著推理復(fù)雜度的提升而進化,也能夠在未來十年中,持續(xù)支撐 AI 的發(fā)展。

      當(dāng)你把視角從單一系統(tǒng)繼續(xù)拉遠,就會發(fā)現(xiàn),真正的挑戰(zhàn)并不止于一臺機器,而是在數(shù)據(jù)中心尺度上,如何讓這些系統(tǒng)協(xié)同工作。因為一旦 AI 模型開始進入大規(guī)模訓(xùn)練與持續(xù)推理階段,問題就不再是“一臺系統(tǒng)有多快”,而是“成千上萬臺系統(tǒng),能否像一臺機器一樣工作”。

      這正是我們在 Vera Rubin 平臺上,必須同時考慮機架級、集群級、數(shù)據(jù)中心級設(shè)計的原因。我們不再把服務(wù)器簡單地一臺一臺堆放,而是把整個機架視為一個計算單元。計算、網(wǎng)絡(luò)、電力和散熱,必須在機架層面完成統(tǒng)一設(shè)計,才能保證系統(tǒng)在滿負載運行時,仍然具備可預(yù)測的性能。

      在這種架構(gòu)下,我們構(gòu)建了所謂的超節(jié)點(Supernode)。一個超節(jié)點并不是某一臺特別強的機器,而是一組通過高速互連、統(tǒng)一調(diào)度、共享內(nèi)存視圖的系統(tǒng)集合。在 AI 負載看來,這些系統(tǒng)就像是一塊連續(xù)擴展的計算資源,而不是彼此獨立的節(jié)點。這一點,對于大模型訓(xùn)練和長上下文推理來說,至關(guān)重要。

      當(dāng)模型規(guī)模繼續(xù)擴大,通信量會呈指數(shù)級增長。如果系統(tǒng)在這個階段出現(xiàn)任何不均衡,哪怕只是極小的延遲抖動,都會被迅速放大,最終拖慢整個訓(xùn)練過程。因此,在超節(jié)點層面,我們對拓撲結(jié)構(gòu)、帶寬分配和調(diào)度策略進行了深度優(yōu)化,確保數(shù)據(jù)在系統(tǒng)中始終走最短、最可預(yù)測的路徑。

      當(dāng)然,所有這些計算能力,最終都會轉(zhuǎn)化為一個非常現(xiàn)實的問題:能耗

      AI 數(shù)據(jù)中心的功耗規(guī)模,已經(jīng)遠遠超過了傳統(tǒng)數(shù)據(jù)中心。訓(xùn)練一個前沿模型,所消耗的電力,足以支撐一座中型城市的部分用電需求。如果我們不能在能效上實現(xiàn)突破,那么 AI 的發(fā)展本身就會受到物理和經(jīng)濟條件的限制。

      因此,在這一代平臺中,我們把能效作為系統(tǒng)設(shè)計的核心指標之一。每一次數(shù)據(jù)移動、每一次計算調(diào)度、每一次網(wǎng)絡(luò)通信,都會被納入整體能耗模型之中進行優(yōu)化。我們的目標,并不是簡單地降低功耗,而是在單位能耗下,完成盡可能多的有效推理與訓(xùn)練工作

      這也直接推動了散熱技術(shù)的演進。空氣冷卻已經(jīng)無法滿足如此高密度的計算需求,于是我們大規(guī)模引入了液冷系統(tǒng)。通過液冷,我們不僅能夠更有效地帶走熱量,還能夠讓系統(tǒng)在更穩(wěn)定的溫度區(qū)間內(nèi)運行,從而提高可靠性和壽命。這些看似“工程細節(jié)”的東西,實際上決定了 AI 是否能夠長期、可持續(xù)地運行在現(xiàn)實世界中。

      當(dāng)你把計算、網(wǎng)絡(luò)、能耗和散熱放在一起看,就會發(fā)現(xiàn):現(xiàn)代 AI 數(shù)據(jù)中心,本身就是一臺巨大的計算機。

      它不是由零散的服務(wù)器拼湊而成,而是一個從底層物理到上層軟件高度協(xié)同的系統(tǒng)。正是在這樣的系統(tǒng)之上,AI 才能以我們今天看到的速度不斷進化。

      也正因為如此,我們才會反復(fù)強調(diào):AI 的未來,不僅僅屬于模型研究人員,也屬于系統(tǒng)工程師、電力工程師、網(wǎng)絡(luò)工程師,以及所有參與構(gòu)建這一基礎(chǔ)設(shè)施的人。只有當(dāng)整個系統(tǒng)協(xié)同進化,AI 才能真正走向規(guī)模化應(yīng)用。

      當(dāng)這些計算平臺真正具備規(guī)模之后,一個新的問題就擺在我們面前:這些能力,究竟要以什么形式被使用?

      并不是所有 AI 都應(yīng)該運行在同一個地方。有些 AI 需要運行在超大規(guī)模的數(shù)據(jù)中心中,用來訓(xùn)練前沿模型、進行復(fù)雜規(guī)劃和長期推理;有些 AI 需要運行在企業(yè)自己的數(shù)據(jù)中心里,靠近私有數(shù)據(jù)和業(yè)務(wù)系統(tǒng);還有一些 AI,必須運行在本地設(shè)備、工廠、醫(yī)院、汽車和機器人中,進行實時決策。

      因此,AI 的未來,一定是多層次的

      這也是為什么,我們在設(shè)計整套平臺時,從一開始就假設(shè):AI 會同時存在于云端、企業(yè)內(nèi)部和邊緣側(cè)。這并不是權(quán)宜之計,而是一種必然結(jié)果。數(shù)據(jù)的生成地點,決定了計算的部署位置;延遲、安全、合規(guī)性,這些現(xiàn)實因素,決定了 AI 不可能被集中在某一個地方。

      在云端,我們與全球幾乎所有主要的云服務(wù)商合作。這些云平臺,正在成為前沿模型訓(xùn)練與大規(guī)模推理的核心載體。而在這些云中運行的,并不僅僅是“通用 AI”,而是越來越多針對行業(yè)定制的模型與系統(tǒng)

      在企業(yè)側(cè),我們看到一種非常明確的趨勢:企業(yè)并不想把最核心的數(shù)據(jù)完全交給外部。它們希望在自己的環(huán)境中,構(gòu)建、運行并控制 AI。這催生了所謂的企業(yè) AI 工廠——一個專門用來訓(xùn)練、微調(diào)、部署和運營 AI 的基礎(chǔ)設(shè)施。

      在這種架構(gòu)下,企業(yè)不再只是“使用 AI”,而是開始擁有 AI。它們可以把自身幾十年積累的數(shù)據(jù)、流程和知識,轉(zhuǎn)化為獨有的智能能力,而這正是 AI 真正產(chǎn)生長期價值的方式。

      而在越來越多的國家,我們還看到了另一種需求:主權(quán) AI(Sovereign AI)

      每一個國家,都擁有自己的語言、文化、法律體系和社會結(jié)構(gòu)。它們也擁有自己的數(shù)據(jù)資源和戰(zhàn)略目標。

      因此,越來越多的國家意識到:如果 AI 成為未來的基礎(chǔ)能力,那么它就不應(yīng)該完全依賴外部。一個國家必須能夠在本土訓(xùn)練模型、運行模型、控制數(shù)據(jù),并確保這些系統(tǒng)符合本國的價值觀和法律體系。

      這并不是一個技術(shù)問題,而是一個國家級基礎(chǔ)設(shè)施問題。

      而主權(quán) AI 的實現(xiàn),離不開強大的本地計算能力、開放的模型生態(tài),以及完整的工具鏈。這正是我們在多個國家與政府、科研機構(gòu)和本地企業(yè)合作的原因。我們的目標,并不是替代任何人,而是賦能各個地區(qū),構(gòu)建屬于他們自己的 AI 能力

      當(dāng)你把云、企業(yè)、本地和主權(quán) AI 放在一起看,就會發(fā)現(xiàn):AI 并不是一個單一形態(tài)的產(chǎn)品,而是一整套分布式智能系統(tǒng)。

      而支撐這套系統(tǒng)運行的,正是我們前面所講的那整套計算平臺、網(wǎng)絡(luò)體系和軟件工具。無論 AI 運行在哪里,它們背后遵循的都是同樣的原則:高效的數(shù)據(jù)流動、可預(yù)測的性能、可擴展的架構(gòu),以及長期可持續(xù)的運行能力。

      這也是為什么,我們并不是在“賣芯片”,而是在構(gòu)建一個完整的 AI 基礎(chǔ)設(shè)施生態(tài)

      當(dāng) AI 真正離開屏幕、進入現(xiàn)實世界時,一切都會變得更加具體,也更加嚴苛。因為在物理世界中,錯誤是有成本的,延遲是不可接受的,系統(tǒng)必須在復(fù)雜、不確定、持續(xù)變化的環(huán)境中穩(wěn)定運行。這正是為什么,汽車與機器人,會成為物理 AI 最重要、也最具代表性的落地場景。

      先從汽車開始。自動駕駛,本質(zhì)上并不是一個“視覺識別問題”,而是一個完整的物理 AI 系統(tǒng)。它需要實時感知環(huán)境、理解三維空間結(jié)構(gòu)、預(yù)測其他參與者的行為,并在極短時間內(nèi)做出安全決策。這些能力,并不是通過規(guī)則堆疊實現(xiàn)的,而是通過大規(guī)模數(shù)據(jù)訓(xùn)練、仿真和持續(xù)學(xué)習(xí)逐步獲得的。

      因此,我們從一開始就把自動駕駛視為一個端到端的 AI 系統(tǒng)工程。從車端的感知與推理,到數(shù)據(jù)中心中的訓(xùn)練與仿真,再到模型的持續(xù)迭代,這是一條完整的閉環(huán)。

      汽車在現(xiàn)實世界中行駛,每一天都會產(chǎn)生海量數(shù)據(jù);這些數(shù)據(jù)被送回數(shù)據(jù)中心,用于訓(xùn)練更好的模型;而更好的模型,再被部署回車輛之中。這正是 AI 在物理世界中不斷進化的方式。

      機器人也是如此,甚至更加復(fù)雜。

      一個機器人面對的,并不是結(jié)構(gòu)化的道路環(huán)境,而是高度多樣化、充滿不確定性的真實空間。地面可能是光滑的,也可能是松軟的;物體可能是剛性的,也可能是柔性的;人類的行為更是難以預(yù)測。在這樣的環(huán)境中,機器人如果只依賴預(yù)先編程的動作,是不可能規(guī)模化的。

      因此,我們必須讓機器人具備真正的感知、推理和學(xué)習(xí)能力

      這也是為什么,我們在機器人領(lǐng)域構(gòu)建的,不是某一個單點模型,而是一整套系統(tǒng):從感知模型到運動模型,從世界建模到策略規(guī)劃,再到在仿真環(huán)境中進行大規(guī)模訓(xùn)練。機器人并不是被“寫”出來的,而是被“訓(xùn)練”出來的。它們通過在虛擬世界中反復(fù)嘗試、失敗和修正,逐步學(xué)會如何在現(xiàn)實世界中行動。

      在這個過程中,仿真扮演著至關(guān)重要的角色。

      現(xiàn)實世界的數(shù)據(jù)是昂貴的、緩慢的,而且充滿風(fēng)險;而仿真世界則可以被無限復(fù)制、加速和控制。通過高保真的物理仿真,我們可以在虛擬環(huán)境中生成海量訓(xùn)練數(shù)據(jù),讓機器人和自動駕駛系統(tǒng)在“安全的失敗”中不斷學(xué)習(xí)。這正是為什么,我們把仿真視為物理 AI 的核心基礎(chǔ)設(shè)施之一。

      而當(dāng)這些系統(tǒng)真正開始工作時,你會發(fā)現(xiàn)一個非常重要的事實:物理 AI 從來不是單點部署的。它們總是運行在一個端云協(xié)同的體系中。機器人在本地進行實時感知與決策,而更復(fù)雜的規(guī)劃、模型更新和策略學(xué)習(xí),則發(fā)生在云端或數(shù)據(jù)中心中。這種協(xié)同,是物理 AI 唯一可行的運行方式。

      正因為如此,我們才會看到,越來越多的行業(yè)開始真正擁抱物理 AI。制造業(yè)、物流、醫(yī)療、能源、農(nóng)業(yè),這些領(lǐng)域都存在著大量需要“理解世界并采取行動”的任務(wù)。AI 在這些場景中的價值,并不體現(xiàn)在生成一段文本,而體現(xiàn)在提高效率、降低風(fēng)險、擴展人類能力

      而這一切的前提,是我們必須擁有足夠強大、足夠可靠的計算平臺,來支撐這些系統(tǒng)長期運行。物理 AI 不是一次性的部署,而是一項持續(xù)數(shù)十年的工程。系統(tǒng)必須可以更新、可以擴展、可以在真實世界中不斷學(xué)習(xí)和進化。

      當(dāng)我們把所有這些變化放在一起看,就會意識到:人工智能并不是一個短期趨勢,而是一場長期、結(jié)構(gòu)性的產(chǎn)業(yè)重構(gòu)。它不僅改變了軟件如何被編寫,也改變了硬件如何被設(shè)計,更改變了企業(yè)如何運作、國家如何建設(shè)基礎(chǔ)設(shè)施,以及人類如何與技術(shù)協(xié)作。

      我們正在進入一個新的階段。在這個階段里,AI 不再只是提升效率的工具,而是一種新的生產(chǎn)要素。它像電力一樣,成為所有行業(yè)的基礎(chǔ)能力;又像互聯(lián)網(wǎng)一樣,重塑了信息、服務(wù)和價值的流動方式。而與以往任何一次技術(shù)革命不同的是,這一次,AI 正在同時重構(gòu)數(shù)字世界與物理世界。

      這意味著,未來十年中,幾乎每一個行業(yè),都會被重新發(fā)明。制造、物流、交通、醫(yī)療、能源、金融、科研——這些領(lǐng)域中的工作方式,將不再以“人如何操作機器”為核心,而是轉(zhuǎn)向“人如何與智能系統(tǒng)協(xié)同”。AI 將承擔(dān)越來越多的認知與執(zhí)行任務(wù),而人類則專注于創(chuàng)造、判斷與價值選擇。

      從產(chǎn)業(yè)的角度看,這也是一個規(guī)模前所未有的機會。我們看到,全球范圍內(nèi)正在形成一個新的產(chǎn)業(yè)基礎(chǔ)——AI 工廠。這些工廠并不生產(chǎn)實體商品,而是生產(chǎn)智能本身:模型、推理能力、決策系統(tǒng)和自動化流程。它們需要巨大的計算能力、穩(wěn)定的能源供應(yīng)、先進的網(wǎng)絡(luò)體系,以及高度專業(yè)化的軟件工具。

      正是在這樣的背景下,我們判斷:未來十年,將是AI 基礎(chǔ)設(shè)施建設(shè)的黃金十年。這不僅僅是關(guān)于芯片或服務(wù)器的需求增長,更是關(guān)于整個系統(tǒng)——從數(shù)據(jù)中心到邊緣設(shè)備,從云端到本地,從模型到應(yīng)用——的全面升級。

      而在這一過程中,有一點至關(guān)重要:這場變革必須是開放的

      如果 AI 只掌握在少數(shù)人手中,它就無法真正釋放潛力;如果 AI 無法被各行各業(yè)、各個國家所使用,它就不可能成為真正的基礎(chǔ)能力。

      因此,我們始終堅持一個原則:推動開放的平臺、開放的模型、開放的生態(tài)。我們希望看到的是一個多樣化的 AI 世界——不同的模型、不同的架構(gòu)、不同的應(yīng)用,共同推動智能向前發(fā)展。

      對我們來說,這并不是一條容易的路。構(gòu)建這樣的系統(tǒng),需要巨大的投入、長期的耐心,以及跨越多個學(xué)科的協(xié)作。

      但這也是一條值得走的路

      因為我們相信,人工智能最終的價值,不在于替代人類,而在于擴展人類的能力;不在于制造更多的工具,而在于幫助人類解決那些過去無法解決的問題。

      這正是我們在英偉達每天所做的事情。也是我們對未來十年,最堅定的信念。

      謝謝大家。新年快樂。歡迎來到 AI 的新時代。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      徐帆回應(yīng)離婚5個月,馮小剛近況曝光,內(nèi)心早已看透一切

      徐帆回應(yīng)離婚5個月,馮小剛近況曝光,內(nèi)心早已看透一切

      甜檸聊史
      2026-01-14 14:25:28
      徹底攤牌了!美日擴大聯(lián)合演習(xí),解放軍突然戰(zhàn)術(shù)轉(zhuǎn)向,信號不一般

      徹底攤牌了!美日擴大聯(lián)合演習(xí),解放軍突然戰(zhàn)術(shù)轉(zhuǎn)向,信號不一般

      趣生活
      2026-02-14 11:48:55
      狗血!中戲王鑫主動投案,共4位表演系主任落馬,閆學(xué)晶的天塌了

      狗血!中戲王鑫主動投案,共4位表演系主任落馬,閆學(xué)晶的天塌了

      壹月情感
      2026-02-13 23:30:13
      國際貴金屬價格大幅下跌

      國際貴金屬價格大幅下跌

      中國能源網(wǎng)
      2026-02-14 10:44:03
      00后整頓家庭糾紛有多毒?網(wǎng)友:動不動就斷絕親戚關(guān)系,發(fā)瘋精髓

      00后整頓家庭糾紛有多毒?網(wǎng)友:動不動就斷絕親戚關(guān)系,發(fā)瘋精髓

      解讀熱點事件
      2026-02-14 00:05:07
      李家誠起訴周秀娜風(fēng)波升級!曝隔10年起訴原因,更多情感糾葛被扒

      李家誠起訴周秀娜風(fēng)波升級!曝隔10年起訴原因,更多情感糾葛被扒

      古希臘掌管松餅的神
      2026-02-14 13:11:35
      驚天逆轉(zhuǎn)!中國冰壺女隊8比7擊敗意大利

      驚天逆轉(zhuǎn)!中國冰壺女隊8比7擊敗意大利

      澎湃新聞
      2026-02-14 19:02:27
      中央批準,湖北省副省長跨省履新!多個省級黨委領(lǐng)導(dǎo)班子調(diào)整

      中央批準,湖北省副省長跨省履新!多個省級黨委領(lǐng)導(dǎo)班子調(diào)整

      上觀新聞
      2026-02-14 10:49:06
      斯大林死在地上10小時,滿身屎尿沒人管:那個讓世界害怕的人。

      斯大林死在地上10小時,滿身屎尿沒人管:那個讓世界害怕的人。

      房產(chǎn)衫哥
      2026-02-13 17:22:30
      鬧大了!上海一家長哭訴,孩子剛上大學(xué)提出要把20多萬壓歲錢拿走

      鬧大了!上海一家長哭訴,孩子剛上大學(xué)提出要把20多萬壓歲錢拿走

      火山詩話
      2026-02-13 07:30:50
      國產(chǎn)電車暴跌,或因外資車與產(chǎn)業(yè)鏈和經(jīng)銷商聯(lián)合圍剿,自食其果

      國產(chǎn)電車暴跌,或因外資車與產(chǎn)業(yè)鏈和經(jīng)銷商聯(lián)合圍剿,自食其果

      柏銘銳談
      2026-02-13 23:37:09
      韓媒:中國或0金收官創(chuàng)最差紀錄!離開主場原形畢露 只能靠谷愛凌

      韓媒:中國或0金收官創(chuàng)最差紀錄!離開主場原形畢露 只能靠谷愛凌

      念洲
      2026-02-14 16:28:58
      日本,一個發(fā)達國家,為何把日子過成“全民還債”的困局?

      日本,一個發(fā)達國家,為何把日子過成“全民還債”的困局?

      包明說
      2026-02-13 13:03:50
      他的事跡至今不敢拍成電影,9次榮獲特等功,400萬解放軍只此一人

      他的事跡至今不敢拍成電影,9次榮獲特等功,400萬解放軍只此一人

      小莜讀史
      2026-02-14 12:44:10
      狂輸27分 又慘遭四殺!從聯(lián)盟寵兒淪為NBA棄子,你們離解散不遠了

      狂輸27分 又慘遭四殺!從聯(lián)盟寵兒淪為NBA棄子,你們離解散不遠了

      老侃侃球
      2026-02-14 03:30:06
      和王立軍留下經(jīng)典合影的周京平,剛剛被官宣雙開!

      和王立軍留下經(jīng)典合影的周京平,剛剛被官宣雙開!

      霹靂炮
      2026-02-13 22:50:10
      你見過哪些悶聲發(fā)大財?shù)娜耍烤W(wǎng)友:干這個買三套房子,兩個門面

      你見過哪些悶聲發(fā)大財?shù)娜耍烤W(wǎng)友:干這個買三套房子,兩個門面

      夜深愛雜談
      2026-02-01 18:57:04
      成都10歲男童吃豬腳卡喉不治身亡,母親發(fā)聲:送醫(yī)10分鐘搶救20分鐘,“吃一口肉為什么就要了他的命”

      成都10歲男童吃豬腳卡喉不治身亡,母親發(fā)聲:送醫(yī)10分鐘搶救20分鐘,“吃一口肉為什么就要了他的命”

      大風(fēng)新聞
      2026-02-14 16:09:05
      大數(shù)據(jù)也幫不上計劃經(jīng)濟

      大數(shù)據(jù)也幫不上計劃經(jīng)濟

      生命可以承受之輕
      2026-02-14 12:30:30
      湖北省十堰市人大常委會原黨組成員夏樹應(yīng)被開除黨籍

      湖北省十堰市人大常委會原黨組成員夏樹應(yīng)被開除黨籍

      界面新聞
      2026-02-14 14:33:55
      2026-02-14 19:23:00
      前沿在線
      前沿在線
      前沿在線官方賬號,傳播科技商業(yè)新知
      100文章數(shù) 1231關(guān)注度
      往期回顧 全部

      科技要聞

      字節(jié)跳動官宣豆包大模型今日進入2.0階段

      頭條要聞

      俄中將遇襲細節(jié):身中3槍 將襲擊者的槍舉到頭頂高度

      頭條要聞

      俄中將遇襲細節(jié):身中3槍 將襲擊者的槍舉到頭頂高度

      體育要聞

      金博洋:天才少年的奧運終章

      娛樂要聞

      吳克群變“吳克窮”助農(nóng),國臺辦點贊

      財經(jīng)要聞

      春節(jié)搶黃金,誰賺到錢了?

      汽車要聞

      星光730新春促銷開啟 80天銷量破2.6萬臺

      態(tài)度原創(chuàng)

      本地
      手機
      游戲
      旅游
      公開課

      本地新聞

      下一站是嘉禾望崗,請各位乘客做好哭泣準備

      手機要聞

      小米、榮耀在拜年,vivo在教技術(shù)、OPPO玩花活

      最后3天!即將下架的PS+ Extra會免游戲進來看

      旅游要聞

      賞桃花,打卡“大灣雞”“嘉禾望崗”!廣州白云迎春花市開鑼

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版