如果要找一個人來解釋這場 AI 大爆發究竟是怎么發生的,黃仁勛無疑是最合適的人選。
三十年前創立英偉達、押注圖形處理器,把 CUDA 強行裝進游戲顯卡,市值從 80 億跌至 15 億,然后用十年爬回來。在所有人還在爭論推理芯片會不會只是低端市場時,他已經在為智能體時代設計機架架構。
這種提前預判,顯然不只是運氣,也離不開他幾十年如一日做的一件事:在所有人相信之前,先把那個未來講給所有人聽。
![]()
今天,知名播客主持人 Lex Fridman 公開了他與黃仁勛長達兩小時的深度專訪。
對話涵蓋 CUDA 護城河、中國科技生態、編程的未來,DLSS5、乃至意識與死亡。這是黃仁勛近期最完整的一次公開表達,也是迄今為止最接近他真實思維方式的一次記錄。
附上黃仁勛采訪文字版實錄 :https://lexfridman.com/jensen-huang-transcript
一個問題,60 個專家同時在場,這就是英偉達開會的方式
采訪開篇,Fridman 指出英偉達已將設計重心從單芯片擴展至機架級別,涵蓋 GPU、CPU、內存、網絡、NVLink、光纖與銅纜互聯、供電、冷卻、軟件以及機架本身。他問黃仁勛:在如此多變量的協同設計中,最難的部分是什么?
黃仁勛首先解釋了極致協同設計為何從工程邏輯上不可回避。
他說,問題的根源在于規模:當你把一個任務分布到一萬臺計算機上,你期望的結果是獲得遠超線性疊加的加速效果,比如一百萬倍的提升,而單純增加計算機數量只能帶來線性收益。
![]()
這就是阿姆達爾定律的約束,也就是說,如果計算只占總工作量的 50%,即便把計算速度提升到無限快,整體也只能加速兩倍。
「一旦你把問題分布出去,所有東西都會成為瓶頸。CPU 是問題,GPU 是問題,網絡是問題,交換機是問題。分布式計算在我們這個規模下,每一個環節都必須同時攻克。」
![]()
在組織層面,黃仁勛透露自己的直接匯報超過 60 人,幾乎涵蓋所有技術學科的頂尖專家:內存、CPU、光學、GPU 架構、算法、設計,無一缺席。他刻意放棄一對一匯報制度,改為讓所有人同時在場討論任何一個具體問題。
「因為我們在做極致協同設計,所以任何一次討論都不可能只有一個人在場。我們呈現一個問題,所有人一起攻。當我們討論冷卻,網絡專家在聽;當我們討論供電,內存專家在聽。誰要是對本該關注的事情沒有關注,我會直接點名。」
他將公司架構比作操作系統,認為公司的組織結構應當直接反映它所處的環境和它要生產的產品,而非套用統一的「漢堡式」或「軟性」組織圖或者和汽車公司組織圖。
把 CUDA 塞進游戲顯卡,是最痛苦也是最關鍵的決定
在講述英偉達的戰略演進時,黃仁勛也詳細梳理了從圖形加速器到計算平臺的轉型路徑。
他說,英偉達最初是一家加速器公司,專注于圖形處理。專業化的好處是極致優化,問題在于市場邊界天然受限,而市場規模直接決定研發投入能力,研發能力又決定了一家公司在計算領域能發揮多大的影響力。
于是英偉達必須拓寬邊界,向通用計算邁進,但通用性和專業性之間往往存在天然的矛盾:越向通用計算靠攏,專業加速能力就越被稀釋。
「我把這兩個本質上矛盾的詞硬連在一起,公司必須一步一步走那條極其狹窄的路,在擴展計算邊界的同時,守住最重要的專業化能力。」
第一步是可編程像素著色器,第一次向可編程性邁進。第二步是在著色器中加入 IEEE 標準兼容的 FP32 浮點運算,這一步吸引了那些此前在 CPU 上做流處理和數據流計算的研究者。他們發現,GPU 的計算密度極高,又能兼容他們原有的軟件邏輯。這直接促成了 Cg 語言,再到 CUDA。
![]()
將 CUDA 搭載到 GeForce 消費級顯卡是整個歷史中最關鍵也最痛苦的決策。
黃仁勛說,計算平臺的價值完全取決于裝機量,而不是架構的優雅程度。他舉 x86 為例:這是歷史上被批評最多的架構,遠沒有同期那些被頂尖計算機科學家精心設計的 RISC 架構優雅,但 x86 活下來了,RISC 大多失敗了。原因只有一個:裝機量。
「當時 GeForce 每年出貨數百萬塊顯卡。我們說,不管用戶用不用 CUDA,都把它裝進每一臺 PC 里,用這個作為培育裝機基數的起點。同時我們去大學里寫教材、開課程、到處推廣 CUDA。在那個年代,PC 是主要的計算載體,沒有云,我們等于把超算塞進了每一個在校學生和研究人員的手里,總有一天會有驚喜發生。」
代價是慘烈的。CUDA 讓 GeForce 的成本大幅上升,將英偉達的毛利率徹底壓垮,公司毛利率本已只有 35%,成本增加 50% 之后,全部利潤蒸發。市值從約 80 億美元一路跌至 15 億美元,在底部徘徊了相當長的時間。
「但我們一直扛著 CUDA,一直搭載在 GeForce 上。英偉達是 GeForce 建起來的家,是 GeForce 把 CUDA 送到了所有人手里。研究人員和科學家在大學里發現了 CUDA,因為他們本來就是游戲玩家,他們自己攢電腦,他們拿 PC 組件搭集群。」
后來,這成為深度學習革命的基礎設施。對于如何作出這類賭注式決策,黃仁勛說,他的決策過程始于好奇心,然后是推理。當推理系統在內心足夠清晰地呈現出「這件事一定會發生」時,他便開始相信它,而一旦相信,就會去實現。
但更重要的是他管理集體信念的方式:他從不等到決策那一天才宣布,而是通過每一次外部信息、工程里程碑、行業新發現,持續向董事會、管理團隊、員工、合作伙伴一點一點地鋪設認知基礎。
![]()
「到了宣布的那一天,我希望所有人的反應是:『Jensen,你怎么現在才說?』收購 Mellanox 是這樣,全力押注深度學習是這樣,現在 Groq 也是這樣,我已經鋪墊了兩年半。」
他把 GTC 大會描述為向全行業塑造未來認知的工具,不只面向員工,也面向合作伙伴和整個生態。「我們不生產計算機,也不搭建云。我們是計算平臺公司,任何人都無法直接購買我們的產品,但我們向所有層級開放平臺。在我的產品準備好之前,必須先讓所有人相信它將要到來。」
Ilya 說數據耗盡了,黃仁勛說他搞錯方向了
對于 Scaling Laws(縮放定律/擴展定律),黃仁勛提出了一個系統性框架,包含四個相互咬合的層次。
第一條是預訓練擴展定律。模型越大,訓練數據越多,AI 越聰明。
當 Ilya Sutskever 表示「預訓練數據耗盡」時,業界一度恐慌,認為 AI 到了天花板。黃仁勛認為這個擔憂搞混了方向:人類生產的數據確實有限,但合成數據的比重會越來越高,而且這并不奇怪,人類知識本來就是「合成」的,知識在人與人之間流轉、被重新詮釋、再創作、再消費。AI 現在已經能夠以真實數據為基礎大量生成合成訓練數據,預訓練的瓶頸從數據量轉移到了算力。
第二條是后訓練擴展定律。通過指令微調、強化學習等方式持續精煉模型能力,這個空間仍然廣闊。
第三條是測試時擴展定律,也就是推理階段的計算投入。
黃仁勛說,當初很多人預判推理是「簡單的」,認為推理芯片只需要小而廉價,完全不需要英偉達那樣昂貴復雜的產品,將來推理市場會是一個被商品化的低端市場。「這在邏輯上就說不通。預訓練是記憶和歸納,是閱讀;推理是思考、推理、規劃、搜索、嘗試、分解陌生問題。思考怎么可能是計算輕量級的?」事實證明他是對的,測試時擴展的計算消耗遠超市場預期。
![]()
第四條是智能體擴展定律。一個大語言模型變成一個智能體,在測試時去查數據庫、使用工具、分配子任務,同時派生出大量子智能體。「擴充英偉達規模最簡單的方法是多雇員工,而智能體的分裂速度比雇人快多了。」這些智能體在運行過程中積累大量有價值的經驗和數據,其中的精華會反哺預訓練,再經后訓練精煉,再經測試時增強,形成完整的閉環飛輪。
「歸根結底,智能的擴展取決于一件事:算力。」
對于如何在硬件設計層面預判 AI 模型的走向,黃仁勛坦言這是最難的部分之一,因為 AI 模型架構每六個月就會迭代一次,而系統和硬件架構的迭代周期是三年。
英偉達的應對策略包括三條:內部做基礎研究和應用研究,自己訓練模型,獲得一手體感;作為全球唯一與所有 AI 公司同時合作的平臺公司,廣泛傾聽行業前沿的挑戰;以及保持架構的靈活性,讓 CUDA 能隨算法演進而演進。
他舉了混合專家模型(MoE)的例子:正是預判到 MoE 的崛起,英偉達才將 NVLink 從 8 路擴展到 72 路,使一個完整的 4 萬億乃至 10 萬億參數模型能夠在單一計算域內運行,行為上如同一塊巨大的 GPU。
![]()
而 Vera Rubin 一代機架相較于 Grace Blackwell 機架,最顯著的變化在于增加了存儲加速器,引入了全新的 Vera CPU,還有專為智能體任務設計的 Rock 機架,因為智能體工作時需要頻繁訪問文件系統、調用工具、執行代碼,這與單純運行 LLM 推理是完全不同的工作負載。
「為什么在 Claude Code、Codex、OpenClaw 出現之前,我們就設計好了這一代架構?因為推理根本不需要等到具體產品出現,你只需要坐下來認真思考:一個大語言模型要成為真正的數字工人,它必須做什么?它必須訪問文件系統獲取真實數據,必須能上網查資料,必須會用工具,必須能派生子任務。這些都不是玄學,就是基本邏輯。」
他還用了一個生動的思想實驗:想象十年后最強的 AI 智能體是一個人形機器人,進入你家干活,更可能的情形是它使用你家里現有的工具,比如微波爐,還是它的手指會隨時變成錘子、手術刀或者微波發生器?答案顯然是前者。「我描述的,其實就是 OpenClaw 幾乎所有的核心特性。」
黃仁勛眼中的馬斯克:一個把自己變成所有人最高優先級的人
Fridman 提到黃仁勛曾高度稱贊馬斯克在孟菲斯以四個月時間建成 Colossus 超算,目前已達 20 萬塊 GPU 的規模。黃仁勛闡述了他從中看到的工程與管理哲學。
他說,馬斯克是一個能在多個高深領域同時保持深度的人,同時又是出色的系統思考者。他習慣性地對每一件事追問三個問題:這是必要的嗎?必須這樣做嗎?必須花這么長時間嗎?層層追問之后,系統被剝離到最小必要形態,能力卻完整保留。
![]()
「他也會親自出現在問題發生的現場。有問題,他就去現場,『把問題給我看』。這種做法能打破大量『這就是我們一貫的做法』的慣性。每個供應商都有很多客戶和項目,他的做法是讓自己成為所有人項目里的最優先級,而且他是靠親身示范做到的,不是靠嘴說。」
他描述了 Fridman 也同樣經歷過的一個細節:馬斯克曾蹲在機架旁邊和工程師一起研究如何插拔線纜,目的是減少出錯概率。「從每一個細節積累起來的直覺,讓你能同時看清微觀的低效和宏觀的系統性問題,然后你才有資格說『讓我們換一種完全不同的方式來做這件事』。」
為什么中國科技圈天然傾向于開源
談及最近訪問中國之行,黃仁勛表示,全球約 50% 的 AI 研究人員是中國人,其中大多數仍在中國國內工作。中國科技行業崛起的時間節點,恰好與移動互聯網時代高度重合,使他們能夠以軟件為突破口進入全球競爭。
他認為,中國科技生態之所以能持續輸出大量頂尖公司,有幾個結構性原因。
第一是競爭烈度。中國并非一個統一的大市場,而是由無數個省和城市組成的競爭體系,這導致每個垂直領域都出現了數量驚人的競爭者,電動車如此,AI 公司亦然,最終在激烈競爭中存活下來的必然是極其優秀的企業。
第二是開放共享的文化。中國工程師圈子高度依賴于學校、公司之間的人際網絡,同學就是終身兄弟,朋友就是同行。黃仁勛說,中國工程師的優先級排序是:家人第一,朋友第二,公司第三。這個排序直接決定了他們對待知識的態度。
他們的工程師,兄弟在那家公司,朋友在那家公司,大家都是同學。同學這個概念,在中國意味著一輩子的兄弟。所以他們分享知識的速度極快,根本沒有理由把技術藏著掖著,放到開源上就好了。
第三是崇尚工程的社會文化。這是一個崇尚建造的國家。
他由此延伸到英偉達的開源戰略,特別提到 Nemotron 3,這是一個 1200 億參數的開放權重混合專家模型,架構上融合了 Transformer 與狀態空間模型(SSM)。
英偉達推進開源有三重動機:其一,自己訓練模型是極致協同設計的一部分,能讓硬件團隊直接感知模型架構的走向;其二,專有模型和開源模型各有必要,開源是讓 AI 真正擴散到每個行業、每個國家、每個研究者和學生手中的必要條件;
其三,AI 遠不只是語言,生物學、物理、氣象、流體等領域都需要專門訓練的模型,英偉達要確保每個行業都能獲得世界級的 AI 基礎模型。
43000 個人和數百萬開發者,共同撐起英偉達護城河
被問及英偉達最重要的競爭護城河,黃仁勛給出了一個清晰的排序。
第一是 CUDA 的安裝基數。
他說,即便二十年前有人做出了一個技術上更出色的替代架構,比如 GUDA 或 TUDA,也很可能失敗。因為決定架構成敗的從來不只是技術,而是有多少開發者將自己的軟件建立在這個平臺上。
CUDA 今天的地位,來自 43000 名英偉達員工數十年的持續投入,也來自數百萬開發者將他們的軟件棧壓注在這個平臺上的信任。
他還強調了英偉達執行速度的重要性:任何一個開發者只要選擇了 CUDA,幾乎可以確定六個月后它會變得更好十倍;他開發的軟件能觸達幾億臺設備、覆蓋所有主要云服務商、所有主要行業、所有主要國家;而且他能確信英偉達會在可預見的未來持續維護和改進 CUDA。「把這幾點加在一起,如果我是一個開發者,我會首先選 CUDA,并且把最多的資源投入到 CUDA 上。」
![]()
第二護城河是生態系統的橫向覆蓋。英偉達將極其復雜的系統縱向整合,但同時向每一家公司的計算平臺橫向開放接入,從谷歌云、亞馬遜 AWS、微軟 Azure,到 CoreWeave、Nscale 這樣的新興算力公司,到制藥企業的超算,再到電信基站邊緣設備、汽車、機器人、衛星。
一個架構覆蓋了全球幾乎所有行業。
對于英偉達未來能否達到 10 萬億美元市值,黃仁勛的推演從兩個根本性變化出發:計算從檢索式轉向生成式,意味著算力需求量級躍升;計算機從倉儲單元轉變為生產工廠,意味著它從成本中心變成了直接與企業營收掛鉤的利潤中心。他預計世界 GDP 增速將會加快,而計算占 GDP 的比例將達到過去的 100 倍以上。
他提到英偉達的 3 萬億美元收入路徑在他看來是「當然可能」的,并沒有任何物理定律約束這一數字的實現,更重要的是,英偉達的增長不依賴于從現有競爭對手手中奪取份額,而是依賴于一個幾乎從零開始生長出來的全新市場。
「當英偉達是 100 億美元的公司時,你沒法說『如果他們從誰那里拿到 10% 份額就能增長多少』。他們的想象力需要從零構建。但我有的是時間,每一次 GTC 都會讓這件事變得更加真實。」
談及智能體時,他將 OpenClaw 比作「Token 的 iPhone」:「消費者直接能用到了。iPhone 級別的產品到了,它是有史以來增長最快的應用,一飛沖天,就這樣。」
玩家對 AI 糊感的憤怒,其實是一面鏡子
黃仁勛說,GeForce 至今仍是英偉達最重要的品牌營銷策略:人們十幾歲時因為游戲認識英偉達,進入大學和職業生涯后自然轉向 CUDA 和專業工具。
被問及史上最重要的游戲,他給出兩個答案:從文化與行業影響力看是 Doom,它把 PC 從辦公工具變成了家庭娛樂設備;從游戲技術看是 Virtua Fighter。近年的代表作則是完整實現光線追蹤渲染的《賽博朋克 2077》。
![]()
談及 DLSS 5 引發的玩家爭議,他理解那種對「AI 糊感」的反感,承認這是真實存在的審美問題。
但他解釋,DLSS 5 的工作前提是三維幾何數據的嚴格約束,每一幀都完全忠實于藝術家定義的空間結構和紋理風格,做的是增強而非覆蓋。「玩家以為 DLSS 會在成品游戲上做后處理,這個理解是錯的。它嵌入在創作流程里,藝術家決定用還是不用。」系統也完全開放,工作室可以自行訓練模型、指定卡通或水彩等任意風格。
他隨后作出一個更宏觀的觀察:玩家對 AI 糊感的敏感,恰恰說明人類真正在乎的是創作者留下的那些不完美的印記。「只要 AI 是輔助藝術家的工具,它就是好的。」
此外他還提到英偉達為游戲開發者提供的次表面散射皮膚著色器,這項技術模擬光線穿透皮膚淺層后散射的物理現象,讓游戲人物皮膚呈現出更接近真實的半透明質感。「這些都是工具,由藝術家決定怎么用。我們只是提供工具箱。」
AGI、編程的未來與人類的位置
在 AGI 定義問題上,Fridman 以「能夠從零創立并運營一家市值超十億美元的科技公司」作為測試標準,黃仁勛的回答是:這個門檻,我認為 AI 現在已經達到了。
他設想一個 AI 創建了某款應用,短時間內吸引數十億用戶,完成商業化后退出,這和互聯網時代那些曇花一現的爆款網站并無本質差異,而那些網站的技術復雜度遠低于 OpenClaw 今天能生成的東西。「我不知道具體會是什么,但我在互聯網時代也沒有預測到任何那些公司。」他同時強調,100000 個智能體建立一個持續運營的英偉達的概率是零,但創建一個短暫的爆款應用并從中獲利,完全可能已經在發生了。
關于編程的未來,黃仁勛認為編程的定義本身需要重寫。編程的本質是規格說明,即告訴計算機要構建什么。在這個定義下,能做到這件事的人數量將從 3000 萬擴展到 10 億。每一個木匠、水管工、會計師都將成為自己行業里的創新者,因為 AI 讓他們能夠以自然語言表達意圖,并將其轉化為實際產品。「如果我是一個木匠,我看到 AI,我會非常興奮。如果我是一個水管工,我會完全瘋狂。」
![]()
他用輻射科醫生的案例回應了「AI 會消滅職業」的擔憂:計算機視覺在 2019 年前后達到超人水平,曾被普遍預測輻射科醫生將消亡。結果是所有輻射科平臺都整合了 AI、輻射科醫生數量不降反升,現在全球還出現了輻射科醫生短缺。原因很簡單:能更快讀片,就能讀更多片,就能服務更多病人,醫院營收增加,需要更多輻射科醫生。
「那個預警走得太遠,嚇跑了很多本該進入這個行業的人,這是真實的傷害。英偉達的軟件工程師數量只會增加,不會減少。他們的職業目的是解決問題,而解決問題這件事的每一個組成部分,評估結果、團隊協作、診斷問題、創新、連接不同領域,這些都不會消失。」
在工作中倒下,是最好的結局
被問及是否思考自己的死亡,黃仁勛的回答十分誠實。
「我真的不想死。我有很好的家庭,有非常重要的工作。這不是『一生難得一次的體驗』,而是整個人類文明難得一次的體驗,我正在其中。英偉達是歷史上最重要的科技公司之一,這件事我非常認真。」
對于繼承人規劃,他的回應十分出人意料:他說他「不相信繼任規劃」,但原因恰恰是認真思考了這個問題。如果你真的關心自己離開后公司的命運,那么你今天應該做的,是把你所學、你所理解、你所積累的全部知識、洞察和判斷,以最高頻率傳遞給周圍所有人。
「每一次會議都是推理會議。我學到的任何東西,沒有在我桌上停留超過一秒鐘的,立刻就指向某個人:去研究這個,這個東西很了不起,你會想了解它的。我在持續地賦能周圍所有人,讓他們的能力不斷提升。」
![]()
他說自己希望的結局是在工作中倒下,而且是瞬間的,沒有漫長的痛苦過程。
對于人類未來 100 年的希望,他說他一生都對人性的善意保有高度信心,盡管偶爾會被辜負,但結果一次又一次證明他是對的,而且往往超出預期。
「現在有那么多我們想解決的問題、想建造的東西、想做的好事,都在我們的有生之年變得可以觸及。消滅疾病,這是合理的期待。大幅減少污染,這是合理的期待。這一切,怎么可能不讓人心動?」
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.