![]()
新智元報道
編輯:桃子
【新智元導讀】老黃深夜祭出最強挑釁:所有自研芯片都是「紙老虎」!他直言谷歌TPU、亞馬遜Trainium根本不敢上臺打擂,并首次揭秘了英偉達從「電子到Token」的終極護城河。
自研芯片全是「紙老虎」!
在最新訪談中,英偉達CEO甩出了一句極其挑釁的宣言——
谷歌TPU沒來,亞馬遜Trainium沒來,根本沒一個敢露面。
![]()
直白講,在AI算力的終極對決賽中,除了英偉達,能打的對手還沒出現!
在近兩小時播客中,老黃與主持人Dwarkesh Patel展開了一場極具火藥味且深度的對話。
他不僅重申了英偉達的技術護城河,更對當前的全球競爭格局,表達了冷峻的預判。
![]()
訪談中,最震撼人的一個鏡頭是——
面對別人的質疑,老黃霸氣外露地回懟道,「我醒來從沒覺得自己是個loser」。
「我們又不是一輛汽車(We are not a car)」。
![]()
![]()
近兩小時對談中,所有的精彩亮點如下:
公開叫陣TPU、Trainium上MLPerf打擂,至今無人應戰;
拋出新思維模型:輸入電子、輸出token,中間層就是英偉達;
英偉達擁有全球最低的TCO,在同等能耗下,token產出效率世界第一;
罕見認錯,低估了Anthropic這步棋。但Anthropic只是特例,全世界只有一個;
真正卡脖子的不是EUV光刻機,是水管工和電工。
![]()
把「電子」轉化成token
這就是護城河
訪談一開場,Dwarkesh瞄準了英偉達護城河,提出了一個尖銳的問題——
既然英偉達本質上是設計軟件,然后交給臺積電代工、由海力士提供內存,那么如果未來AI讓軟件變得像大宗商品一樣廉價,英偉達的估值是否也會崩塌?
對此,老黃提出了一個全新的「思維模型」。
輸入的是電子,輸出的是token,而中間層就是英偉達
![]()
他認為,制造一個token就像制造一個分子,如何讓這一個token比另一個token更有價值,背后蘊含著極其高深的藝術、工程與科學。
而這種「電子到token」的轉化過程極其復雜,很難被平庸化。
最重要的是,英偉達的護城河在于「五層蛋糕」生態系統,他們堅持做盡可能少、但在必須做的領域做到極難的策略。
![]()
而對于「英偉達靠鎖定稀缺供應鏈建立護城河」的說法,老黃承認,這確實是對手難以企及的優勢。
他特別強調,這種優勢源于一種「前瞻性的結盟」,具體怎么講?
合作之前,AI藍圖早就繪好了
英偉達不僅僅是砸錢買產能,更是在幾年前就開始說服臺積電、美光等公司的CEO,向他們描繪AI產業未來的規模。
GTC,就是一場大型「教育會」
老黃調侃道,自己的GTC演講更像是「教育」,他必須讓整個供應鏈看清未來的趨勢,才能引導全球的資源向AI產業傾斜。
![]()
所謂的「瓶頸」,都是暫時的
當談到邏輯芯片、CoWoS封裝、HBM內存的緊缺,是否會限制AI的增速時,老黃表現得非常淡定。
他指出,在巨大的市場需求信號面前,任何硬件瓶頸通常只需2-3年就能通過大規模擴產解決。
![]()
英偉達已在「預取」(Prefetching)未來的瓶頸,技術授權是一部分,另一種方式就是「投錢」。
比如,幫助合作伙伴Lumentum、臺積電提前布局硅光子、雙面探測等前沿技術。
有趣的是,老黃認為真正的長久挑戰往往在更下游:
- 能源:無論是重工業化還是建設 AI 工廠,能源政策的滯后才是長期難題;
- 勞動力:真正的稀缺資源不是EUV光刻機,而是能落地AI數據中心的「水管工和電工」。
![]()
這里再mark一下Hinton那句話,去做水管工
喊話谷歌TPU來戰,沒人打贏英偉達
接下來,才是整場訪談中最刺激的一部分。
Dwarkesh提出了一個令市場不安的觀察:
目前全球最頂尖的三個AI模型中,其中兩個(Claude和Gemini)是在谷歌TPU上訓練的。
這是否意味著,英偉達GPU并非不可替代?
老黃對此進行了強有力的反擊,他認為完全是「降維打擊」,并把英偉達的成功歸結為一種完全不同的計算范式。
「加速計算」降維打擊
TPU只是一個「張量處理單元」,英文帶做的是「加速計算」。
「加速計算」的應用范圍遠超AI,涵蓋了分子動力學、量子色動力學、流體力學、粒子物理以及大規模數據處理。
如今,AI算法演進極快。
![]()
如果明天出現一種新架構,高度可編程的CUDA可以無縫支持,而固化的ASIC芯片可能直接變成「電子垃圾」。
雖然矩陣乘法是AI的核心,但創新的關鍵在于——快速發明新內核。
老黃透露,Blackwell之所以比Hopper飆升50倍性能,靠的是通過CUDA對MoE等新架構,進行的深度底層協同設計。
他將CUDA比作英偉達最寶貴的資產——
全球有數億顆英偉達 GPU,分布在所有主流云平臺和邊緣設備中。
開發者寫出的代碼,可以「一次編寫,到處運行」。
他將CPU比作凱迪拉克,人人都能開得不錯;而英偉達的加速器則是F1賽車。
![]()
![]()
雖然普通人能開到100碼,但只有英偉達的專家能將其性能推向極限,幫助客戶通過優化軟件棧直接獲得2-3倍的性能提升。
TCO經濟學,token產出最多
面對「大客戶是否會為了省錢而自研芯片」的質疑,老黃給出了一組非常硬核的商業邏輯:
英偉達的計算棧是全球「總擁有成本」(TCO)最低的,沒有之一。
![]()
在同樣的1GW數據中心里,使用英偉達架構產出的token數量,是全球最高的。
現場,老黃直接公開叫陣,歡迎Trainium、或TPU參加像InferenceMAX或MLPerf這樣的第三方基準測試。
但實際上,沒有人愿意「露面」。
![]()
很多人抱怨英偉達 70% 的利潤率太高,但老黃一針見血地指出,即便是找博通代工 ASIC 芯片,對方也要賺走65%的利潤。
為了省那5%的利潤,而放棄整個生態系統的兼容性,這在商業邏輯上是講不通的。
Anthropic只是一個特例,并非趨勢
Dwarkesh追問,既然英偉達這么好,為什么Anthropic還是選擇了與谷歌、亞馬遜簽下數十億美元的TPU訂單?
![]()
面對如此尖銳的問題,老黃又是如何自圓其說?
他用一句話總結:Anthropic只是一個特例,并非趨勢。
![]()
![]()
緊接著,他表示,如果沒有Anthropic,TPU、Trainium的增長無從談起,100%是Anthropic帶來的。
但世界上只有一家Anthropic!
![]()
與此同時,老黃罕見地承認了策略上的失誤:
當時,谷歌和亞馬遜通過巨額融資,換取了Anthropic使用其自研算力的承諾。
我當時的錯誤在于,沒有深刻意識到,如果不給這些實驗室提供資金支持,他們別無選擇。
英偉達的商業「哲學」:不越界
訪談的后半段,Dwarkesh又提出了一個極具誘惑力的假設——
既然英偉達擁有無可匹敵的算力資源,為什么不直接下場成為一家超大規模云服務商(Hyperscaler)?
老黃的回答揭示了英偉達的商業哲學:「做盡可能多,同時也做盡可能少」。
![]()
世界上已經有很多云服務商了。
如果英偉達自己下場做云,就是與自己的客戶(亞馬遜、微軟等)直接競爭。
英偉達寧愿選擇投資像CoreWeave這樣的「原生AI云」,通過背書和資金支持,讓生態系統更加多元化,而不是親自去蓋機房、拉電線。
老黃認為,一個健康的公司應當專注于那些「如果我不做,就沒人能做成」的事情。
如果英偉達不去研發NVLink、不投入20年時間在虧損中堅持CUDA、不開發像cuLitho這種計算光刻庫,這些技術可能永遠不會出現。
![]()
投資,但不「選妃」
近來,英偉達對OpenAI、Anthropic進行了規模驚人的投資,分別達300億和100億美金規模。
對此,老黃非常嚴肅地表示,「我們不選贏家」。
一方面,這不是我們的工作,另一方面,我深知創業的不確定性。
![]()
![]()
他回憶起英偉達初創時,全球有60家圖形芯片公司,而英偉達當時甚至是架構最「離譜」的一個。
英偉達的策略是——
如果世界需要這些偉大的AI公司存在,而VC無法提供百億級別的資金支撐,那么英偉達就會出手。
但目的是為了讓整個生態「繁榮」,而不是為了控制它們。
![]()
做好一件事,CUDA就夠了
在訪談的尾聲,Dwarkesh 提出了一個具有思辨性的問題:
英偉達現在財大氣粗,人才濟濟,為什么不并行開發幾種完全不同的架構?
比如像Cerebras那樣的晶圓級芯片,或者像特斯拉Dojo那樣的「巨型封裝」,以防萬一AI架構發生突變。
老黃的回答,展現了他作為頂級架構師的極度自信與理性。
模擬器已否定了一切
他直言,英偉達擁有世界頂尖的「模擬系統」。
我們可以在模擬器里,模擬出你能想象到的任何架構。結果證明,那些方案在性能和效率上都更糟。
也就是說,從數據上的驗證已經否定了這一切。
![]()
Dwarkesh又問道,如果臺積電先進制程(如N2/N3)產能見頂,英偉達是否會回到老舊的N7工藝重新設計 Hopper?
對此,老黃表示,這種「回流」研發的成本高得離譜。
英偉達寧愿選擇在先進制程上「傾力向前」,通過先進封裝和數值計算的改進來彌補產能壓力。
擴產Groq:搶占「溢價token」市場
眾所周知,英偉達幾個月前將「推理芯片之王」Groq納入了CUDA生態。
這背后,蘊含著老黃對推理市場「分層化」的深刻洞察:
以前token要么免費,要么極便宜。
但現在,如果更快的響應速度,能讓一名年薪幾十萬美金的軟件工程師效率翻倍,那么企業愿意支付極高的溢價。
![]()
過去英偉達追求的是高吞吐量(單位時間內產出的token總量),但現在他們開始布局「低延遲、高溢價」的推理細分市場。
這意味著未來英偉達的工廠將同時產出「平價高產」和「尊享速達」兩種token。
如果沒有AI革命,英偉達會怎樣?
訪談以一個浪漫的假設結束。如果深度學習革命從未發生,英偉達現在會在做什么?
老黃語氣中帶著一種使命感:「即便沒有AI,英偉達也會非常龐大」。
![]()
通用計算的終結
他的基本信念是,「摩爾定律」下的通用計算(CPU)已經走到了盡頭。
無論有沒有AI,科學、工程、物理、圖像處理這些領域,都急需「加速計算」。
科學的民主化
英偉達的初心是讓每一位學生、每一位科學家,通過一張GeForce顯卡就能處理分子動力學或地震數據。
這種「加速計算」的底色,其實早在AI爆發前就已經涂就。
不僅僅是張量
老黃強調,在GTC演講的開篇,他總會花大量時間講計算光刻(cuLitho)、量子化學和數據處理。
AI確實令人興奮,但這個世界上還有很多重要工作與AI無關,張量并不是計算的唯一方式。我們想幫助每一個人。
![]()
參考資料:
https://www.dwarkesh.com/p/jensen-huang
https://x.com/dwarkesh_sp/status/2044456498441708013?s=20 https://www.youtube.com/watch?v=Hrbq66XqtCo
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.