文 | 硅谷101
1萬億美元,這是接下來21個(gè)月,英偉達(dá)GPU訂單的收入預(yù)期。
剛過去的GTC大會(huì),黃仁勛開始停止了講芯片的故事。他開始瞄準(zhǔn)更大的敘事:token經(jīng)濟(jì),而這將是更有野心且更持久的市場蛋糕。
![]()
本篇文章,我們將拆解英偉達(dá)的五層蛋糕生態(tài)體系。一萬億美元收入是怎么算出來的?基于Groq的LPU將給英偉達(dá)帶來什么新的機(jī)會(huì)?還有黃仁勛在光通信上的提前布局與未來Scale-across(跨區(qū)域擴(kuò)展)的AI工廠機(jī)會(huì)。以及OpenClaw的里程碑后,英偉達(dá)押注的token經(jīng)濟(jì)學(xué)將會(huì)如何發(fā)展,給算力市場將帶來如何的挑戰(zhàn)呢?
推理拐點(diǎn)已至,多模態(tài)+OpenClaw
2026年的英偉達(dá)的GTC敘事建立在兩個(gè)背景和事件:一是AI應(yīng)用得到落地;二是OpenClaw的爆火帶動(dòng)了全球的agent生態(tài)。這讓黃仁勛在GTC演講中高呼,推理拐點(diǎn)已經(jīng)到來。
新云(Neocloud)廠商GMI Cloud創(chuàng)始人Alex Yeh在跟我們對話中就透露,北美的需求暴增是來自多模態(tài)和編程,而OpenClaw帶來的token需求則主要來自中國。
Alex的觀察和我們最近在硅谷與很多業(yè)內(nèi)人士的探討是相似的,因?yàn)楸泵烙脩簦貏e是有技術(shù)背景的開發(fā)者已經(jīng)很適應(yīng)用Claude Cowork去做一些agent任務(wù)。所以雖然OpenClaw是從硅谷火出圈的,但遠(yuǎn)沒有到國內(nèi)那么卷的程度。
![]()
所以,以上是目前AI發(fā)展現(xiàn)狀的一個(gè)大背景。有了推理需求飆升和OpenClaw爆火這兩個(gè)趨勢,黃仁勛的整個(gè)演講的敘事邏輯就完全和去年不同了:以前英偉達(dá)賣芯片給云廠商和AI公司,而如今,老黃要賣token給全世界每一家公司。
這也是我參加今年老黃keynote的最大感受,看看PPT上面的這些小心心,就知道黃仁勛的姿態(tài)是we love everybody(我們擁抱所有人)。所以,今年GTC的最關(guān)鍵主題是“生態(tài)”,而不是“芯片”。
早在GTC開會(huì)的幾天前,英偉達(dá)就放出了一篇名為“AI五層蛋糕”的文章來為大會(huì)造勢,預(yù)示黃仁勛在今年大會(huì)上強(qiáng)調(diào)的是垂直整合能力和生態(tài),而不是單芯片。
![]()
簡單來說,黃仁勛給外界畫了一個(gè)更大的餅。我們先來說黃仁勛在GTC演講中提到的一萬億這個(gè)數(shù)字。
一萬億美元,過于保守還是極度樂觀?
黃仁勛在去年的GTC上說,當(dāng)前和下一代的GPU架構(gòu)Blackwell和Vera Rubin的訂單收入,從當(dāng)時(shí)到2026年年底會(huì)達(dá)到5000億美元。這次,他將這個(gè)預(yù)期直接上調(diào)了一倍,說截止現(xiàn)在,到2027年年底,預(yù)計(jì)光是Blackwell和Vera Rubin的訂單收入,會(huì)直接到1萬億美元。
![]()
要注意,這個(gè)收入是不包括英偉達(dá)新發(fā)的CPU和基于Groq的LPU芯片等其他產(chǎn)品線的訂單收入,而光是GPU架構(gòu)的訂單。他在媒體閉門會(huì)上專門特別澄清,原因是因?yàn)檫@樣外界能直觀的感受到英偉達(dá)的GPU上的業(yè)務(wù)增長。
而對于各大企業(yè)對算力的CapEx(資本支出),我們的嘉賓認(rèn)為是還將繼續(xù)上漲,一邊是推理需求會(huì)繼續(xù)上漲,另一邊的原因是隨著前沿模型的競爭趨于白熱化,訓(xùn)練這邊的需求也不會(huì)降低。
![]()
圖片來源:Business Insider
為什么黃仁勛今年不強(qiáng)調(diào)單芯片,連Rubin再下一代計(jì)算架構(gòu)Feynman也只是略微提了一點(diǎn)?除了老黃要把英偉達(dá)的企業(yè)敘事拔高到“AI factory”以及要給所有人賣token之外,其實(shí)還因?yàn)楫a(chǎn)能跟不上,市面上還是瘋狂缺卡。現(xiàn)在市面上大家根本買不到最先進(jìn)的卡,就連兩三年前發(fā)布的舊卡,H100、H200用了幾年甚至能超原價(jià)賣,同時(shí)軟件生態(tài)和各種配置也都跟不上老黃的速度,所以他再強(qiáng)調(diào)單卡的性能提升,對市場來說根本沒有意義。
所以看起來,光是GPU的售賣,這一萬億美元的收入規(guī)模并不算過度樂觀,而是真有這樣的需求量。但顯然,黃仁勛是不滿足這一萬億的,他布局的是全生態(tài)。當(dāng)token成為大宗商品,“算力即收入”,黃仁勛接下來的動(dòng)作,是想把他定義中的“AI五層蛋糕”給全部打透,讓英偉達(dá)持續(xù)成為AI產(chǎn)業(yè)線中,持續(xù)最賺錢的機(jī)器。
拆解五層蛋糕,同質(zhì)化博弈與生態(tài)護(hù)城河Chapter 3.1:五層蛋糕與“同質(zhì)化”
黃仁勛定義的AI五層蛋糕,從下到上,分別是能源層(這里是電力等基礎(chǔ)供應(yīng)),之后是芯片層(英偉達(dá)的核心業(yè)務(wù):卡),再之上是基建層(包括云廠商及旗下的數(shù)據(jù)中心,再往細(xì)分就是土地、供電、冷卻系統(tǒng)、建筑工程、網(wǎng)絡(luò)通信等),前三層被統(tǒng)稱為AI工廠(AI factories)。
![]()
再往上,模型層有OpenAI、谷歌Gemini和Anthropic這樣的頂尖模型,也有包括英偉達(dá)自研的一系列開源模型。而在應(yīng)用層,則是英偉達(dá)針對不同的賽道研發(fā)技術(shù),包括機(jī)器人、自動(dòng)駕駛、工業(yè)制造、編程和企業(yè)級AI Agent等等。
你是不是有點(diǎn)疑惑,老黃是在布一盤什么局呢?這五層蛋糕難道每一層英偉達(dá)都能吃透嗎?
我們的嘉賓任楊認(rèn)為,每一層蛋糕中,如果每個(gè)玩家水平都差不多,沒有絕對領(lǐng)先或者絕對壟斷者,那么這一層的利潤就會(huì)被攤薄,這被稱為“being commoditized”(同質(zhì)化)。議價(jià)權(quán)最終還是回到有絕對領(lǐng)先和壟斷的這一層,也就是英偉達(dá)的芯片層。
也就是說,最終黃仁勛還是要靠賣芯片。但在其它層的蛋糕中,英偉達(dá)要扶持起自己的軟件生態(tài),定義規(guī)則。就像打造CUDA這樣的護(hù)城河一樣,一旦在新的市場定義了范式,當(dāng)市場爆發(fā),大家發(fā)現(xiàn)最好用的還是英偉達(dá)的平臺,那最后要買的依然是英偉達(dá)的算力和卡。
![]()
比如說,英偉達(dá)看到基建層,像谷歌云和AWS這樣的云廠商有強(qiáng)議價(jià)權(quán)之后,又扶持起了CoreWeave和Nebius這樣的Neocloud(新云平臺)來進(jìn)行競爭。再比如說,在模型層,英偉達(dá)各種大小模型開源了一大堆,而且這次黃仁勛專門組織了一場全球最核心的開源模型論壇,就是想在模型這一層,試圖在長期削弱SOTA(State of the Art,最頂尖)的頂級閉源模型的議價(jià)權(quán)。而在應(yīng)用層,英偉達(dá)也在研發(fā)自動(dòng)駕駛和機(jī)器人,等待行業(yè)大規(guī)模爆發(fā),為的就是提前布局生態(tài)位。
所以老黃正在時(shí)刻關(guān)注的其他層級的蛋糕,但最賺錢的,始終還是芯片這一層。所以這一層也是黃仁勛盯得最緊的。而這次的GTC上,傳達(dá)出兩個(gè)信號。
Chapter 3.2:基于Groq的ASIC反擊戰(zhàn)
第一個(gè)信號就是在芯片層,老黃發(fā)布了基于Groq研發(fā)出的LPU。要知道,對Groq的非獨(dú)家技術(shù)授權(quán)交易是去年12月圣誕節(jié)前后才宣布的,花了200億美元現(xiàn)金,可以說是英偉達(dá)有史以來最大的一起交易。
![]()
Groq創(chuàng)始人Jonathan Ross在最新的福布斯雜志采訪中爆料說,和Groq的交易這件事情也是老黃只花了三周就迅速做的決定。
而到如今的GTC才3個(gè)月,產(chǎn)品就已經(jīng)出來了,只能說,老黃和英偉達(dá)卷起來真的沒其他人什么事兒了。那么,為什么要“收編”Groq呢?
簡單來說就是GPU架構(gòu),即使強(qiáng)如Vera Rubin,擅長的是高吞吐的并行計(jì)算,做prefill(上下文預(yù)處理)和attention(注意力計(jì)算)很厲害,但在超高速token生成(decode)這個(gè)任務(wù)上就沒那么給力了。因?yàn)閠oken生成的特點(diǎn)是只能一個(gè)一個(gè)的生成,整個(gè)過程必然是串行鏈?zhǔn)降模瑢γ恳徊窖舆t極其敏感。
所以,“高吞吐”和“低延遲”本身互相矛盾,很難兩全。而Groq就是這個(gè)矛盾的解法。
![]()
Groq通過SRAM(靜態(tài)隨機(jī)存取存儲器)設(shè)計(jì),天生就適合做推理和token生成。就像Groq創(chuàng)始人Ross打動(dòng)黃仁勛的那個(gè)類比,他說強(qiáng)大的GPU就像“18輪大卡車”,但推理任務(wù)就像“最后一公里配送”,本身就更適合更靈活高效的面包車。他對老黃說,如果你要為美國建立一個(gè)物流網(wǎng)絡(luò),最佳答案是,18輪卡車和面包車你都需要。
![]()
而在OpenClaw之后的Agent時(shí)代,老黃通過與Groq的深度技術(shù)與人才合作,解決了token生成的挑戰(zhàn),這是非常關(guān)鍵的一步。而Groq的新芯片融入英偉達(dá)體系后,英偉達(dá)宣稱這將解鎖3000億美金的增量市場,可以說,這200億花得值了。但還有個(gè)內(nèi)存上的小難題:SRAM缺點(diǎn)是第一很貴、第二很占面積、第三容量做不大。
單顆Groq 3 LPU只有500MB SRAM,而Rubin GPU是288GB HBM4,差了500多倍,根本存不下萬億參數(shù)的模型。英偉達(dá)的解法是用Dynamo軟件把推理過程拆成兩半,Vera Rubin這邊的GPU負(fù)責(zé)prefill和attention,而Groq負(fù)責(zé)之后decode和token生成。
![]()
所以我們看到,一顆Rubin GPU配上8顆Groq 3 LPU,統(tǒng)一為一個(gè)推理單元。而Groq 3 LPX整機(jī)把256顆LPU裝進(jìn)一個(gè)機(jī)架,能提供128GB SRAM、40PB/s帶寬、315 PFLOPS推理算力和640TB/s互連帶寬。
英偉達(dá)和Groq的這個(gè)交易目前還面臨反壟斷的一些潛在調(diào)查,因?yàn)樯嫦印白兿嗍召彙保m然這個(gè)做法已經(jīng)是硅谷巨頭在AI時(shí)代的基本操作了)。但LPU已經(jīng)和三星在合作量產(chǎn)了,預(yù)計(jì)今年第三季度出貨,而Vera Rubin機(jī)架已經(jīng)在微軟Azure云上運(yùn)行。
![]()
同時(shí),英偉達(dá)聯(lián)手Groq還有一個(gè)戰(zhàn)略上的意義,就是打出了ASIC反擊戰(zhàn)。我們之前文章說過,ASIC是專項(xiàng)芯片,雖然不如GPU那么通用,但如今卻是各大科技巨頭自研的重點(diǎn),以及各個(gè)云廠商也都在扶持ASIC芯片的研發(fā)試圖蠶食英偉達(dá)GPU的利潤率和議價(jià)權(quán),包括谷歌的TPU也是ASIC芯片,Groq本身也是ASIC芯片。但英偉達(dá)這次告訴外界:我也可以做ASIC芯片,而且還跟我自己的GPU結(jié)合,性能更強(qiáng)哦!
Chapter 3.3:枯木逢春的CPU與備受期待的CPX
我們再來看看芯片層的第二個(gè)關(guān)鍵詞:CPU,是不是有種“枯木逢春”的感覺。AI agent時(shí)代token經(jīng)濟(jì)的崛起不但救了Groq一命,連老古董CPU也重新成為了香餑餑。
雖然GPU擅長訓(xùn)練和運(yùn)行AI模型,但隨著Agent工作負(fù)載的不斷增長,這些系統(tǒng)需要傳輸海量數(shù)據(jù),并協(xié)調(diào)跨多個(gè)智能體的工作流程,這使得CPU在現(xiàn)代AI基礎(chǔ)設(shè)施中的重要性絲毫不亞于GPU。
![]()
所以,英偉達(dá)在這次GTC上發(fā)布了Vera CPU,被稱為“全球首款專為代理式AI與強(qiáng)化學(xué)習(xí)時(shí)代打造的處理器”,其效率是傳統(tǒng)機(jī)架級CPU的2倍,速度提升50%。包括AI編程明星公司Cursor也為Vera CPU站臺,說提升了他們的整體吞吐量和效率,給客戶帶來了更快速靈敏的編程agent體驗(yàn)。
![]()
在芯片層這里,還有一個(gè)秘密武器就是CPX。
這是黃仁勛在去年9月的AI基礎(chǔ)設(shè)施峰會(huì)上推出的、專門針對長語境推理進(jìn)行優(yōu)化的芯片,可以說代表了GPU設(shè)計(jì)的一個(gè)全新類別。這款芯片能夠處理百萬級tokens的軟件編程和生成式視頻,在速度和效率方面實(shí)現(xiàn)突破性提升,被外界認(rèn)為能進(jìn)一步穩(wěn)固英偉達(dá)在推理上的優(yōu)勢。
![]()
有意思的是,老黃這次的演講中根本沒有提到CPX,也讓業(yè)界很好奇,英偉達(dá)目前在芯片層的這套組合拳:GPU、CPU、LPU、CPX,是否會(huì)進(jìn)一步拉開與競爭對手的差距。
總結(jié)一下,這五層蛋糕互相支撐但又互相牽制,黃仁勛在做的是要整合這五層,確保英偉達(dá)在每一層都有話語權(quán),無論是扶持甲方的競爭對手,還是自研開源模型,還是在不同領(lǐng)域保持開放合作來定義行業(yè)入口和范式。
![]()
英偉達(dá)的敘事早已不是“芯片”而已了,黃仁勛在發(fā)布會(huì)上手握單芯片的那些名場面已經(jīng)成為過去。未來,是完整的AI factory,是更宏大的token經(jīng)濟(jì)學(xué)。這讓英偉達(dá)的護(hù)城河也早已超越CUDA,讓競爭對手們更難攻破它的生態(tài)帝國。
前沿技術(shù)布道:CPO、太空數(shù)據(jù)中心與Scale-across布局
黃仁勛一直在布局下一個(gè)即將爆發(fā)的產(chǎn)業(yè),也對前沿技術(shù)非常的敏銳。他這次在發(fā)布會(huì)上沒太多提共封裝光學(xué)CPO,以及數(shù)據(jù)中心中機(jī)組的Scale-up(縱向擴(kuò)容)和Scale-out(橫向擴(kuò)容)。
![]()
但英偉達(dá)在3月初分別向光子技術(shù)巨頭Lumentum和Coherent各注資20億美元,并鎖定數(shù)十億美元采購承諾及未來產(chǎn)能權(quán)益。這兩家公司都是CPO的核心供應(yīng)鏈,業(yè)內(nèi)人士認(rèn)為,黃仁勛這是在準(zhǔn)備為下一代“吉瓦級AI工廠”去鋪墊光互聯(lián)的底座。
目前產(chǎn)業(yè)里面還在討論Scale-up(縱向擴(kuò)容)和Scale-out(橫向擴(kuò)容),而行業(yè)人士說,黃仁勛已經(jīng)在思考說再下一步,Scale-across(跨域擴(kuò)展),也就是不同數(shù)據(jù)中心的互聯(lián)怎么去解決了。
當(dāng)然,還有更遙遠(yuǎn)的一些布局,包括在演講中黃仁勛提到的太空數(shù)據(jù)中心等等,我們也寫過一篇文章介紹。
在這篇文章的最后,我還想稍微聊聊整個(gè)芯片和數(shù)據(jù)中心供應(yīng)鏈目前的一個(gè)情況。如果大家還記得這五層蛋糕,可以看到能源和數(shù)據(jù)中心供應(yīng)鏈的基礎(chǔ)層,決定了芯片的產(chǎn)能,也決定了整個(gè)AI模型和應(yīng)用能否得到足夠的算力支撐,也決定了AI的進(jìn)程。
供應(yīng)鏈全面吃緊,內(nèi)存與能源的超級周期
我們在GTC期間跟供應(yīng)鏈的朋友聊天,得到的信息是:缺,什么都短缺。
Alex對我們表示,最近全球地緣政治,特別是中東的波動(dòng)讓能源價(jià)格異常波動(dòng),這也給全球AI數(shù)據(jù)中心的能源供應(yīng)帶來了更高不確定性,但能源這一部分大概會(huì)占到token定價(jià)的10%左右,而讓token價(jià)格高居不下的,還是供應(yīng)鏈短缺帶來的價(jià)格飆升,特別是內(nèi)存方向。
而我們也在會(huì)展現(xiàn)場訪問到了內(nèi)存市場的決定性大贏家三星,他們認(rèn)為,緊缺的狀態(tài)至少要持續(xù)到27年年底。
隨著Agenic時(shí)代來臨,非常多的范式會(huì)發(fā)生變化,有機(jī)遇也有挑戰(zhàn),而GTC會(huì)依然是AI行業(yè)的指路標(biāo),我們也會(huì)為大家繼續(xù)關(guān)注以上我們的提到的這些產(chǎn)業(yè)和方向。不知道在一年后的GTC大會(huì),我們的世界會(huì)被AI加速多少呢?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.