![]()
新智元報(bào)道
編輯:艾倫
【新智元導(dǎo)讀】英偉達(dá)豪擲200億美元「買(mǎi)空」Groq,意在補(bǔ)齊AI下半場(chǎng)的關(guān)鍵短板。隨著AI從「訓(xùn)練」轉(zhuǎn)向「推理」,尤其是「慢思考」模型的興起,傳統(tǒng)GPU的顯存延遲瓶頸日益凸顯。黃仁勛通過(guò)此舉,直接吞并了Groq領(lǐng)先的SRAM架構(gòu)與軟件團(tuán)隊(duì),既買(mǎi)到了通往低延遲推理的「快車(chē)票」,省去兩年研發(fā)時(shí)間,又成功對(duì)谷歌微軟實(shí)施了技術(shù)封鎖,確保了英偉達(dá)在AI算力領(lǐng)域的絕對(duì)統(tǒng)治。
硅谷的圣誕節(jié)前夜,黃仁勛給全球半導(dǎo)體行業(yè)送上了一份震耳欲聾的「禮物」。
不是新品發(fā)布,而是一筆高達(dá)200億美元的支票。
英偉達(dá)宣布與AI芯片獨(dú)角獸Groq達(dá)成非排他性技術(shù)授權(quán)協(xié)議,并直接「打包」帶走了包括創(chuàng)始人Jonathan Ross在內(nèi)的核心工程團(tuán)隊(duì)。
![]()
Jonathan Ross
就在幾個(gè)月前,Groq的估值還僅僅是69億美元。
英偉達(dá)不僅支付了近三倍的溢價(jià),而且實(shí)際上并沒(méi)有買(mǎi)下Groq這家公司(Groq的云服務(wù)業(yè)務(wù)將被拆分出售),它只是買(mǎi)走了Groq的技術(shù)圖紙和造圖紙的人。
在這個(gè)看似瘋狂的溢價(jià)背后,藏著黃仁勛對(duì)AI下半場(chǎng)戰(zhàn)局最深刻的焦慮與最冷酷的算計(jì)。
這是一場(chǎng)針對(duì)「推理時(shí)代」的搶灘登陸戰(zhàn)。
并不是所有的算力
都需要「大卡車(chē)」
要理解這筆交易,我們必須先理解AI算力正在發(fā)生的分裂。
瑞士銀行在一份犀利的研報(bào)中,將未來(lái)的AI推理市場(chǎng)比作一條「雙車(chē)道高速公路」。
![]()
第一條車(chē)道,是英偉達(dá)目前統(tǒng)治的領(lǐng)地。
這里跑的是像GB300這樣的通用GPU重型卡車(chē)。
它們裝備了海量的HBM(高帶寬內(nèi)存),如同卡車(chē)后面拖著的巨大集裝箱。
這種架構(gòu)極其靈活,能裝載巨大的模型,特別適合大模型的「訓(xùn)練」階段,或者處理那種對(duì)吞吐量要求極高、但對(duì)延遲沒(méi)那么敏感的任務(wù)。
但問(wèn)題出在第二條車(chē)道。
隨著AI從「訓(xùn)練」轉(zhuǎn)向「推理」(即用戶實(shí)際使用AI的過(guò)程),尤其是當(dāng)我們需要AI進(jìn)行實(shí)時(shí)語(yǔ)音對(duì)話、高頻交易或者自動(dòng)駕駛決策時(shí),GPU的短板暴露了。
GPU在計(jì)算時(shí),需要頻繁地從外部的HBM內(nèi)存中搬運(yùn)數(shù)據(jù),這就像卡車(chē)司機(jī)每送一次貨都要跑回倉(cāng)庫(kù)取件,由于物理距離的存在,這種「搬運(yùn)」成為了速度的瓶頸。
Groq所在的,正是這第二條車(chē)道——「ASIC類(lèi)架構(gòu)」。
Groq的設(shè)計(jì)哲學(xué)非常激進(jìn):它拋棄了外部?jī)?nèi)存,直接將數(shù)據(jù)存放在芯片內(nèi)部的SRAM(靜態(tài)隨機(jī)存取存儲(chǔ)器)中。如果說(shuō)GPU是拖著集裝箱的卡車(chē),Groq的LPU(語(yǔ)言處理單元)就是把行李直接背在身上的短跑運(yùn)動(dòng)員。
數(shù)據(jù)就在計(jì)算單元旁邊,伸手即得。
這種架構(gòu)帶來(lái)了極致的低延遲和確定性。
對(duì)于正在興起的「推理」市場(chǎng),Groq展示了一種英偉達(dá)GPU難以企及的響應(yīng)速度。
黃仁勛看到了這一點(diǎn)。
他意識(shí)到,隨著推理市場(chǎng)的爆發(fā),如果英偉達(dá)繼續(xù)只依靠GPU這條腿走路,一旦市場(chǎng)風(fēng)向從「吞吐量」轉(zhuǎn)向「低延遲」,他可能會(huì)被Groq這樣的刺客從側(cè)翼?yè)舸?/p>
押注「思維鏈」的未來(lái)
除了底層的硬件架構(gòu),促使英偉達(dá)掏出200億美元的另一個(gè)關(guān)鍵誘因,是AI模型本身進(jìn)化出的新形態(tài)——推理模型。
具備「慢思考」能力的模型,在回答復(fù)雜問(wèn)題前,會(huì)進(jìn)行漫長(zhǎng)的思維鏈推理。
在這個(gè)過(guò)程中,模型需要進(jìn)行類(lèi)似蒙特卡洛樹(shù)搜索(MCTS)的操作,在無(wú)數(shù)種可能性的路徑中快速試錯(cuò)、跳轉(zhuǎn)。
這正是Groq技術(shù)的用武之地。
蒙特卡洛樹(shù)搜索本質(zhì)上需要極高頻的生成與驗(yàn)證,且高度依賴內(nèi)存的快速讀寫(xiě)。
SRAM架構(gòu)在這種任務(wù)中的表現(xiàn),理論上要遠(yuǎn)優(yōu)于依賴HBM的傳統(tǒng)GPU。
英偉達(dá)的算盤(pán)打得很精。
他們預(yù)見(jiàn)到2026年及以后,AI編碼、復(fù)雜數(shù)學(xué)求解等「重推理」任務(wù)將成為主流。
通過(guò)吸收Groq的技術(shù),英偉達(dá)可以改良自己的芯片設(shè)計(jì),使其在處理這種復(fù)雜的「思維搜索」時(shí)更加游刃有余。
200億美元
買(mǎi)的是「時(shí)間」與「護(hù)城河」
既然SRAM架構(gòu)這么好,英偉達(dá)自己造不出來(lái)嗎?
當(dāng)然造得出來(lái)。英偉達(dá)的Rubin路線圖中早已規(guī)劃了相關(guān)技術(shù)。
但在科技界,時(shí)間就是一切。
Groq最核心的資產(chǎn)是它打磨了數(shù)年的軟件棧。
Groq的創(chuàng)始人Jonathan Ross曾是谷歌TPU的核心設(shè)計(jì)者,他們團(tuán)隊(duì)構(gòu)建了一套能讓編譯器完美調(diào)度芯片內(nèi)部數(shù)據(jù)流的軟件系統(tǒng)。
對(duì)于AI芯片來(lái)說(shuō),硬件是肉體,軟件(編譯器、內(nèi)核庫(kù)、運(yùn)行時(shí))才是靈魂。
如果英偉達(dá)從頭搭建一套類(lèi)似Groq的高效SRAM軟件生態(tài),可能需要18到24個(gè)月。
在日新月異的AI戰(zhàn)場(chǎng),落后18個(gè)月等于退賽。
正如UBS分析師所言:「英偉達(dá)是在買(mǎi)現(xiàn)在的入場(chǎng)券,而不是兩年后的。」
此外,這是一次經(jīng)典的防御性收購(gòu)。
甚至可以說(shuō),這是一次「掐尖」。
Groq是市場(chǎng)上公認(rèn)的、唯一能對(duì)英偉達(dá)構(gòu)成實(shí)質(zhì)性技術(shù)差異化威脅的初創(chuàng)公司。
雖然Groq面臨資金壓力,但它的技術(shù)如果落入谷歌、亞馬遜或微軟這些云巨頭手中,將直接在這個(gè)細(xì)分領(lǐng)域?qū)τミ_(dá)形成合圍之勢(shì)。
通過(guò)這種「非獨(dú)家授權(quán)+挖人」的特殊交易結(jié)構(gòu),英偉達(dá)非常聰明地繞過(guò)了監(jiān)管機(jī)構(gòu)對(duì)「全面收購(gòu)」的嚴(yán)苛反壟斷審查(類(lèi)似于微軟對(duì)Inflection AI的操作),同時(shí)實(shí)質(zhì)上「掏空」了Groq的競(jìng)爭(zhēng)力。
Groq剩下的云服務(wù)業(yè)務(wù)將作為殼公司被出售,而它的靈魂——技術(shù)與人才,已經(jīng)全部姓「黃」了。
豪賭未來(lái)的壟斷
這200億美元,雖然看似昂貴,但對(duì)于手握600億美元現(xiàn)金儲(chǔ)備的英偉達(dá)來(lái)說(shuō),不過(guò)是其龐大帝國(guó)的一筆保險(xiǎn)費(fèi)。
通過(guò)這筆交易,英偉達(dá)向市場(chǎng)釋放了一個(gè)清晰的信號(hào):英偉達(dá)絕不允許任何死角存在。
無(wú)論是通用的訓(xùn)練市場(chǎng),還是特異化的推理市場(chǎng);
無(wú)論是依靠HBM的大力出奇跡,還是依靠SRAM的極致靈巧,英偉達(dá)都要通吃。
它不僅要成為AI時(shí)代的「石油商」,還要買(mǎi)下所有可能開(kāi)發(fā)出「新能源」的實(shí)驗(yàn)室。
Jonathan Ross這位曾經(jīng)想挑戰(zhàn)巨龍的勇士,最終帶著幾十億美元的財(cái)富歸順了巨龍。
這或許是硅谷創(chuàng)業(yè)故事中最現(xiàn)實(shí)的注腳:如果你不能打敗壟斷者,那就努力成為壟斷者眼中最昂貴的獵物。
當(dāng)塵埃落定,英偉達(dá)的護(hù)城河再次被加寬加深。
對(duì)于其他競(jìng)爭(zhēng)者而言,這道墻顯得更加高不可攀。
參考資料:
https://x.com/rohanpaul_ai/status/2005658206543233378
秒追ASI
?點(diǎn)贊、轉(zhuǎn)發(fā)、在看一鍵三連?
點(diǎn)亮星標(biāo),鎖定新智元極速推送!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.