公眾號記得加星標??,第一時間看推送不會錯過。
對于 GPU 加速器和互連制造商而言,人工智能推理最終可能會采用一種全新的方法——以至于英偉達在幾代之后最終制造的設(shè)備根本不能再被稱為 GPU 了。
以英偉達目前推出的數(shù)據(jù)中心級 GPU 加速器為例,幾乎可以得出這樣的結(jié)論。這些加速器看起來越來越不像圖形處理單元,而更像是向量和張量引擎、緩存和互連結(jié)構(gòu)的復(fù)雜集合,用于執(zhí)行相對低精度的數(shù)學(xué)運算,而這些運算正是 GenAI 和其他類型的機器學(xué)習(xí)以及有時 HPC 的基礎(chǔ)。
與 Groq 的這筆交易在很多方面都顯得十分奇特。首先,Groq 的投資者當初為何要出售股份,這一點值得深思。正如我們在分析AI 模型制造商 OpenAI 與 AI 硬件初創(chuàng)公司 Cerebras Systems(該公司與 Groq 幾乎同時成立于 2015 年,當時 AI 機器學(xué)習(xí)正開始蓬勃發(fā)展)之間價值 100 億美元的交易時所指出的那樣,令人費解的是,在低延遲、高吞吐量的 AI 推理至關(guān)重要,而 Groq 又是少數(shù)幾家能夠與英偉達 (Nvidia) 在該領(lǐng)域一較高下的供應(yīng)商之一的情況下,Groq 為何會在此時出售?Cerebras 的 CS-2 晶圓級計算引擎、谷歌的 TPU 以及亞馬遜網(wǎng)絡(luò)服務(wù) (AWS) 的 Trainium(由于 Trainium 可以同時進行 AI 訓(xùn)練和推理,因此現(xiàn)在幾乎沒人再提起 Inferentia 了)是僅有的幾款真正獲得市場認可的 AI XPU,而英偉達的 GPU 在訓(xùn)練和推理領(lǐng)域都占據(jù)主導(dǎo)地位,AMD 則憑借其數(shù)據(jù)中心 GPU 占據(jù)了一席之地。
從 Groq 的角度來看,現(xiàn)在正是推出英偉達 GPU 替代方案的最佳時機。英偉達的 GPU 雖然功能強大,但價格昂貴。此次收購交易中,英偉達獲得了 Groq 的學(xué)習(xí)處理單元 (LPU) 技術(shù)授權(quán),并挖走了 Groq 的大部分核心工程師,包括聯(lián)合創(chuàng)始人 Jonathan Ross 和首席運營官 Sunny Madra,總價高達 200 億美元。對于一家此前僅完成五輪融資、總計 17.5 億美元的公司來說,這筆交易可謂天價。該公司在 2025 年 9 月完成 E 輪融資(7.5 億美元)后,估值僅為 69 億美元。Ross 還曾獲得沙特阿拉伯承諾的 15 億美元投資,用于在達曼建設(shè)一座大型 GroqCloud 數(shù)據(jù)中心,但據(jù)我們所知,該項目至今尚未啟動。這將是 Groq 剩余部分將要追求的業(yè)務(wù),因為它基本上是 GroqCloud 服務(wù)、大量知識產(chǎn)權(quán),而且據(jù)我們所知,并沒有針對未來 LPU 或 GroqWare 產(chǎn)品線的計劃。
收購?fù)ǔ<婢叻烙瓦M攻的雙重目的,羅斯主導(dǎo)開發(fā)的完全調(diào)度編譯器——這使得LPU與羅斯在谷歌最初開發(fā)的TPU截然不同——是英偉達絕對不想看到落入對手之手的關(guān)鍵資產(chǎn)。英特爾需要收購人工智能的未來,尤其是基于推理的未來。如果它像傳聞所說的那樣對SambaNova感興趣,那么它也同樣對Groq和Cerebras感興趣。但英特爾資金短缺,而且美國政府如今也成為了它的投資者,時刻關(guān)注著它。AMD也曾是Groq的潛在收購方,如果Groq的軟件棧確實與眾不同,那么理論上AMD仍然有權(quán)授權(quán)該軟件棧以及任何它認為有用的硬件。
是的,我們知道。這真是太搞笑了。
沙特阿拉伯承諾為GroqCloud在沙漠中建立前哨站投資15億美元,但這與實際合同,甚至支票或電匯都截然不同。此外,如今15億美元對于人工智能硬件而言也算不上巨額資金,畢竟OpenAI已經(jīng)承諾投入約30吉瓦的容量用于人工智能硬件。根據(jù)不同的報價和具體情況,每吉瓦的成本在350億美元到500億美元之間。如果按照Sam Altman的容量規(guī)劃愿景,30吉瓦的容量需要1.5萬億美元。Groq與沙特阿拉伯的合作承諾比Cerebras剛剛與OpenAI簽署的協(xié)議規(guī)模小6.7倍,比OpenAI計劃構(gòu)建的規(guī)模還要小三個數(shù)量級。
所以,當羅斯和黃仁勛開始交談時,考慮到所有超大規(guī)模云服務(wù)商和云平臺構(gòu)建商都在創(chuàng)建自己的AI XPU,同時也在使用英偉達(有時也用AMD)的GPU,而像Anthropic這樣的模型構(gòu)建商也承諾使用谷歌的TPU和AWS的Tranium,2.9倍的估值或許看起來是一個相當不錯的退出價格。Groq的LPU進入中國市場將會面臨一些問題,因為那里才是真正的AI中心,而歐洲尚未找到以獨特且本土化的方式更充分地參與到GenAI熱潮中的方法。
即使拋開英偉達可能出于防御目的而收購Groq的所有理由,你也能理解為什么羅斯和Groq的投資者們對這筆交易感到滿意。因此,Groq的兩位聯(lián)合創(chuàng)始人之一 喬納森·羅斯現(xiàn)在成為了英偉達的首席軟件架構(gòu)師,而桑尼·馬德拉 則成為了英偉達的硬件副總裁。事情就是這樣。
此次收購的結(jié)構(gòu)很簡單:鑒于全球反壟斷監(jiān)管機構(gòu)對英偉達以69億美元收購Mellanox Technologies的行動遲緩,以及黃仁勛400億美元收購Arm的計劃被否決,英偉達此次選擇保留部分股權(quán),以免給人留下收購整個Groq的印象。可以肯定的是,美國政府將會修改相關(guān)規(guī)則,但我們也推測,黃仁勛此次收購也得到了特朗普總統(tǒng)的默許。
在我們看來,如果Groq團隊已被剝離,且剩余的Groq公司未來不再進行LPU的研發(fā),那么英偉達就可能面臨反壟斷的風(fēng)險,因為世界各國政府無論是否愿意,都對這類并購擁有發(fā)言權(quán)。如果英偉達不想觸怒監(jiān)管機構(gòu),它本可以以遠低于Groq當前估值的價格進行交易——那樣的話,Groq的創(chuàng)始人和投資者們就可以笑著關(guān)上大門,然后給AMD打個電話了。這里面充滿了膽量博弈。
還有一點:并沒有規(guī)定英偉達必須使用其已獲得授權(quán)的技術(shù)。公司被收購后卻被束之高閣,只因為它們可能顛覆現(xiàn)狀,這種情況屢見不鮮。我們最喜歡的例子就是Transitive公司,其QuickTransit模擬器只需稍作修改即可在Unix系統(tǒng)上運行大型機應(yīng)用程序,或在Linux系統(tǒng)上運行Unix應(yīng)用程序。QuickTransit被用于蘋果公司創(chuàng)建的“Rosetta”模擬環(huán)境,該環(huán)境旨在實現(xiàn)其PC從PowerPC處理器向X86處理器的過渡,而且效果出奇地好。IBM擔(dān)心QuickTransit會對其造成嚴重沖擊,因此在2008年末收購了Transitive。在一番關(guān)于在其Power Systems機器上模擬其他系統(tǒng)的花言巧語之后,這家藍色巨人在2011年徹底關(guān)閉了所有相關(guān)業(yè)務(wù),并且再也沒有提及此事。
Enfabrica 的收購與 Groq 的收購類似,都可能預(yù)示著架構(gòu)的改變……也可能不會。這或許只是 Nvidia 路線圖上技術(shù)融合的一種偽裝,實則是一種防御性策略。(Nvidia 以前從未這樣做過,但如今的 Nvidia 已非五年前或十年前的 Nvidia。)
Enfabrica 于 2021 年 6 月正式發(fā)布新作,當時我們對該公司未來的發(fā)展方向并不太了解。到了 2023 年 3 月,我們看到了它的進展:Enfabrica 的“Millenium”ACF-S 芯片將擴展內(nèi)存和主機 I/O 全部集成到單個芯片上,從而在機架式架構(gòu)中取代了網(wǎng)卡、PCI-Express 交換機、CXL 交換機以及機架頂部或葉交換機。
首款應(yīng)用 ACF-S 技術(shù)的產(chǎn)品名為 SuperNIC,它基于 CXL 技術(shù)打造了一款擴展內(nèi)存服務(wù)器,旨在大幅提升 AI 推理工作負載核心——鍵值緩存的規(guī)模和性能。這款名為 Emfasys 的內(nèi)存擴展器于 2025 年 7 月發(fā)布。值得一提的是,該公司創(chuàng)始人當時告訴我們,在四機架 GB200 NVL72 機架級服務(wù)器上添加一機架 Emfasys 內(nèi)存擴展器,即可將每個令牌的成本降低一半(這意味著通過擴展內(nèi)存,GPU 的吞吐量翻了一番)。
我們認為,英偉達有可能想要打造一臺性能更強大的推理機器,而這臺機器并非完全基于其現(xiàn)有的GPU架構(gòu),Groq和Enfabrica的技術(shù)將在其中發(fā)揮作用。但同樣有可能的是,這兩筆收購交易的真正目的是為了阻止其他公司搶占先機。而更有可能的是,兩者兼而有之。
https://www.nextplatform.com/2026/01/16/is-nvidia-assembling-the-parts-for-its-next-inference-platform/
(來源:編譯自nextplatform)
*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個人觀點,半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達一種不同的觀點,不代表半導(dǎo)體行業(yè)觀察對該觀點贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。
今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4290期內(nèi)容,歡迎關(guān)注。
加星標??第一時間看推送
求推薦
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.