網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

老黃200億“鈔能力”回應谷歌：聯(lián)手Groq，補上推理短板

2025-12-28 16:24:06　來源: 36氪

北京舉報

分享至

Jay 發(fā)自凹非寺量子位 | 公眾號 QbitAI

老黃穩(wěn)準狠，谷歌的TPU威脅剛至，就鈔能力回應了。

200億美元說砸就砸，只為拉攏一家炙手可熱的「鏟子新工廠」——Groq。

這無疑也標志這家芯片巨頭，面向AI新時代的一次重大布局。但在某種程度上，也的確反映出老黃對包括TPU在內等一眾新芯片范式的擔憂。

所以，Groq究竟能為英偉達帶來什么？

針對這個問題，知名科技投資人Gavin Baker發(fā)表了自己的觀點。

而他的這一連串技術剖析，紛紛指向了英偉達帝國防守最薄弱的那塊領土——推理。

推理方面，Groq LPU的速度遠超GPU、TPU，以及目前所見的任何ASIC。

Gavin Baker

這一觀點得到大量網(wǎng)友點贊：

GPU架構根本無法滿足推理市場對低延遲的需求，片外HBM顯存速度實在太慢了。

網(wǎng)友觀點

但也有網(wǎng)友指出，LPU所采用的SRAM，或許并不能勝任長下文decode。

對此，Gavin認為英偉達可以通過產品「混搭」的方式解決。

Gavin Baker

下面具體來看——

Groq：英偉達斥200億美元購入的一劑疫苗

Gavin認為，GPU在新時代水土不服的根本原因在于——推理過程的兩個階段，prefill和decode，對芯片能力有截然不同的要求。

先看prefill：

這一步，簡單來說就是讓模型「讀題」，把用戶提供的關鍵信息在腦子里記好，用于后續(xù)調用。

讀題過程中，模型會一次性吃下用戶所給的上下文，所有輸入token都可以同時計算。

這正是GPU最擅長的舞臺，其為圖形處理而生，可以一次性計算數(shù)千個像素，天生適合處理并行任務。

在這個準備階段，模型不用急著響應用戶問題。即便有延遲，模型也完全可以通過顯示「思考中」來掩蓋等待時間。

因此，相比「速度」，prefiil需要芯片有更大的上下文容量。

但到了decode，這套邏輯不再適用。

decode是串行任務，必須得一個一個token挨著算。更重要的是，用戶還會親眼看到token被一個個「打」出來的過程。這種情況下，延遲對用戶體驗來說是致命的。

然而，GPU的數(shù)據(jù)主要存放在HBM，而不是緊貼算力核心的片上存儲。這意味著，每生成一個token，GPU都需要重新從內存中讀取數(shù)據(jù)。

這時候，GPU的問題就暴露出來了——大部分算力都處于閑置，F(xiàn)LOPs根本用不滿，常常在等內存把數(shù)據(jù)搬過來，實際計算量遠小于prefill。

相比之下，Groq有更好的解決方案——LPU。

比起HBM，LPU使用直接集成在芯片硅片中的SRAM。這種片上存儲的模式不需要讀取數(shù)據(jù)，這讓其速度比GPU快100倍。即使只處理單個用戶，它也能跑出每秒300–500個token的速度，并能始終保持滿負荷運轉。

事實證明，在速度這一塊，LPU幾乎打遍天下無敵手——不僅是GPU，就連TPU，以及市面上絕大多數(shù)ASIC都難以望其項背。

但這并非沒有代價的。

相比GPU，LPU的內存容量小的多。單顆Groq的LPU芯片，片上SRAM只有230MB。

作為對比，即便是英偉達的H200 GPU，也配備了高達141GB的HBM3e顯存。

結果就是：你必須把成百上千顆LPU芯片連在一起，才能跑起一個模型。

以Llama-3 70B為例，用英偉達GPU的話，只需要兩到四張卡，塞進一個小型服務器盒子里就能搞定。而同樣的模型，需要數(shù)百顆LPU，占地面積也將遠大于使用GPU的數(shù)據(jù)中心。

這意味著，即便單顆LPU價格更低，整體硬件投資依然會非常巨大。

因此，AI公司在考慮LPU時，最重要的問題是——

用戶是否愿意為「速度」付費？

對于這個問題，一年前的市場還不無法給出答案。但從Groq如今的業(yè)績情況來看已經(jīng)非常明確：「速度」是個真實存在的巨大需求，并且仍在高速成長。

而對英偉達而言，這不僅是一個新的業(yè)務盤，更是一個顛覆者暗流涌動的高風險地帶。倘若錯失這個風口，英偉達在AI時代的機會可能會被新玩家顛覆，就像英偉達當年通過游戲業(yè)務顛覆其他競爭對手一樣。

為了抵抗這些競爭者蠶食自己的護城河，英偉達選擇注射名為Groq的疫苗。希望通過人才收購引入新血液，補齊這塊低延遲場景的推理短板，幫助英偉達這艘巨艦擺脫創(chuàng)新者窘境。

「鏟子」進入新時代

TPU的崛起，給英偉達的金鐘罩撕開了一道裂縫。

通過自研芯片，谷歌成功擺脫了對英偉達天價GPU的依賴，這在很大程度上幫助谷歌削薄了訓練和推理成本，這讓谷歌在服務大量免費用戶的情況下，依然能維持相當健康的財務賬面。

谷歌通過Gemini 3 Pro的絕地翻盤，證明了GPU并非AI時代的唯一解。在技術周期高速迭代的背景下，作為AI「心臟」的芯片，也需要根據(jù)不同的發(fā)展階段做出相應的調整。

隨著基礎模型的進展放緩，AI競爭的重點開始從訓練層轉向應用層。而在AI應用市場，「速度」對用戶體驗而言至關重要。

而這次人才收購Groq，雖然也是變相承認了公司在推理賽道的不足，但同樣標志著英偉達帝國的又一次擴張。

稱霸預訓練的英偉達，這次要借Groq的東風，入局競爭對手噴涌而出的「推理大陸」。

而在這個新市場，英偉達或許不再能像如今這樣風光。

正如Groq CEO所言，推理芯片是項高銷量、低利潤的苦活。這與即便炒到天價也有客戶搶著要，毛利率高達70-80%的GPU截然不同。

參考鏈接：[1]https://x.com/gavinsbaker/status/2004562536918598000[2]https://www.uncoveralpha.com/p/the-20-billion-admission-why-nvidia

本文來自微信公眾號“量子位”，作者：關注前沿科技，36氪經(jīng)授權發(fā)布。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

連英偉達都開始抄作業(yè)了

鈦媒體APP 2025-12-26 09:29:21
20 跟貼 20
5年燒掉一個英偉達！OpenAI會是下一個安然嗎？

新智元 2025-11-15 13:05:04
0 跟貼 0

對話知存科技CEO王紹迪：存算一體如何重塑AI計算的未來

DeepTech深科技 2025-12-26 18:17:43
0 跟貼 0

特斯拉通過「物理圖靈測試」！英偉達機器人主管爆吹，圣誕節(jié)刷屏

量子位 2025-12-26 15:21:32
36 跟貼 36
萬億估值的代價：OpenAI正在失去它的締造者

36氪 2025-12-28 10:00:30
2 跟貼 2

RLinf v0.2嘗鮮版發(fā)布，像使用GPU一樣使用你的機器人！

機器之心Pro 2025-12-26 14:02:06
0 跟貼 0

英偉達AI世界模擬器？AI P圖學會「腦補」過程了！

新智元 2025-11-04 19:33:28
0 跟貼 0
AI正在闖入你的深夜

鈦媒體APP 2025-12-28 16:35:08
0 跟貼 0

警惕Deepfake！國安部提示→

澎湃新聞 2025-12-28 00:30:22
439 跟貼 439
對話南理工楊劍飛：機器人走進家庭之前，必須先學會如何與人共處

DeepTech深科技 2025-12-28 18:38:06
0 跟貼 0
趙何娟對話張雷：能源成本再降50%，AI時代才會真正到來｜2025 T-EDGE 全球對話

鈦媒體APP 2025-12-28 17:06:49
0 跟貼 0
老黃封神！英偉達市值首破4萬億美元，全球第一

新智元 2025-07-10 00:09:26
0 跟貼 0
黃仁勛：中國的AI市場無論有沒有英偉達都會進步與華為是競爭對手不是敵人

財聯(lián)社 2025-07-21 10:22:14
7 跟貼 7
1400億收編Groq，英偉達的收購史，以及黃仁勛的并購邏輯

虎嗅APP 2025-12-28 00:23:08
35 跟貼 35
離譜：256G內存比RTX5090還貴，你要為AI買單嗎？

機器之心Pro 2025-12-26 14:13:10
9 跟貼 9
Valve拒絕上市，300人創(chuàng)收162億，干翻蘋果谷歌

占領了思想 2025-12-25 19:32:55
0 跟貼 0
巴菲特謝幕、OpenAI攪動萬億市值、谷歌強勢崛起......2025全球十大商業(yè)事件盤點

華爾街見聞官方 2025-12-28 14:08:14
0 跟貼 0
突破！中國量子電腦超谷歌

誠閱ChengYue 2025-12-27 17:13:09
0 跟貼 0
美媒：美國"斬殺線"在中國網(wǎng)絡熱傳美國務院暫未置評

澎湃新聞 2025-12-28 10:24:07
26079 跟貼 26079
下一代谷歌頭顯，XREAL x Google 定義混合現(xiàn)實頭顯

愛范兒 2025-12-10 05:12:08
0 跟貼 0
高手之間的對決往往差在了硬件上

排山劇社 2025-12-25 08:55:53
1 跟貼 1
DeepMind負責人：2036 AI意識覺醒？LeCun怒懟：LLM路線全錯！

新智元 2025-12-16 16:55:25
0 跟貼 0
模型飛機試飛，鏡頭一轉發(fā)現(xiàn)事不簡單，美女吃了熊心豹子膽

夏正經(jīng) 2025-12-27 14:09:49
1 跟貼 1
15%全量Attention！「RTPurbo」阿里Qwen3長文本推理5倍壓縮方案

機器之心Pro 2025-12-23 12:52:34
0 跟貼 0
殲20也要電彈了？我國磁懸浮試驗出現(xiàn)殲20模型，準備上004航母？

奇點使者 2025-12-27 17:29:57
0 跟貼 0
余承東：我有一個夢想馬路上的所有車里都有華為的技術

每日經(jīng)濟新聞 2025-07-23 17:06:16
0 跟貼 0
英偉達CEO黃仁勛：AI會改變所有人的工作！

知了3C 2025-12-27 22:53:10
2 跟貼 2
110億芯片580億索賠，被荷蘭搶走的一切，中國必須連本帶利討回來

聞識 2025-12-28 14:24:40
1 跟貼 1
PS5到底還能戰(zhàn)幾年？外媒解析“買或等PS6”

游民星空 2025-12-28 16:31:06
0 跟貼 0
【ai agent智能體架構躍遷】1小時吃透 Agent 核心（設計模式全解析+代碼實戰(zhàn)）新手也能

盧菁老師 2025-12-24 17:13:20
0 跟貼 0
一家國產芯片公司的“上車”回憶錄

經(jīng)濟觀察報 2025-09-27 14:52:10
0 跟貼 0
英偉達200億沒買公司，卻掏空谷歌TPU之父！老黃盯上推理芯片

新智元 2025-12-25 23:25:12
0 跟貼 0
財政部：明年財政將促進居民就業(yè)增收

極目新聞 2025-12-28 12:14:55
7008 跟貼 7008
生娃“獎房子”，真金白銀鼓勵生育｜新京報快評

新京報 2025-12-27 19:47:14
7606 跟貼 7606
老黃豪擲200億美元帶走TPU核心班底

量子位 2025-12-26 20:28:55
0 跟貼 0
本周上線：完美世界《異環(huán)》、FunPlus《伊莫》測試招募中|游戲上線表

游戲茶館 2025-12-28 11:32:14
1 跟貼 1
PC玩家糾結死了！為了《GTA6》買PS5還是XSX

游民星空 2025-12-28 17:55:13
1 跟貼 1
海南封關，新加坡迅速靠攏美國，加強芯片管控，想要反將中國一軍

肖茲探秘說 2025-12-27 18:19:33
1 跟貼 1
2025年我總結了一套開發(fā) AI Agent 產品實戰(zhàn)方法（30分鐘加長版）

廢才俱樂部Club 2025-12-26 17:10:59
0 跟貼 0
我國首個“6車道改12車道”高速公路改擴建項目建成通車

新華社 2025-12-28 11:03:06
925 跟貼 925

36氪

讓一部分人先看到未來

150285文章數(shù) 2847626關注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

數(shù)碼

教育

手機

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
明末究竟有多難，無法阻止的歷史進程
李彥宏：百度離破產30天

手機 / 數(shù)碼

房產 / 家居

老黃200億“鈔能力”回應谷歌：聯(lián)手Groq，補上推理短板

特斯拉將在華布局自動駕駛？記者求證→

杭州"兔子警官"哄孩子式執(zhí)法火了 曾當過2年幼兒園老師

杭州"兔子警官"哄孩子式執(zhí)法火了 曾當過2年幼兒園老師

83分鐘絕殺！曼城2-1年度收官：英超6連勝狂飆

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

英偉達的收購史

理想的2026：L9不容有失，i9再戰(zhàn)純電？

態(tài)度原創(chuàng)

【直播】元旦游上海，黃浦普陀專場：黃浦新年三重奏?普陀“半馬蘇河”，靈！

華為FreeClip 2耳夾耳機通過星閃認證，有望近期OTA星閃音頻

于潔：教師怎樣走出這10個認知誤區(qū)

蘋果越戰(zhàn)越勇，小米、vivo、OPPO呢？

杭州"兔子警官"哄孩子式執(zhí)法火了曾當過2年幼兒園老師

杭州"兔子警官"哄孩子式執(zhí)法火了曾當過2年幼兒園老師

白敬亭現(xiàn)身冰雪大世界拍視頻還翻車了