<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      英偉達放棄GPU上LPU:新推理芯片被曝Groq即買即用,OpenAI先上車

      0
      分享至

      henry 發自 凹非寺
      量子位 | 公眾號 QbitAI

      世界第一也著急,英偉達迎來架構換血!

      據悉,在即將開幕的3月圣何塞GTC大會上,黃仁勛將發布一套全新的AI推理系統——

      核心是一顆專為推理優化的新芯片。

      而且芯片的首位大客戶已經敲定,就是剛剛完成1100億美元巨額融資的OpenAI。



      更引人關注的是,這款芯片的底層架構并非來自英偉達自研,而是由原Groq團隊打造的LPU(語言處理單元) 架構。

      這意味著:英偉達第一次在核心AI算力產品線上,大規模引入外部架構設計。

      而這次“不自造”的背后,是去年那筆震動行業的交易——

      英偉達斥資約200億美元,完成對Groq核心技術與團隊的“acqui-hire”(收購式招聘)。

      如今,這枚推理芯片,正是那筆投資的第一次落地。

      依舊是典型的黃仁勛式策略:買成熟方案,快速部署,直接上戰場,一分冤枉錢都不花。

      極致的ROI。

      是LPU,不是GPU

      據《華爾街日報》披露,英偉達正在開發一個新的推理計算系統,該系統將結合Groq設計的芯片,并在GTC大會上正式發布。



      與此同時,在OpenAI最新的融資文件中,這一計劃已現端倪:

      • 將擴大與英偉達的長期合作,包括使用3GW的dedicated inference capacity(專用推理算力),以及在Vera Rubin系統上提供2GW的訓練算力。

      如果老黃不跳票,那么這一“專用推理算力”極可能正是基于這顆新芯片。

      如開頭所說,一旦落地,這將是英偉達第一次在核心AI算力產品線上,大規模引入外部架構設計——

      Groq的LPU。

      選擇直接引入外部架構,而非完全自研,與時間窗口密切相關。

      近幾個月來,OpenAI等頭部客戶已在積極尋找更高效率的推理替代方案,并與其他芯片公司展開合作談判。

      在推理需求迅速增長的背景下,英偉達需要更快給出針對性的解決方案。

      而這次用LPU,而非GPU,原因就在于推理場景的適配上。

      GPU通常將大量模型參數存放在外部HBM(高帶寬內存)中,計算核心與內存之間需要頻繁數據搬運。在訓練階段,通過大規模并行可以攤薄搬運成本。



      但在推理尤其是decode階段,批量變小、延遲敏感,系統瓶頸更多來自數據移動而非算力本身。



      Groq的LPU架構改變了這一邏輯——

      它采用高密度片上SRAM,將數據“貼著算力跑”,極大縮短數據路徑,從架構層面降低延遲與能耗,更適配低延遲推理場景,理論最高速度可比GPU快100倍。



      隨著Agent應用逐漸普及,AI算力結構正在從“訓練優先”向“推理優先”轉移。

      推理不再只是訓練后的補充環節,而成為規模更大、頻率更高的長期負載。

      如果英偉達正式將LPU納入核心產品線,這不僅是一款新芯片的發布,更是對算力重心轉移的回應。

      這也解釋了為何英偉達在去年以約200億美元完成對Groq核心技術與團隊的整合,并引入創始人Jonathan Ross(谷歌TPU之父)等核心成員。



      可以說,推理市場正在重塑算力格局,而英偉達勢必必須務必拿下。

      英偉達推理芯片迎來威脅

      過去一年,隨著Agent應用爆發,算力需求結構正在發生明顯變化:市場重心從訓練轉向推理。

      訓練仍然重要,但推理的調用頻率更高、規模更大、持續時間更長,成本開始成為核心變量。

      一些AI服務商開始將訓練與推理分開部署——訓練繼續使用英偉達GPU,推理則轉向更具性價比的專用芯片。

      比如,上個月,OpenAI與Cerebras簽署數十億美元計算合作協議。

      Cerebras主打推理優化芯片,其首席執行官Andrew Feldman公開表示,其芯片在特定場景下快于英偉達GPU。

      Anthropic更多依賴Amazon Web Services與Google Cloud自研芯片支持模型運行,而非完全使用英偉達方案。

      Meta也與AMD達成了大規模芯片訂單合作,雙方正在聯合優化用于推理任務的GPU架構,以減少對英偉達的依賴。



      在國產方面,模型公司同樣開始轉向本土算力方案。

      在最新的消息中,DeepSeek甚至繞過英偉達,直接將DeepSeek V4的早期訪問權限獨家授予華為,并已在昇騰平臺完成模型遷移。

      另一個傳聞里,寒武紀也出現在關聯中。而不論哪一個傳聞,都不利于英偉達。

      而根據Bernstein Research預測,到2026年,華為在中國AI芯片市場份額可能達到50%,而英偉達份額或降至個位數。

      與此同時,英偉達的競爭對手也在強化推理專用架構布局。

      一方面是,早已在TPU布局的谷歌,以及在OpenAI最新融資計劃中拿下計算生態合作權的Amazon,都在推動自研芯片在高頻推理場景中的落地,其中亞馬遜將重點啟用自家的Trainium芯片支持Agent等應用。



      另一方面,國內諸如字節、阿里、百度等玩家也開始親自下場制造芯片。

      由此,趨勢已經很清晰:推理成為主戰場,而客戶開始分散風險。

      那么,為啥GPU不適合推理呢?

      因為訓練階段追求的是“大規模并行”和總體吞吐量,而推理階段則要追求“單token速度”和穩定響應。

      具體來說,推理則分為兩個階段:pre-fill:處理用戶輸入;decode:逐token生成輸出。

      真正決定用戶體驗的,是第二步——低延遲生成。

      此時系統瓶頸不在算力,而在頻繁的存取與搬運。GPU架構雖強,但為并行設計;LPU則調整了存儲與計算路徑,更貼合推理負載。

      正因如此,《華盛頓郵報》甚至評論道:這是AI浪潮以來,英偉達第一次在核心硬件層面面臨架構挑戰。

      雖然英偉達仍占全球GPU市場超過90%,Hopper、Blackwell、即將登場的Rubin系列依舊是訓練主力,但面對推理需求暴漲,英偉達也必須正面回應。

      而這枚LPU芯片,就是他們的答案。

      One more thing

      除了這枚神秘芯片,老黃之前還官宣表示:

      • 今年GTC大會上還將發布“世界前所未見”的新系列產品。

      外界普遍猜測包括:Rubin系列新一代GPU;Feynman系列全新架構芯片。

      或者更具體一點,跳票的消費級顯卡???

      [1]https://www.wsj.com/tech/ai/nvidia-plans-new-chip-to-speed-ai-processing-shake-up-computing-market-51c9b86e?st=SdUxv4&reflink=desktopwebshare_permalink

      [2]https://nvidianews.nvidia.com/news/rubin-platform-ai-supercomputer?ncid=no-ncid

      [3]https://berttempleton.substack.com/p/nvidias-blackwell-ultra-and-vera

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      特朗普宣布戰爭基本結束,伊朗當場拒絕:結束不由美國說了算

      特朗普宣布戰爭基本結束,伊朗當場拒絕:結束不由美國說了算

      Ck的蜜糖
      2026-03-10 14:28:44
      世界上最鋒利的物體為什么不能切割任何東西

      世界上最鋒利的物體為什么不能切割任何東西

      心中的麥田
      2026-03-09 19:42:31
      外交部:中方將采取必要措施保障自身能源安全

      外交部:中方將采取必要措施保障自身能源安全

      環球網資訊
      2026-03-09 15:55:04
      你最爽的經歷是什么?網友:約過一個比我大好幾歲的姐姐

      你最爽的經歷是什么?網友:約過一個比我大好幾歲的姐姐

      帶你感受人間冷暖
      2026-02-16 01:10:39
      一覺醒來,竟要和五位櫻花妹同居?日本電視臺親自下場就做了這?

      一覺醒來,竟要和五位櫻花妹同居?日本電視臺親自下場就做了這?

      17173游戲網
      2026-03-09 14:07:37
      曝曼聯夏窗2.3億預算!紅魔貝爾恢復單獨訓練,面臨競爭急于復出

      曝曼聯夏窗2.3億預算!紅魔貝爾恢復單獨訓練,面臨競爭急于復出

      羅米的曼聯博客
      2026-03-10 11:57:50
      鐵血硬漢也繃不住了!巴拉克首談18歲愛子離世:痛到無法呼吸

      鐵血硬漢也繃不住了!巴拉克首談18歲愛子離世:痛到無法呼吸

      仰臥撐FTUer
      2026-03-08 13:28:16
      1996年,中德兩國對秦始皇陵做核磁掃描,發現從未曾被披露的秘密

      1996年,中德兩國對秦始皇陵做核磁掃描,發現從未曾被披露的秘密

      嘆為觀止易
      2026-03-09 20:44:19
      山東一教體局局長被免!

      山東一教體局局長被免!

      山東教育
      2026-03-10 07:36:30
      周恩來在勞山遇刺,11名警衛全部犧牲,調查后才知兇手竟大有來歷

      周恩來在勞山遇刺,11名警衛全部犧牲,調查后才知兇手竟大有來歷

      小哥很OK
      2025-11-17 21:02:50
      剛剛 | 國際油價,直線跳水!

      剛剛 | 國際油價,直線跳水!

      天津廣播
      2026-03-09 14:50:34
      戰爭打到第9天,美以損失到底有多大?以色列和印度記者說出真相

      戰爭打到第9天,美以損失到底有多大?以色列和印度記者說出真相

      霽寒飄雪
      2026-03-10 10:11:00
      香港“豪門壞女孩”去世,醉駕、襲警、毆打父母、虐待外傭一樣不落!

      香港“豪門壞女孩”去世,醉駕、襲警、毆打父母、虐待外傭一樣不落!

      港漂圈
      2026-03-09 20:57:29
      柯潔的等級分,是中國圍棋史上最夸張、最漫長、最無解的一條曲線

      柯潔的等級分,是中國圍棋史上最夸張、最漫長、最無解的一條曲線

      月滿大江流
      2026-03-10 13:59:32
      CBA消息:廣廈更名北控,新外援已加盟,首鋼公布合照

      CBA消息:廣廈更名北控,新外援已加盟,首鋼公布合照

      工從昊懂球阿靖
      2026-03-10 11:04:37
      90后女子將10幾萬元黃金首飾放進冰箱冷凍層,與凍肉、雪糕為鄰,笑稱是最有安全感的“窩點”,隨用隨取

      90后女子將10幾萬元黃金首飾放進冰箱冷凍層,與凍肉、雪糕為鄰,笑稱是最有安全感的“窩點”,隨用隨取

      南國今報
      2026-03-09 22:15:06
      尼克松晚年坦言:他很后悔當初訪華,只因毛主席識破的訪華計謀!

      尼克松晚年坦言:他很后悔當初訪華,只因毛主席識破的訪華計謀!

      冰語歷史
      2026-03-07 06:23:39
      董明珠稱提高農民養老金需要時間!網友:我支持美的、海爾……

      董明珠稱提高農民養老金需要時間!網友:我支持美的、海爾……

      麥杰遜
      2026-03-10 12:01:59
      文身執槍,為弟出征:三個孩子的母親,把悲痛活成鎧甲

      文身執槍,為弟出征:三個孩子的母親,把悲痛活成鎧甲

      老馬拉車莫少裝
      2026-03-09 13:23:02
      爆火,有人說幾天賺了26萬!近千人在騰訊樓下排隊,QQ最新宣布

      爆火,有人說幾天賺了26萬!近千人在騰訊樓下排隊,QQ最新宣布

      都市快報橙柿互動
      2026-03-08 08:11:30
      2026-03-10 15:15:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12257文章數 176413關注度
      往期回顧 全部

      科技要聞

      “龍蝦”狂歡 賣“飼料”先掙錢了?

      頭條要聞

      牛彈琴:特朗普放風要停戰 伊朗稱正為美國準備"驚喜"

      頭條要聞

      牛彈琴:特朗普放風要停戰 伊朗稱正為美國準備"驚喜"

      體育要聞

      韓國女足羨慕的奢侈品,為何選擇中國女足

      娛樂要聞

      肖戰首奪SMG視帝,孫儷四封視后創歷史

      財經要聞

      全民"養龍蝦"背后 第一批受害者浮現

      汽車要聞

      蔚來換電和理想5C,誰能硬剛,比亞迪兆瓦閃充?

      態度原創

      家居
      藝術
      健康
      本地
      軍事航空

      家居要聞

      自然肌理 溫度質感婚房

      藝術要聞

      30000畝杏花開了,新疆的春天這么美!

      轉頭就暈的耳石癥,能開車上班嗎?

      本地新聞

      云游中國|候鳥高顏值亮相!沉浸式打卡青海濕地

      軍事要聞

      剛說完戰爭很快結束 特朗普改口

      無障礙瀏覽 進入關懷版