這幾天Meta一系列動作向大家宣告,AI推理的時代正在拉開帷幕。
幾周前,The Information曝出Meta已經砍掉了最先進的訓練芯片項目Olympus,轉頭簽下了科技史上最大的兩筆芯片采購合同。
從Nvidia采購數百萬顆 GPU(規模達數百億美元),向AMD買了6吉瓦 GPU(多年多代合作)。
這周,它又高調宣布:我們自己造了四款芯片。
Meta工程副總裁直接喊出:" 我們看到推理需求正在爆炸。這是我們當前的首要聚焦方向。 "
2025年5月英偉達財報會解讀中,王煜全告訴大家推理需求崛起已經勢不可擋,這是英偉達下一個大發展的機會,也是Agent生態崛起的信號。
下周的英偉達GTC大會,王煜全會分享哪些新的判斷呢?如果你想第一時間掌握,一定要鎖定前哨科技特訓營的周四直播!
接下來,我們一起和你聊聊Meta動作背后的趨勢。
![]()
2025年5月前哨PPT報告
先搞清楚一件事:訓練和推理有什么區別?
如果你把AI模型比作一個學生:
訓練就是上學,讀教材、做習題、考試、糾錯,最終形成知識體系。成本極高、算力極大、周期極長。
推理就是畢業后工作,用學到的知識回答問題、做決策、執行任務。每次調用成本低,但調用頻次極高。
過去三年,AI行業的焦點一直在訓練側,誰能訓出更大的模型、誰能拿到更多GPU來訓練。
但現在,游戲規則變了。
當模型訓好之后,面對上億用戶每天使用,推理成本的暴漲已經是必然。
每一次你和ChatGPT對話、每一次AI Agent執行任務、每一次Meta在Facebook上給你推薦內容,都是一次推理調用。
Meta自己就有40億用戶。每天產生的推理請求是一個天文數字。
這就是為什么Meta說"推理需求正在爆炸"。
![]()
Facebook 數據中心機房內部(早期自建數據中心)Meta既要又要的三層戰略
表面看,Meta的行為很矛盾:剛放棄自研芯片,花了幾百億買Nvidia和AMD的芯片,轉身又要自己造?
其實一點都不矛盾。這是目的明確的三層芯片戰略:
![]()
![]()
AMD 與 Meta 擴大合作
Meta 副總裁說得很直白:"這(自研+采購)讓我們在硅供應上有更多多樣性,在采購上有更多的籌碼(leverage),一定程度上抑制了價格波動。"
翻譯成大白話:Nvidia你漲價?沒關系,我有AMD備選!AMD交不了貨?沒關系,我自己能造。
這是在Nvidia的定價權上插了一刀。
說到這可能有人會問,前面訓練芯片失敗了,為什么推理芯片有機會?
原因也很簡單,訓練芯片的技術壁壘太高了,除了要搞定萬卡級別的并行計算,還要支持FP32/FP16/BF16/FP8各種精度格式,什么都沒做,看到這些專業名詞是不是就覺得頭大?
到這還沒完,還要搞定Nvidia在這個領域20年的軟件生態(CUDA)。
但推理芯片完全是另一個故事:模型已經訓好,要做的就是讓它跑起來就行,只要符合需求,不用搞什么萬卡集群,也不需要支持多種精度格式,還能針對模型優化芯片,大幅降低成本。
這正是Google(TPU)和Amazon(Inferentia)走過的路。
Meta的選擇非常理性:訓練交給Nvidia(花錢買最好的),推理自己做(自己造最省的)。
關鍵細節:每6個月一款新芯片
Meta自研芯片最重要的其實是這句:"每6個月發布一款新芯片。對任何芯片公司或團隊來說,這都是非常罕見的節奏。"
為什么這么急?Meta的AI基建擴張速度太快了:
$1350億年度AI資本開支(2026年)
5吉瓦的Hyperion超級數據中心正在路易斯安那州建設
另有俄亥俄州和印第安納州兩個大型數據中心在建
據Bloomberg報道,Meta還在接盤OpenAI/Oracle退出的Stargate德州數據中心
每建一個數據中心,就需要裝滿芯片。如果全用Nvidia GPU,成本將是天文數字。
而MTIA芯片由臺積電代工,設計完全由Meta控制,預期使用壽命5年以上。
這是一道簡單的數學題:40億用戶 × 爆炸式推理需求,既然在基建上已經花了1350億美元,再花點錢自研推理芯片更劃算。
"推理為王"時代已經到來?
把Meta今天的動作放到整個產業背景里看,一個清晰的趨勢浮現了:
所有巨頭都在從"訓練優先"轉向"推理優先"。
![]()
為什么所有人同時轉向推理?王煜全最近用三講直播,為大家梳理了AI行業正在發生的拐點:
階段性的模型瓶頸:由于一個硬件技術限制,模型性能進展暫時放緩
Agent時代到來:掃描787家Agent公司,呈現了AI的幾個超級賽道
商業化需求,上下游都必須依靠降低成本獲取收益
簡單說:訓練決定你的AI有多強,推理決定你能不能靠AI賺錢。
下周GTC前瞻:Nvidia的反擊
3月16日,Nvidia GTC 2026將在圣何塞開幕。3萬人現場參會,190個國家線上觀看。
老黃發出預告要"震驚世界"。
根據我們的研究看:Nvidia的策略已經非常清晰,你們想自研推理芯片?可以。但我會讓推理芯片的性能天花板永遠高出你一截。
所以老黃這次還能不能拿出震驚我們的產品呢?
歡迎加入前哨科技特訓營,下周四晚8點,王煜全與你一起瞭望前沿。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.