算力權力交接,到底誰在背后推一把?
DeepSeek沒說話,市場卻突然轉向。
![]()
今天早上刷到新聞,說英特爾和AMD的服務器CPU全都賣空了,連加價都搶不到。不是缺貨那種缺,是工廠排產表直接拉到三個月后。我問做IDC運維的朋友,他說字節和阿里最近招標,新買的機柜里CPU服務器占一半以上,去年這時候還不到三分之一。
這事兒得從AI用法變了說起。以前大模型訓練全靠GPU堆,顯存越貴越好,現在公司天天跑推理,比如客服自動回消息、文檔秒級總結、視頻實時字幕,這些活兒不用超大顯存,但要穩、要快、要便宜。HBM3e內存半年漲了兩倍,一臺H200服務器光顯存就占成本八成,而用升級版CPU干這些事,單次推理成本直接砍掉近一半。
我試過自己搭了個小模型服務,用AMD EPYC跑Qwen2-7B,延遲12毫秒,功耗才65瓦;換同代GPU方案,卡一上電風扇就起飛,電費單比模型效果還嚇人。不是GPU不行,是它干這活兒像拿電鋸切豆腐——太猛,不省勁。
![]()
國產CPU也趁這波起來了。海光在銀行和政務云里裝得飛快,不是因為多先進,而是能用、好買、不卡脖子。龍芯現在連工業PLC控制器都開始用,嵌入式場景根本不靠GPU,靠的是CPU把內存管明白、把任務分清楚、把安全兜住。
有意思的是,英偉達自己也在悄悄加CPU核心。Rubin架構剛露頭,CPU部分比上代多了一倍還不止。他們沒說放棄GPU,但明顯在學:光會算不行,得會管、會調、會守門。
邊緣端更明顯。今年新增一百萬個AI節點,八成以上用的是“強CPU+入門GPU”組合,比如摩爾線程那款MTT S5000,訂單翻了兩倍。車機、工廠攝像頭、甚至新出的AI筆記本,都在往輕量、確定性、低功耗上靠,GPU那套300瓦起步的玩法根本進不了這些地方。
![]()
瀾起科技的DDR5緩沖芯片現在全球占四成份額,不是靠多炫,是真能把內存帶寬撐起來。沒有它,CPU再強也喂不飽。異構調度軟件還在亂,各家寫的框架互不認,現在連一個能同時管好CPU、GPU、NPU的通用工具都沒有,程序員天天在寫適配層。
結語就一句話:算力沒變少,只是不再只看誰跑得快,而是看誰管得穩、用得久、算得清。
這事跟芯片廠勝負關系不大,跟誰先把活兒干明白有關。
干明白了,CPU就坐那兒,誰也繞不開。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.