在AI資本開支仍維持高位、但商業(yè)化壓力不斷上升的當(dāng)下,市場關(guān)注點正在發(fā)生一場悄然卻深刻的轉(zhuǎn)移:大模型還能不能繼續(xù)“無視成本地跑下去”
據(jù)追風(fēng)交易臺,高盛最新發(fā)布的AI芯片研究報告,并未延續(xù)市場熟悉的“算力、制程、參數(shù)規(guī)模”對比,而是從更貼近商業(yè)現(xiàn)實的角度切入——推理階段的單位成本。通過構(gòu)建一條“推理成本曲線”,高盛試圖回答一個對AI產(chǎn)業(yè)至關(guān)重要的問題:在模型進(jìn)入高頻調(diào)用階段后,不同芯片方案在折舊、能耗和系統(tǒng)利用率等約束下,每處理一百萬個token究竟需要付出多少真實成本
研究結(jié)論指向了一次正在加速、但尚未被充分消化的變化:Google/Broadcom 的TPU正在迅速縮小與英偉達(dá)GPU在推理成本上的差距。從TPU v6升級至TPU v7,單位token推理成本下降約70%,使其在絕對成本層面與英偉達(dá)GB200 NVL72基本持平,部分測算情形下甚至略具優(yōu)勢。
這并不意味著英偉達(dá)的地位被動搖,但它清晰地表明,AI芯片競爭的核心評價體系正在從“誰算得更快”,轉(zhuǎn)向“誰算得更便宜、更可持續(xù)”。當(dāng)訓(xùn)練逐漸成為前期投入,而推理成為長期現(xiàn)金流來源,成本曲線的斜率,正在取代峰值算力,成為決定產(chǎn)業(yè)格局的關(guān)鍵變量。
一、從算力領(lǐng)先到成本效率,AI芯片競爭的評價標(biāo)準(zhǔn)正在切換
在AI發(fā)展的早期階段,訓(xùn)練算力幾乎決定了一切。誰能更快訓(xùn)練出更大的模型,誰就擁有技術(shù)話語權(quán)。然而,隨著大模型逐步進(jìn)入部署與商業(yè)化階段,推理負(fù)載開始遠(yuǎn)遠(yuǎn)超過訓(xùn)練本身,成本問題被迅速放大。
高盛指出,在這一階段,芯片的性價比不再只由單卡性能決定,而是由系統(tǒng)層面的效率共同塑造,包括算力密度、互聯(lián)效率、內(nèi)存帶寬以及能源消耗等多重因素。基于這一邏輯構(gòu)建的推理成本曲線顯示,Google/Broadcom TPU在原始計算性能和系統(tǒng)效率上的進(jìn)步,已經(jīng)足以在成本維度上與英偉達(dá)正面競爭。
相比之下,AMD和亞馬遜Trainium在代際成本下降幅度上仍較為有限。從現(xiàn)階段測算結(jié)果看,兩者的單位推理成本仍明顯高于英偉達(dá)和Google方案,對主流市場的沖擊相對有限。
二、TPU成本躍遷的背后,是系統(tǒng)工程能力而非單點突破
TPU v7實現(xiàn)大幅降本,并非來自單一技術(shù)突破,而是系統(tǒng)級優(yōu)化能力的集中釋放。高盛認(rèn)為,隨著計算芯片本身逐步逼近物理極限,未來推理成本能否繼續(xù)下降,將越來越依賴“計算相鄰技術(shù)”的進(jìn)步。
這些技術(shù)包括:更高帶寬、更低延遲的網(wǎng)絡(luò)互聯(lián);高帶寬內(nèi)存(HBM)和存儲方案的持續(xù)集成;先進(jìn)封裝技術(shù)(如臺積電CoWoS);以及機架級解決方案在密度與能效上的提升。TPU在這些方面的協(xié)同優(yōu)化,使其在推理場景中展現(xiàn)出明顯的經(jīng)濟(jì)性優(yōu)勢。
這一趨勢也與谷歌自身的算力部署高度一致。TPU在Google內(nèi)部工作負(fù)載中的使用比例持續(xù)上升,已廣泛用于Gemini模型的訓(xùn)練與推理。同時,具備成熟軟件能力的外部客戶也在加速采用TPU方案,其中最引人注目的案例是Anthropic向Broadcom下達(dá)的約210億美元訂單,相關(guān)產(chǎn)品預(yù)計將在2026年中開始交付。
不過,高盛同時強調(diào),英偉達(dá)仍然掌握“上市時間”優(yōu)勢。在TPU v7剛剛追平GB200 NVL72之際,英偉達(dá)已經(jīng)推進(jìn)至GB300 NVL72,并計劃在2026年下半年交付VR200 NVL144。持續(xù)的產(chǎn)品迭代節(jié)奏,仍是其維持客戶黏性的關(guān)鍵籌碼。
三、投資含義再平衡:ASIC崛起,但英偉達(dá)的護(hù)城河尚未被擊穿
從投資視角看,高盛并未因TPU的快速追趕而下調(diào)對英偉達(dá)的判斷。該機構(gòu)仍維持對英偉達(dá)與Broadcom的買入評級,認(rèn)為兩者最直接綁定AI資本開支中最具可持續(xù)性的部分,并將長期受益于網(wǎng)絡(luò)、封裝和系統(tǒng)級技術(shù)升級。
在ASIC陣營中,Broadcom的受益邏輯尤為清晰。高盛已將其2026財年每股收益預(yù)期上調(diào)至10.87美元,較市場一致預(yù)期高出約6%,并認(rèn)為市場仍低估了其在AI網(wǎng)絡(luò)與定制計算領(lǐng)域的長期盈利能力。
AMD和亞馬遜Trainium當(dāng)前仍處于追趕階段,但高盛也指出,AMD的機架級方案存在后發(fā)優(yōu)勢的可能性。預(yù)計在2026年末,基于MI455X的Helios機架方案有望在部分訓(xùn)練與推理場景中實現(xiàn)約70%的推理成本下降,值得持續(xù)跟蹤。
更重要的是,這份研報給出的并非“贏家通吃”的結(jié)論,而是一幅逐漸清晰的產(chǎn)業(yè)分工圖景:GPU繼續(xù)主導(dǎo)訓(xùn)練與通用算力市場,而定制ASIC在規(guī)模化、可預(yù)測的推理負(fù)載中不斷滲透。在這一過程中,英偉達(dá)的CUDA生態(tài)與系統(tǒng)級研發(fā)投入仍構(gòu)成堅實護(hù)城河,但其估值邏輯也將持續(xù)接受“推理成本下行”的現(xiàn)實檢驗。
當(dāng)AI真正進(jìn)入“每一個token都要算回報”的階段,算力競爭終究要回到經(jīng)濟(jì)學(xué)本身。TPU成本暴降70%,并不是一次簡單的技術(shù)追趕,而是一次對AI商業(yè)模式可行性的關(guān)鍵壓力測試。而這,或許正是GPU與ASIC之爭背后,市場最應(yīng)認(rèn)真對待的信號。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.