![]()
文:王智遠(yuǎn) | ID:Z201440
剛剛,我看了高盛發(fā)布的一份報(bào)告。
發(fā)布時(shí)間是1月20日。名字比較長(zhǎng),叫 《Inference Cost Curve: Comparing AI Compute Solutions (GPUs vs. ASICs)》(中文直譯:《推理成本曲線(xiàn):AI 計(jì)算方案對(duì)比(GPU vs. ASIC)》)。
核心觀點(diǎn)是,隨著谷歌和博通(Broadcom)的最新一代 TPU v7 芯片量產(chǎn),它單位算力的推理成本居然暴降了 70%。
01
這 70% 降幅,到底意味著啥?要只看硬件參數(shù),估計(jì)有人會(huì)覺(jué)得「不就是芯片常規(guī)升級(jí)嘛」。
但高盛想表達(dá)的核心是,這 70% 的降幅,本質(zhì)上,要在物理規(guī)則層面打破行業(yè)原有邏輯了。
這話(huà)該怎么理解?要掰扯清楚,我得先把「推理」和「訓(xùn)練」這兩個(gè)詞拆開(kāi)來(lái)講明白。
過(guò)去兩年,AI 行業(yè)都處在「造車(chē)」的階段,說(shuō)白了,訓(xùn)練大模型。誰(shuí)的引擎,也就是算力,夠強(qiáng),誰(shuí)就能最先造出「布加迪」這種頂級(jí)模型。
那時(shí),英偉達(dá)的H100/H200 是獨(dú)有的選擇,哪怕貴到離譜,大家也得咬牙買(mǎi),就因?yàn)樗乃俣茸羁臁?/p>
但現(xiàn)在不一樣了,車(chē)基本造好了,該進(jìn)入「跑車(chē)接客」的階段了,也就是做模型推理。這時(shí),老板們最關(guān)心:每跑一公里要燒多少油。
高盛這份報(bào)告的犀利之處就在這,它不再聊這車(chē)能跑多快,反倒死磕 「推理成本」。
那問(wèn)題來(lái)了,這70% 的成本,到底是怎么「省」出來(lái)的?
平常芯片升級(jí),性能能提升 20%-30%,就已經(jīng)算把牙膏擠爆了。TPU v7 憑啥能一下子把成本砍 70%?高盛分析師給出的答案,是靠「系統(tǒng)工程能力的絕對(duì)碾壓」
我打個(gè)比方:
英偉達(dá)的 GPU像一輛裝了 V12 發(fā)動(dòng)機(jī)的超級(jí)跑車(chē),為了追極致速度,壓根不在乎油耗,散熱大得離譜,還得配最好的變速箱和傳動(dòng)系統(tǒng),處處堆頂配。
但谷歌的 TPU v7像一列精心設(shè)計(jì)的高鐵,單節(jié)車(chē)廂的動(dòng)力可能比不過(guò)超跑,但它把幾十節(jié)車(chē)廂連在一起,就不一樣了。
單看最高速度,高鐵是稍遜超跑一籌,但如果要運(yùn)送 1000 名乘客,也就是處理海量 Token,高鐵的人均能耗,直接把超跑按在地上摩擦。
所以,具體來(lái)說(shuō),這 70%的成本紅利,來(lái)自三個(gè)維度:
一是數(shù)據(jù)傳輸徹底不堵車(chē)了,芯片之間傳數(shù)據(jù),基本不用等,等待時(shí)間幾乎為零;二是封裝做得更緊湊,把計(jì)算模塊和內(nèi)存挨得特別近,信號(hào)在傳輸過(guò)程中的損耗就少多了。
還有一點(diǎn),架構(gòu)更專(zhuān)一了。
ASIC 專(zhuān)用芯片直接砍掉了顯卡里為了玩 3A 大作留的冗余功能,硅片上的每一寸地方,都只用來(lái)算 AI 的數(shù)學(xué)題,半點(diǎn)兒浪費(fèi)都沒(méi)有。
高盛還說(shuō),TPU v7 的絕對(duì)成本,已經(jīng)和英偉達(dá) GB200 NVL72 基本持平了。
這又意味著啥?以前客戶(hù)選 TPU,說(shuō)白了「窮,買(mǎi)不起英偉達(dá)」,純屬無(wú)奈的妥協(xié);現(xiàn)在大家心里都會(huì)想 「既然 TPU 和英偉達(dá)差不多貴,甚至還更便宜,我為啥還要忍著英偉達(dá)的高溢價(jià),還有動(dòng)不動(dòng)就缺貨的糟心事?
當(dāng)「性?xún)r(jià)比」這個(gè)天平開(kāi)始往 TPU 這邊傾斜,企業(yè)的商業(yè)決策就會(huì)發(fā)生質(zhì)的變化。
像 Meta、微軟這樣的科技巨頭,推理成本本來(lái)就占了運(yùn)營(yíng)成本的大頭,要能用 TPU 把這塊成本砍掉 70%,那直接就是凈利潤(rùn)的暴漲啊。
所以說(shuō),這 70% 的降幅,是ASIC(專(zhuān)用芯片)向 GPU(通用芯片)正式宣戰(zhàn)的號(hào)角。
它徹底證明了:在 AI 商業(yè)化的下半場(chǎng),走「專(zhuān)精特新」路線(xiàn)的定制化方案,完全有能力在經(jīng)濟(jì)性上干翻「大而全」的通用霸主,這是整個(gè)芯片行業(yè)的大逆轉(zhuǎn)。
02
如果說(shuō) TPU v7 能降本 70%,只是實(shí)驗(yàn)室里的紙面數(shù)據(jù),那 Anthropic 砸出的 210 億美金大單,就是把這串?dāng)?shù)字砸進(jìn)現(xiàn)實(shí)的「驚雷」。
沒(méi)錯(cuò),你沒(méi)看走眼,210 億美金。這概念有多夸張?
2024 年一整年,全球一半 AI 初創(chuàng)公司融到的錢(qián)湊一塊兒,剛夠下這一個(gè)單,而且這單不是一次性掏錢(qián)。
據(jù)高盛的報(bào)告和市場(chǎng)一手消息,這份采購(gòu)單覆蓋 2025 年底開(kāi)始,一直到 2026 年甚至更久的定制芯片(ASIC)采購(gòu)周期。
很多人第一反應(yīng):Anthropic 哪來(lái)這么多錢(qián)燒?別急,別忘了它背后的大金主:谷歌、亞馬遜。
尤其是谷歌,本身就是 Anthropic 的二股東,這筆錢(qián)簡(jiǎn)直是左手倒右手。谷歌把錢(qián)投給 Anthropic,Anthropic 轉(zhuǎn)頭通過(guò)博通(Broadcom),把這筆錢(qián)換成了定制的 TPU 算力。
為啥要這么折騰?說(shuō)白了,Anthropic 早就看清 AI 商業(yè)化的最終走向了。
以前聊起大模型公司,大家都覺(jué)得這幫人是「算法天才」,但你真扒開(kāi)他們的賬本看看就知道,這幫人本質(zhì)上都是英偉達(dá)的打工仔。
融來(lái)的錢(qián),80% 都砸給了老黃變成芯片訂單,還得排隊(duì)等貨、看人家臉色,硬生生扛著超高的溢價(jià)。哪個(gè)資本機(jī)構(gòu)受得了?
所以,Anthropic 敢砸出這 210 億,沖著三件事來(lái):
第一,完成從「租房」到「買(mǎi)地」的質(zhì)的飛躍。買(mǎi)英偉達(dá)的芯片,跟租精裝修的豪宅似的,雖說(shuō)能拎包入住,但租金也就是芯片的毛利,高得離譜。
高盛算過(guò)了,要想在 AI 賽道長(zhǎng)期做下去,自建定制芯片(ASIC)的方案,長(zhǎng)遠(yuǎn)來(lái)看能比買(mǎi)通用 GPU 省出一大半成本;Anthropic 就是不想再交這冤枉房租了,它要建屬于自己的「算力城堡」
第二,把「算力主權(quán)」攥在自己手里,要這份確定性。
你品品,在這個(gè)行業(yè)里,比芯片貴更可怕的,是有錢(qián)都買(mǎi)不到。英偉達(dá)產(chǎn)能就那么點(diǎn),老黃肯定先緊著大客戶(hù)來(lái),還得平衡各方的利益。
但定制 TPU 這套方案,是 Anthropic 和博通、谷歌單獨(dú)開(kāi)的「小灶」。什么時(shí)候交貨、要什么配置參數(shù)、要多少量,全由自己說(shuō)了算。
AI 行業(yè)拼時(shí)間窗口,這時(shí)候這份「確定性」,比單純的「性?xún)r(jià)比」值錢(qián)多了。
要說(shuō)第三點(diǎn),智遠(yuǎn)認(rèn)為,是想把軟硬一體做到極致。
這就跟蘋(píng)果做 M 系列芯片一個(gè)道理,英偉達(dá) GPU 像個(gè)「全能廚師」,雖說(shuō)啥菜都能炒,但樣樣都會(huì)的代價(jià),效率肯定有損耗。
Anthropic 這批定制芯片,從電路設(shè)計(jì)的那一刻開(kāi)始,就為自家 Claude 模型量身定做的。
算法需要多大的內(nèi)存帶寬,芯片就配多粗的「水管」;模型需要什么樣的計(jì)算矩陣,芯片就留好對(duì)應(yīng)的「車(chē)位」這種量身定做的鞋,肯定比英偉達(dá)那種「均碼」的鞋,穿起來(lái)跑得快、還省力。
所以,你別看 210 億美金是個(gè)天文數(shù)字,在高盛的成本曲線(xiàn)里,這說(shuō)不定是 Anthropic 做過(guò)最劃算的一筆買(mǎi)賣(mài)。
而這筆生意,也放出了一個(gè)特別危險(xiǎn)的信號(hào):
大模型行業(yè)陣營(yíng),正在加速分化;有錢(qián)、有技術(shù)、還有巨頭撐腰的 「大戶(hù)人家」,正靠著定制化算力,把和普通玩家的差距越拉越大。
03
高盛報(bào)告里,博通的地位高得很。 為啥?因?yàn)樵贏I芯片的新戰(zhàn)場(chǎng)上,博通完成了身份躍遷:從單純的「芯片設(shè)計(jì)公司」,變成了「AI軍火商的總裝廠(chǎng)」。
現(xiàn)在博通,成了各大科技廠(chǎng)的「白手套」+「代工廠(chǎng)」。看這幾個(gè)例子就懂了:
谷歌TPU v7的核心互聯(lián)技術(shù),是博通做的;亞馬遜Trainium,博通參與了設(shè)計(jì);Anthropic那210億的大單,據(jù)說(shuō)也是找博通定制的。
它的商業(yè)模式可比英偉達(dá)雞賊多了,英偉達(dá)賣(mài)整卡賺高毛利,但風(fēng)險(xiǎn)也大;博通走「NRE + 量產(chǎn)分成」路子。
啥是NRE?
定制研發(fā)費(fèi)。大廠(chǎng)找博通做定制芯片,得先付一筆巨額研發(fā)費(fèi),不管最后芯片成不成,這筆錢(qián)博通先揣兜里。要是做成能量產(chǎn)了,每賣(mài)一顆芯片,博通還能再抽成。
這就意味著,博通無(wú)論成敗都穩(wěn)收錢(qián),英偉達(dá)卻得把芯片賣(mài)出去才能賺錢(qián)。
經(jīng)濟(jì)下行時(shí),誰(shuí)的生意更穩(wěn),一眼就能看出來(lái)。 大廠(chǎng)為啥離不了博通?因?yàn)楝F(xiàn)在的AI芯片,拼「連接」的本事。
TPU v7除了制程,最核心的是博通的光互連技術(shù)和CoWoS封裝能力;簡(jiǎn)單說(shuō),博通攥著獨(dú)門(mén)技術(shù),能把幾百個(gè)芯片像搭積木似的高效堆在一起,還不發(fā)熱、傳數(shù)據(jù)不堵車(chē)。
這種技術(shù)壁壘,比單純做個(gè)GPU高多了。
更狠的是,博通不光賣(mài)硬件,還賣(mài)全套解決方案。 Meta、微軟這些想做自研芯片的大廠(chǎng),最大的難題是不懂硬件。
博通直接拍胸脯,沒(méi)關(guān)系,你們只管說(shuō)模型參數(shù)就行,剩下的電路設(shè)計(jì)、封裝、測(cè)試,甚至幫著跟臺(tái)積電砍價(jià),我全包了;它直接把芯片設(shè)計(jì)的門(mén)檻,從需要專(zhuān)業(yè)博士團(tuán)隊(duì),降到了只要有錢(qián)就能做。
這一下就帶火了整個(gè)ASIC定制芯片市場(chǎng),每多一家公司做定制芯片,博通就多一份收入,它是自己把蛋糕做大,再在每一塊蛋糕上都咬一口。
英偉達(dá)雖說(shuō)實(shí)力強(qiáng),但現(xiàn)在的市值里,摻了太多「永遠(yuǎn)高速增長(zhǎng)」的預(yù)期,一旦增長(zhǎng)慢下來(lái),股價(jià)很可能暴跌。
博通就不一樣了,它的客戶(hù)遍布蘋(píng)果、谷歌、亞馬遜,就連英偉達(dá)自己,都得找博通供貨,收入來(lái)源特別分散,抗風(fēng)險(xiǎn)能力拉滿(mǎn)。
高盛最看重「確定性」,AI行業(yè)從之前的狂熱,慢慢走向理性的過(guò)程中,英偉達(dá)可能會(huì)因?yàn)闃I(yè)績(jī)波動(dòng),股價(jià)跟著震蕩;但博通這種賺「過(guò)路費(fèi)」的,業(yè)績(jī)穩(wěn)得像印鈔機(jī)。
所以啊,當(dāng)所有人都盯著英偉達(dá)股價(jià)時(shí),聰明錢(qián)早就悄悄流向博通了。
04
說(shuō)到這,可能有人會(huì)問(wèn),這套ASIC崛起、算力大幅降本的邏輯,對(duì)中國(guó)到底意味著什么?
答案很明確,「制裁」反倒倒逼出了中國(guó)版的ASIC加速潮。不少人覺(jué)得中國(guó)AI被卡脖子,因?yàn)槟貌坏接ミ_(dá)的芯片,但換個(gè)角度想,這反倒逼著我們提前走上了谷歌、亞馬遜那條路。
既然買(mǎi)不到最強(qiáng)的通用GPU,那就只能死磕專(zhuān)用芯片。
你看華為昇騰,還有字節(jié)、騰訊、百度,都在悄悄招兵買(mǎi)馬做自研芯片,邏輯跟Anthropic完全一樣:既然通用芯片買(mǎi)不到、也買(mǎi)不起,那干脆為自己的模型量身定做。
高盛報(bào)告里TPU v7降本70%的事兒,在中國(guó)正以更激進(jìn)的節(jié)奏上演,畢竟對(duì)中國(guó)企業(yè)來(lái)說(shuō),這是能不能活下去的生存題。
這里面的投資機(jī)會(huì)也很清晰,國(guó)內(nèi)AI芯片設(shè)計(jì)公司,正迎來(lái)黃金窗口期,比如:寒武紀(jì)、海光,還有那些沒(méi)上市的獨(dú)角獸,只要性能能達(dá)到英偉達(dá)的八成,價(jià)格再砍一半,大廠(chǎng)們肯定會(huì)搶著要。
不過(guò)有個(gè)扎心的現(xiàn)實(shí):
中國(guó)不缺英偉達(dá)式的企業(yè),更缺博通這樣的角色。咱們能做出設(shè)計(jì)得還不錯(cuò)的計(jì)算芯片,差不多對(duì)標(biāo)GPU、TPU那種,但在先進(jìn)封裝、光互連、Chiplet芯粒這些技術(shù)上,跟博通、臺(tái)積電還有不小的代差。
高盛為啥力挺博通?
它攥著把芯片「拼起來(lái)」還不堵車(chē)的核心技術(shù)。這對(duì)我們來(lái)說(shuō),也很明確,單純做計(jì)算芯片的公司只會(huì)越卷越兇。
而掌握「連接技術(shù)」和「封裝技術(shù)」的上游企業(yè),才是中國(guó)版的「博通」,也是整個(gè)產(chǎn)業(yè)鏈里最穩(wěn)的「賣(mài)鏟子的人」,比如:做光模塊的光迅科技,做先進(jìn)封裝的通富微電、長(zhǎng)電科技。
機(jī)會(huì)就藏在先進(jìn)封裝(像CoWoS、Chiplet)和高速光互聯(lián)這兩條產(chǎn)業(yè)鏈里,這些都是剛需基建,不管最后哪家芯片勝出,都離不開(kāi)。
而且國(guó)內(nèi)應(yīng)用層爆發(fā),大概率會(huì)比美國(guó)更猛。
要是博通、ASIC真能把推理成本壓到現(xiàn)在的十分之一,對(duì)咱們這種手握海量數(shù)據(jù)、應(yīng)用場(chǎng)景的公司來(lái)說(shuō),絕對(duì)是天大的利好。
你可以想象下,調(diào)用一次大模型的成本,從5分錢(qián)降到5厘錢(qián),那些因?yàn)槌杀咎卟桓疑钣肁I的行業(yè),比如:短劇、游戲、電商、教育,肯定會(huì)瞬間爆發(fā)。
所以,別總盯著做大模型的「卷王」,他們現(xiàn)在還在虧錢(qián)呢,不如多關(guān)注能把AI低成本落地的「場(chǎng)景玩家」。
不過(guò),最后我也得潑盆冷水。中國(guó)廠(chǎng)商有個(gè)通病,哪個(gè)賽道火,就一擁而上搞低價(jià)內(nèi)卷,到最后把利潤(rùn)壓得薄如紙,還把技術(shù)做爛了。
美國(guó)的ASIC是巨頭帶著博通搞高端定制,可要是國(guó)內(nèi)都扎堆去造低端ASIC芯片,最后,大概率又是一地雞毛。
真正的機(jī)會(huì),只屬于有核心壁壘的公司;要么,有獨(dú)家的模型算法;要么,有獨(dú)家的芯片架構(gòu)、要么有獨(dú)家的封裝技術(shù),就像博通。
只會(huì)組裝顯卡的二道販子,在這個(gè)時(shí)代活不過(guò)三集。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.