![]()
文:王智遠 | ID:Z201440
剛剛,我看了高盛發布的一份報告。
發布時間是1月20日。名字比較長,叫 《Inference Cost Curve: Comparing AI Compute Solutions (GPUs vs. ASICs)》(中文直譯:《推理成本曲線:AI 計算方案對比(GPU vs. ASIC)》)。
核心觀點是,隨著谷歌和博通(Broadcom)的最新一代 TPU v7 芯片量產,它單位算力的推理成本居然暴降了 70%。
01
這 70% 降幅,到底意味著啥?要只看硬件參數,估計有人會覺得「不就是芯片常規升級嘛」。
但高盛想表達的核心是,這 70% 的降幅,本質上,要在物理規則層面打破行業原有邏輯了。
這話該怎么理解?要掰扯清楚,我得先把「推理」和「訓練」這兩個詞拆開來講明白。
過去兩年,AI 行業都處在「造車」的階段,說白了,訓練大模型。誰的引擎,也就是算力,夠強,誰就能最先造出「布加迪」這種頂級模型。
那時,英偉達的H100/H200 是獨有的選擇,哪怕貴到離譜,大家也得咬牙買,就因為它的速度最快。
但現在不一樣了,車基本造好了,該進入「跑車接客」的階段了,也就是做模型推理。這時,老板們最關心:每跑一公里要燒多少油。
高盛這份報告的犀利之處就在這,它不再聊這車能跑多快,反倒死磕 「推理成本」。
那問題來了,這70% 的成本,到底是怎么「省」出來的?
平常芯片升級,性能能提升 20%-30%,就已經算把牙膏擠爆了。TPU v7 憑啥能一下子把成本砍 70%?高盛分析師給出的答案,是靠「系統工程能力的絕對碾壓」
我打個比方:
英偉達的 GPU像一輛裝了 V12 發動機的超級跑車,為了追極致速度,壓根不在乎油耗,散熱大得離譜,還得配最好的變速箱和傳動系統,處處堆頂配。
但谷歌的 TPU v7像一列精心設計的高鐵,單節車廂的動力可能比不過超跑,但它把幾十節車廂連在一起,就不一樣了。
單看最高速度,高鐵是稍遜超跑一籌,但如果要運送 1000 名乘客,也就是處理海量 Token,高鐵的人均能耗,直接把超跑按在地上摩擦。
所以,具體來說,這 70%的成本紅利,來自三個維度:
一是數據傳輸徹底不堵車了,芯片之間傳數據,基本不用等,等待時間幾乎為零;二是封裝做得更緊湊,把計算模塊和內存挨得特別近,信號在傳輸過程中的損耗就少多了。
還有一點,架構更專一了。
ASIC 專用芯片直接砍掉了顯卡里為了玩 3A 大作留的冗余功能,硅片上的每一寸地方,都只用來算 AI 的數學題,半點兒浪費都沒有。
高盛還說,TPU v7 的絕對成本,已經和英偉達 GB200 NVL72 基本持平了。
這又意味著啥?以前客戶選 TPU,說白了「窮,買不起英偉達」,純屬無奈的妥協;現在大家心里都會想 「既然 TPU 和英偉達差不多貴,甚至還更便宜,我為啥還要忍著英偉達的高溢價,還有動不動就缺貨的糟心事?
當「性價比」這個天平開始往 TPU 這邊傾斜,企業的商業決策就會發生質的變化。
像 Meta、微軟這樣的科技巨頭,推理成本本來就占了運營成本的大頭,要能用 TPU 把這塊成本砍掉 70%,那直接就是凈利潤的暴漲啊。
所以說,這 70% 的降幅,是ASIC(專用芯片)向 GPU(通用芯片)正式宣戰的號角。
它徹底證明了:在 AI 商業化的下半場,走「專精特新」路線的定制化方案,完全有能力在經濟性上干翻「大而全」的通用霸主,這是整個芯片行業的大逆轉。
02
如果說 TPU v7 能降本 70%,只是實驗室里的紙面數據,那 Anthropic 砸出的 210 億美金大單,就是把這串數字砸進現實的「驚雷」。
沒錯,你沒看走眼,210 億美金。這概念有多夸張?
2024 年一整年,全球一半 AI 初創公司融到的錢湊一塊兒,剛夠下這一個單,而且這單不是一次性掏錢。
據高盛的報告和市場一手消息,這份采購單覆蓋 2025 年底開始,一直到 2026 年甚至更久的定制芯片(ASIC)采購周期。
很多人第一反應:Anthropic 哪來這么多錢燒?別急,別忘了它背后的大金主:谷歌、亞馬遜。
尤其是谷歌,本身就是 Anthropic 的二股東,這筆錢簡直是左手倒右手。谷歌把錢投給 Anthropic,Anthropic 轉頭通過博通(Broadcom),把這筆錢換成了定制的 TPU 算力。
為啥要這么折騰?說白了,Anthropic 早就看清 AI 商業化的最終走向了。
以前聊起大模型公司,大家都覺得這幫人是「算法天才」,但你真扒開他們的賬本看看就知道,這幫人本質上都是英偉達的打工仔。
融來的錢,80% 都砸給了老黃變成芯片訂單,還得排隊等貨、看人家臉色,硬生生扛著超高的溢價。哪個資本機構受得了?
所以,Anthropic 敢砸出這 210 億,沖著三件事來:
第一,完成從「租房」到「買地」的質的飛躍。買英偉達的芯片,跟租精裝修的豪宅似的,雖說能拎包入住,但租金也就是芯片的毛利,高得離譜。
高盛算過了,要想在 AI 賽道長期做下去,自建定制芯片(ASIC)的方案,長遠來看能比買通用 GPU 省出一大半成本;Anthropic 就是不想再交這冤枉房租了,它要建屬于自己的「算力城堡」
第二,把「算力主權」攥在自己手里,要這份確定性。
你品品,在這個行業里,比芯片貴更可怕的,是有錢都買不到。英偉達產能就那么點,老黃肯定先緊著大客戶來,還得平衡各方的利益。
但定制 TPU 這套方案,是 Anthropic 和博通、谷歌單獨開的「小灶」。什么時候交貨、要什么配置參數、要多少量,全由自己說了算。
AI 行業拼時間窗口,這時候這份「確定性」,比單純的「性價比」值錢多了。
要說第三點,智遠認為,是想把軟硬一體做到極致。
這就跟蘋果做 M 系列芯片一個道理,英偉達 GPU 像個「全能廚師」,雖說啥菜都能炒,但樣樣都會的代價,效率肯定有損耗。
Anthropic 這批定制芯片,從電路設計的那一刻開始,就為自家 Claude 模型量身定做的。
算法需要多大的內存帶寬,芯片就配多粗的「水管」;模型需要什么樣的計算矩陣,芯片就留好對應的「車位」這種量身定做的鞋,肯定比英偉達那種「均碼」的鞋,穿起來跑得快、還省力。
所以,你別看 210 億美金是個天文數字,在高盛的成本曲線里,這說不定是 Anthropic 做過最劃算的一筆買賣。
而這筆生意,也放出了一個特別危險的信號:
大模型行業陣營,正在加速分化;有錢、有技術、還有巨頭撐腰的 「大戶人家」,正靠著定制化算力,把和普通玩家的差距越拉越大。
03
高盛報告里,博通的地位高得很。 為啥?因為在AI芯片的新戰場上,博通完成了身份躍遷:從單純的「芯片設計公司」,變成了「AI軍火商的總裝廠」。
現在博通,成了各大科技廠的「白手套」+「代工廠」。看這幾個例子就懂了:
谷歌TPU v7的核心互聯技術,是博通做的;亞馬遜Trainium,博通參與了設計;Anthropic那210億的大單,據說也是找博通定制的。
它的商業模式可比英偉達雞賊多了,英偉達賣整卡賺高毛利,但風險也大;博通走「NRE + 量產分成」路子。
啥是NRE?
定制研發費。大廠找博通做定制芯片,得先付一筆巨額研發費,不管最后芯片成不成,這筆錢博通先揣兜里。要是做成能量產了,每賣一顆芯片,博通還能再抽成。
這就意味著,博通無論成敗都穩收錢,英偉達卻得把芯片賣出去才能賺錢。
經濟下行時,誰的生意更穩,一眼就能看出來。 大廠為啥離不了博通?因為現在的AI芯片,拼「連接」的本事。
TPU v7除了制程,最核心的是博通的光互連技術和CoWoS封裝能力;簡單說,博通攥著獨門技術,能把幾百個芯片像搭積木似的高效堆在一起,還不發熱、傳數據不堵車。
這種技術壁壘,比單純做個GPU高多了。
更狠的是,博通不光賣硬件,還賣全套解決方案。 Meta、微軟這些想做自研芯片的大廠,最大的難題是不懂硬件。
博通直接拍胸脯,沒關系,你們只管說模型參數就行,剩下的電路設計、封裝、測試,甚至幫著跟臺積電砍價,我全包了;它直接把芯片設計的門檻,從需要專業博士團隊,降到了只要有錢就能做。
這一下就帶火了整個ASIC定制芯片市場,每多一家公司做定制芯片,博通就多一份收入,它是自己把蛋糕做大,再在每一塊蛋糕上都咬一口。
英偉達雖說實力強,但現在的市值里,摻了太多「永遠高速增長」的預期,一旦增長慢下來,股價很可能暴跌。
博通就不一樣了,它的客戶遍布蘋果、谷歌、亞馬遜,就連英偉達自己,都得找博通供貨,收入來源特別分散,抗風險能力拉滿。
高盛最看重「確定性」,AI行業從之前的狂熱,慢慢走向理性的過程中,英偉達可能會因為業績波動,股價跟著震蕩;但博通這種賺「過路費」的,業績穩得像印鈔機。
所以啊,當所有人都盯著英偉達股價時,聰明錢早就悄悄流向博通了。
04
說到這,可能有人會問,這套ASIC崛起、算力大幅降本的邏輯,對中國到底意味著什么?
答案很明確,「制裁」反倒倒逼出了中國版的ASIC加速潮。不少人覺得中國AI被卡脖子,因為拿不到英偉達的芯片,但換個角度想,這反倒逼著我們提前走上了谷歌、亞馬遜那條路。
既然買不到最強的通用GPU,那就只能死磕專用芯片。
你看華為昇騰,還有字節、騰訊、百度,都在悄悄招兵買馬做自研芯片,邏輯跟Anthropic完全一樣:既然通用芯片買不到、也買不起,那干脆為自己的模型量身定做。
高盛報告里TPU v7降本70%的事兒,在中國正以更激進的節奏上演,畢竟對中國企業來說,這是能不能活下去的生存題。
這里面的投資機會也很清晰,國內AI芯片設計公司,正迎來黃金窗口期,比如:寒武紀、海光,還有那些沒上市的獨角獸,只要性能能達到英偉達的八成,價格再砍一半,大廠們肯定會搶著要。
不過有個扎心的現實:
中國不缺英偉達式的企業,更缺博通這樣的角色。咱們能做出設計得還不錯的計算芯片,差不多對標GPU、TPU那種,但在先進封裝、光互連、Chiplet芯粒這些技術上,跟博通、臺積電還有不小的代差。
高盛為啥力挺博通?
它攥著把芯片「拼起來」還不堵車的核心技術。這對我們來說,也很明確,單純做計算芯片的公司只會越卷越兇。
而掌握「連接技術」和「封裝技術」的上游企業,才是中國版的「博通」,也是整個產業鏈里最穩的「賣鏟子的人」,比如:做光模塊的光迅科技,做先進封裝的通富微電、長電科技。
機會就藏在先進封裝(像CoWoS、Chiplet)和高速光互聯這兩條產業鏈里,這些都是剛需基建,不管最后哪家芯片勝出,都離不開。
而且國內應用層爆發,大概率會比美國更猛。
要是博通、ASIC真能把推理成本壓到現在的十分之一,對咱們這種手握海量數據、應用場景的公司來說,絕對是天大的利好。
你可以想象下,調用一次大模型的成本,從5分錢降到5厘錢,那些因為成本太高不敢深用AI的行業,比如:短劇、游戲、電商、教育,肯定會瞬間爆發。
所以,別總盯著做大模型的「卷王」,他們現在還在虧錢呢,不如多關注能把AI低成本落地的「場景玩家」。
不過,最后我也得潑盆冷水。中國廠商有個通病,哪個賽道火,就一擁而上搞低價內卷,到最后把利潤壓得薄如紙,還把技術做爛了。
美國的ASIC是巨頭帶著博通搞高端定制,可要是國內都扎堆去造低端ASIC芯片,最后,大概率又是一地雞毛。
真正的機會,只屬于有核心壁壘的公司;要么,有獨家的模型算法;要么,有獨家的芯片架構、要么有獨家的封裝技術,就像博通。
只會組裝顯卡的二道販子,在這個時代活不過三集。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.