![]()
受各類難以考證的“小作文”、市場情緒推動(dòng)、以及賣方分析師的觀點(diǎn)影響,11月26日光模塊行業(yè)普遍大漲,邏輯也很簡單:谷歌的成功也是靠堆算力,光模塊就是谷歌英偉達(dá)之戰(zhàn)的鏟子股,不管誰當(dāng)縣長,光模塊都是縣長夫人。
然而,事實(shí)真的是這樣嗎?對于更加專業(yè)的投資者來說,面對行業(yè)中出現(xiàn)的新變化,選擇更加嚴(yán)謹(jǐn)和理性一些,或許更為妥當(dāng)。
谷歌的兩篇重磅論文
關(guān)于谷歌TPU集群的架構(gòu),谷歌曾發(fā)表過兩篇重磅論文:
第一篇是在SIGCOMM 2022上發(fā)表的論文《Jupiter Evolving: Transforming Google's Datacenter Network via Optical Circuit Switches and Software-Defined Networking》,這是谷歌官方首次大規(guī)模公開其數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)演進(jìn)細(xì)節(jié)的論文,主要講述了谷歌TPU集群的設(shè)計(jì)理念;
第二篇是2023年在ISCA上發(fā)表的論文《TPUv4: An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings》,詳細(xì)披露了TPU v4的互聯(lián)架構(gòu),主要講述了TPU v4集群如何通過OCS構(gòu)建3D Torus拓?fù)浼軜?gòu)。
估值之家作為一家財(cái)經(jīng)媒體,本身是中立的,并不指向明確的觀點(diǎn)和結(jié)論,因此估值之家只負(fù)責(zé)提出一些疑問,具體的結(jié)論需要由讀者自己思考后給出。
在估值之家仔細(xì)閱讀完上述兩篇文論后,有一個(gè)比較困惑的點(diǎn)是:如果真的按“小作文”所說,TPU集群是利好光模塊的,這似乎與谷歌設(shè)計(jì)TPU集群架構(gòu)的理念是背道而馳的?
在正文論述前,需要特別指出:自己發(fā)表的論文,相比于產(chǎn)業(yè)專家、賣方分析師、“小作文”等渠道,未必具有更高的權(quán)威性,因?yàn)楣雀璎F(xiàn)在已經(jīng)進(jìn)化到基于Ironwood的TPU v7集群,其最新架構(gòu)并未公開,部分“小作文”也有可能是已經(jīng)在非公開渠道了解到TPU v7的最新架構(gòu)后,才發(fā)布出來的。
另外,還需要指出的是,不能小看谷歌在通信領(lǐng)域的技術(shù)實(shí)力和產(chǎn)業(yè)地位,谷歌所采用的技術(shù)方案未必就不如英偉達(dá)收購Mellanox后的技術(shù)差,甚至更優(yōu)。
谷歌TPU集群 vs 英偉達(dá)GPU集群
在芯片層面,作為ASIC的Ironwood和作為GPU的GB200,前者應(yīng)用范圍較窄、后者應(yīng)用范圍更廣,但在AI大模型中的用途相似,不再過多敘述。
谷歌TPU集群顯著有別于英偉達(dá)GPU集群的差異是:谷歌引入了基于MEMS的OCS光交換機(jī),創(chuàng)新性的采用了3D Torus拓?fù)浼軜?gòu),這顯著有別于英偉達(dá)的Clos拓?fù)浼軜?gòu)。
更具體地說,在Scale Out層面,英偉達(dá)的Clos拓?fù)涫羌梗⊿pine)、葉(Block)、機(jī)架(Machine Racks)三層架構(gòu),三層架構(gòu)之間時(shí)刻發(fā)生著海量的光電轉(zhuǎn)化,而這非常依賴基于博通Tomahawk系列芯片的EPS電交換機(jī),以及A股上市公司的光模塊。
![]()
圖片說明:英偉達(dá)GPU集群架構(gòu),數(shù)據(jù)來源于谷歌論文
谷歌在論文中指出,Clos拓?fù)涞娜秉c(diǎn)在于:隨著每隔2~3年算力和傳輸?shù)拇蠓岣撸ㄈ?00G到800G到1.6T),除了要換新的芯片以外(如H100到BlackWell再到Rubin),還需要更換EPS電交換機(jī)、光模塊等,這使得資本開支非常龐大。此外,谷歌還指出,EPS電交換機(jī)需要進(jìn)行大量的光-電-光轉(zhuǎn)換,隨著速率提升,功耗和散熱成本急劇上升。
針對Clos拓?fù)浣Y(jié)構(gòu)的缺點(diǎn),谷歌移除了Clos拓?fù)浼軜?gòu)中的脊,并引入OCS光交換機(jī),在谷歌3D Torus拓?fù)浼軜?gòu)中,沒有光電轉(zhuǎn)換,純物理光路反射,OCS不關(guān)心光信號(hào)里跑的是40G、100G還是800G,OCS只負(fù)責(zé)反射光,不負(fù)責(zé)光轉(zhuǎn)換電、或電轉(zhuǎn)換光,這意味著未來算力升級(jí)時(shí),OCS是不需要更換的。
換句話說,OCS的壽命比EPS電交換機(jī)長的多。
![]()
圖片說明:谷歌TPU集群架構(gòu),數(shù)據(jù)來源于谷歌論文
谷歌TPU集群中光模塊用量真的會(huì)增加嗎?
關(guān)于谷歌TPU架構(gòu)的內(nèi)容、優(yōu)缺點(diǎn)等還有很多,不再詳細(xì)論述。關(guān)于光模塊的部分,上面的內(nèi)容已經(jīng)足夠提出關(guān)于“TPU集群增加光模塊用量”的質(zhì)疑了。
在英偉達(dá)GPU集中,兩個(gè)機(jī)架A和B之間進(jìn)行通信,A出口需要一次電轉(zhuǎn)光、Spine入口需要一次光轉(zhuǎn)電、Spine出口需要一次電轉(zhuǎn)光、B入口需要一次光轉(zhuǎn)電。
在谷歌TPU集群中,兩個(gè)機(jī)架A和B之間進(jìn)行通信,A出口需要一次電轉(zhuǎn)光、光被OCS的MEMS鏡面反射到B的入口,B入口需要一次光轉(zhuǎn)電。
顯然相比于英偉達(dá)GPU集群方案,谷歌的TPU集群方案中,光電轉(zhuǎn)換的次數(shù)減少了,而光模塊的作用正是光電轉(zhuǎn)換,那為什么還要增加光模塊的用量呢?
最后,或許限于認(rèn)知所限,上述關(guān)于“TPU集群增加光模塊用量”的質(zhì)疑在邏輯上還有待商榷,但谷歌在論文《Jupiter Evolving: Transforming Google's Datacenter Network via Optical Circuit Switches and Software-Defined Networking》的開頭摘要中,明確指出了“30% reduction in CAPEX”,或許還是值得重視的。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.