![]()
受各類難以考證的“小作文”、市場情緒推動、以及賣方分析師的觀點影響,11月26日光模塊行業普遍大漲,邏輯也很簡單:谷歌的成功也是靠堆算力,光模塊就是谷歌英偉達之戰的鏟子股,不管誰當縣長,光模塊都是縣長夫人。
然而,事實真的是這樣嗎?對于更加專業的投資者來說,面對行業中出現的新變化,選擇更加嚴謹和理性一些,或許更為妥當。
谷歌的兩篇重磅論文
關于谷歌TPU集群的架構,谷歌曾發表過兩篇重磅論文:
第一篇是在SIGCOMM 2022上發表的論文《Jupiter Evolving: Transforming Google's Datacenter Network via Optical Circuit Switches and Software-Defined Networking》,這是谷歌官方首次大規模公開其數據中心網絡架構演進細節的論文,主要講述了谷歌TPU集群的設計理念;
第二篇是2023年在ISCA上發表的論文《TPUv4: An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings》,詳細披露了TPU v4的互聯架構,主要講述了TPU v4集群如何通過OCS構建3D Torus拓撲架構。
估值之家作為一家財經媒體,本身是中立的,并不指向明確的觀點和結論,因此估值之家只負責提出一些疑問,具體的結論需要由讀者自己思考后給出。
在估值之家仔細閱讀完上述兩篇文論后,有一個比較困惑的點是:如果真的按“小作文”所說,TPU集群是利好光模塊的,這似乎與谷歌設計TPU集群架構的理念是背道而馳的?
在正文論述前,需要特別指出:自己發表的論文,相比于產業專家、賣方分析師、“小作文”等渠道,未必具有更高的權威性,因為谷歌現在已經進化到基于Ironwood的TPU v7集群,其最新架構并未公開,部分“小作文”也有可能是已經在非公開渠道了解到TPU v7的最新架構后,才發布出來的。
另外,還需要指出的是,不能小看谷歌在通信領域的技術實力和產業地位,谷歌所采用的技術方案未必就不如英偉達收購Mellanox后的技術差,甚至更優。
谷歌TPU集群 vs 英偉達GPU集群
在芯片層面,作為ASIC的Ironwood和作為GPU的GB200,前者應用范圍較窄、后者應用范圍更廣,但在AI大模型中的用途相似,不再過多敘述。
谷歌TPU集群顯著有別于英偉達GPU集群的差異是:谷歌引入了基于MEMS的OCS光交換機,創新性的采用了3D Torus拓撲架構,這顯著有別于英偉達的Clos拓撲架構。
更具體地說,在Scale Out層面,英偉達的Clos拓撲是脊(Spine)、葉(Block)、機架(Machine Racks)三層架構,三層架構之間時刻發生著海量的光電轉化,而這非常依賴基于博通Tomahawk系列芯片的EPS電交換機,以及A股上市公司的光模塊。
![]()
圖片說明:英偉達GPU集群架構,數據來源于谷歌論文
谷歌在論文中指出,Clos拓撲的缺點在于:隨著每隔2~3年算力和傳輸的大幅提高(如200G到800G到1.6T),除了要換新的芯片以外(如H100到BlackWell再到Rubin),還需要更換EPS電交換機、光模塊等,這使得資本開支非常龐大。此外,谷歌還指出,EPS電交換機需要進行大量的光-電-光轉換,隨著速率提升,功耗和散熱成本急劇上升。
針對Clos拓撲結構的缺點,谷歌移除了Clos拓撲架構中的脊,并引入OCS光交換機,在谷歌3D Torus拓撲架構中,沒有光電轉換,純物理光路反射,OCS不關心光信號里跑的是40G、100G還是800G,OCS只負責反射光,不負責光轉換電、或電轉換光,這意味著未來算力升級時,OCS是不需要更換的。
換句話說,OCS的壽命比EPS電交換機長的多。
![]()
圖片說明:谷歌TPU集群架構,數據來源于谷歌論文
谷歌TPU集群中光模塊用量真的會增加嗎?
關于谷歌TPU架構的內容、優缺點等還有很多,不再詳細論述。關于光模塊的部分,上面的內容已經足夠提出關于“TPU集群增加光模塊用量”的質疑了。
在英偉達GPU集中,兩個機架A和B之間進行通信,A出口需要一次電轉光、Spine入口需要一次光轉電、Spine出口需要一次電轉光、B入口需要一次光轉電。
在谷歌TPU集群中,兩個機架A和B之間進行通信,A出口需要一次電轉光、光被OCS的MEMS鏡面反射到B的入口,B入口需要一次光轉電。
顯然相比于英偉達GPU集群方案,谷歌的TPU集群方案中,光電轉換的次數減少了,而光模塊的作用正是光電轉換,那為什么還要增加光模塊的用量呢?
最后,或許限于認知所限,上述關于“TPU集群增加光模塊用量”的質疑在邏輯上還有待商榷,但谷歌在論文《Jupiter Evolving: Transforming Google's Datacenter Network via Optical Circuit Switches and Software-Defined Networking》的開頭摘要中,明確指出了“30% reduction in CAPEX”,或許還是值得重視的。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.