最新季度,英偉達業績依然爆表,利潤飆升。但今時今日,競爭對手步步緊逼,更多AI芯片持續推出,給英偉達帶來前所未有的挑戰。
目前最炙手可熱的是ASIC,中文意思是專用集成電路。無論是谷歌的TPU、亞馬遜Trainium,還是OpenAI與博通聯合開發的定制芯片,都屬于這一范疇。
除了ASIC,FPGA也是AI芯片市場不可忽視的新力量。最開始時,GPU主要用于游戲領域,2012年GPU開始向AI領域轉型。到了今天,GPU通常會與CPU搭配使用,集成于服務器機架系統,部署于數據中心,為云端AI提供算力支持。
![]()
Futurum Group認為,未來幾年,定制ASIC的增長速度將會超過GPU。
為什么企業追捧定制AI芯片?
由于GPU能同時執行大量運算,成為AI訓練和推理的理想選擇。在訓練階段,AI模型從海量數據中學習規律;在推理時,AI利用學到的知識對信息做出決策。
研發GPU的主要有英偉達和AMD,英偉達圍繞GPU搭建了專用軟件平臺CUDA,AMD GPU則依賴開源軟件生態系統。
根據英偉達透露,一套整合72塊Blackwell GPU的服務器機架,售價約為300萬美元,每周出貨量約為1000套。
在大型語言模型(LLM)發展初期,GPU為訓練提供支撐,但隨著行業的發展,推理變得越來越重要。企業可以用性能要求較低、針對特定任務編程的芯片來完成推理,ASIC成為核心解決方案。
我們可以將GPU看成為“瑞士軍刀”,能處理各種AI負載,完成多種并行運算;而ASIC則是“單用途工具”,擁有極高效率和速度,但硬件電路固定,只能執行某一類特定任務。
英偉達GPU足夠靈活,被許多AI企業采用,但單塊GPU售價高昂,達到4萬美元。一些初創企業仍然愿意投入高昂的GPU成本,主要是設計定制化ASIC前期投入更高,起步便是數千萬美元,小企業無法承擔。但對于有實力的企業來說,定制ASIC從長遠看更有性價比。
在定制ASIC領域,谷歌率先向英偉達發起沖鋒。2015年谷歌首款ASIC芯片問世,十年過去,11月份谷歌發布第7代TPU。
《芯片戰爭》一書作者克里斯·米勒(Chris Miller)認為,從技術層面看,TPU已與英偉達GPU不相上下,甚至更勝一籌。他認為,谷歌TPU僅用于內部,但從長遠看,谷歌會逐步開放,允許外部企業使用。
AWS也在模仿谷歌設計自己的AI芯片。2015年,亞馬遜收購以色列Annapurna Labs,2018年推出推理芯片Inferentia,2022年發布訓練芯片Trainium。
Trainium首席架構師伯尼·迪亞曼特(Ron Diamant)透露說,亞馬遜新的三代Trainium比其它同類產品高性能高出30-40%。他還說,未來Trainium在推理、訓練方面將會更上層樓。
研發ASIC并非易事,于是許多企業尋求與博通、Marvell合作,它們提供知識產權、專業技術和網絡支持,幫助客戶研發定制ASIC,博通成為這場定制浪潮的最大受益者。
不只有英偉達,未來是多方案并存
除了谷歌、亞馬遜,微軟也參與ASIC賽道。在美國東部的微軟數據中心,已經引入其自研的Maia 100芯片。還有,高通推出了A1200芯片,英特爾研發了Gaudi AI加速器,特斯拉打造了AI5芯片。初創企業也紛紛涌入,比如專注于晶圓級AI芯片研發的Cerebras,專注于推理任務的芯片開發商Groq。
在中國,華為、字節跳動、阿里巴巴也在研發定制ASIC。
在AI芯片領域,神經網絡處理單元(NPU)也是一大類別,它通常集成在SoC中,為設備提供AI功能,能耗較低,可以節省空間。高通、英特爾、AMD都在研發NPU,為PC提供AI算力支持。
米勒表示:“目前大部分資金都流向了數據中心領域,但隨著時間推移,這一格局將會改變。未來,AI將廣泛地部署在我們的手機、汽車、可穿戴設備等各類產品中,其應用程度將遠超當下。”
最后是FPGA,它可以在制造完成后通過軟件重新配置,靈活性比NPU和ASIC更高,但在處理AI負載時,性能和能效相對較低。2022年AMD以490億美元收購Xilinx,2015年英特爾以167億美元收購Altera,都是為了布局FPGA。
最近幾天,市場傳出消息稱,OpenAI準備與博通合作,開發定制AI芯片;META考慮采購谷歌TPU芯片;Anthropic宣布采購最多100萬塊谷歌TPU芯片。
Jefferies分析師上周在研報中表示,ASIC已經迎來拐點。不過企業選擇定制戰略,雖然能降低成本,減少對英偉達的依賴,但也意味著會被局限于特定AI應用場景或者模型,在AI技術飛速迭代的當下,可能存在諸多不便。
Gartner則認為,定制化AI不僅成本高,而且存在諸多復雜環節,比如要為硬件開發定制配套軟件。想擁有一款高性能定制芯片,需要投入巨額研發資金,而且還要經歷多次迭代。所以,只有大型科技企業才對ASIC有需求,也只有它們的產品才具有商業可行性。
英偉達CEO黃仁勛并不認為定制化AI芯片(通常是博通產品)構成威脅,他稱定制芯片的性能無法抗衡英偉達產品。今年早些時候,黃仁勛接受采訪時表示,很多ASIC項目將會夭折,他還堅定地認為ASIC缺乏競爭力。
但Gartner卻認為,到2026年,AI推理算力的相關支出將會超過訓練算力支出,最終絕大多數AI支出將會分配給推理,比例可能達85-90%。市場將會由訓練向推理過渡,最終形成各種芯片方案百花齊放的局面。作為超大企業,未來會逐漸降低對英偉達的依賴,不過在定制芯片上運行的負載比例不會太高,只會占一部分。(小刀)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.