AIPress.com.cn報道
谷歌在多年推出既能訓練AI模型、又能處理推理任務的芯片之后,決定把這兩項工作拆開,由不同處理器分別承擔。這也是谷歌在AI硬件領域繼續挑戰英偉達的最新一步。
4月22日消息,谷歌表示,這一變化將首先體現在第八代張量處理單元TPU上,兩款芯片都會在今年晚些時候推出。
谷歌高級副總裁、AI與基礎設施首席技術官Amin Vahdat在博客中表示,隨著AI代理興起,業界需要更專門化的芯片來分別滿足訓練和部署的需求。
今年3月,英偉達也曾介紹過即將推出的芯片,強調它們能幫助模型更快響應用戶提問。谷歌雖然是英偉達的大客戶,但也一直把TPU作為云客戶的替代方案。
目前,全球多數大型科技公司都在推進AI專用芯片,以提升效率并適配不同場景。蘋果多年來一直在自研iPhone芯片中加入神經引擎,微軟1月公布了第二代AI芯片,上周Meta則表示正與博通合作開發多個版本的AI處理器。
谷歌其實很早就進入了這條路線。2015年,公司就開始使用自研處理器運行AI模型,2018年又把這些芯片提供給云客戶。亞馬遜云服務早在2018年推出Inferentia芯片處理AI請求,并在2020年發布用于模型訓練的Trainium處理器。
DA Davidson分析師去年9月估算,TPU業務加上Google DeepMind AI團隊的價值可能接近9000億美元。
不過,幾家科技巨頭都還沒有真正撼動英偉達的地位。谷歌這次也沒有拿自家新芯片和英偉達正面比性能,只是表示訓練芯片在與第七代Ironwood TPU相同價格下,性能提升了2.8倍,而推理芯片的性能則提高了80%。
谷歌的新推理芯片命名為TPU 8i,每顆芯片配備384MB SRAM,是Ironwood的三倍。其架構強調低延遲和高吞吐,目的是讓數百萬個AI代理能夠以更低成本同時運行。Alphabet首席執行官桑達爾·皮查伊也在博客中寫道,這正是這類芯片設計的重點。
谷歌AI芯片的采用也在加速。Citadel Securities已經用谷歌TPU構建量化研究軟件,美國能源部旗下17家國家實驗室也都在使用基于TPU構建的AI科學家軟件。Anthropic則承諾將使用多吉瓦級別的谷歌TPU算力。
(AI普瑞斯編譯)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.