微軟于美東時間26日周一發布第二代自研人工智能(AI)芯片Maia 200,這是微軟減少對英偉達芯片依賴、更高效驅動自身服務的核心舉措。這款采用臺積電3納米工藝制造的芯片已開始部署至愛荷華州的數據中心,隨后將進駐鳳凰城地區,標志著微軟在自研芯片領域的重大進展。
![]()
微軟云與AI業務負責人Scott Guthrie在博客文章中表示,Maia 200是“微軟有史以來部署的最高效推理系統”,每美元性能比微軟當前最新一代硬件提升30%。這些芯片將首先供應給微軟的超級智能團隊用于生成數據以改進下一代AI模型,同時為面向企業的Copilot助手及包括OpenAI最新模型在內的AI服務提供算力支持。
據Scott Guthrie披露,Maia 200在某些性能指標上超越了谷歌和亞馬遜的同類芯片。該芯片在FP4精度下的性能是第三代亞馬遜Trainium芯片的三倍,FP8性能則超過谷歌第七代TPU。微軟已向開發者、學術界和前沿AI實驗室開放Maia 200軟件開發工具包的預覽版,并計劃“未來向更多客戶開放”該芯片的云服務租用。
這一發布凸顯了科技巨頭爭奪AI算力自主權的激烈競爭。在英偉達芯片供應緊張且成本高昂的背景下,微軟、亞馬遜和谷歌均加快自研芯片進程,力求為云客戶提供成本更低、集成更順暢的替代方案。微軟已表示正在設計Maia 300后續產品。
發布Maia 200后,美股早盤尾聲時,盤初轉漲的微軟股價漲幅擴大到1%以上,臨近午盤時曾漲逾1.6%,收漲逾0.9%,連續三個交易日收漲,刷新將近兩周來收盤高位。
![]()
性能參數:超1400億晶體管的推理算力
據Scott Guthrie在微軟官方博客中介紹,Maia 200采用臺積電尖端3納米工藝制造,每顆芯片包含超過1400億個晶體管。該芯片專為大規模AI工作負載定制,在4位精度(FP4)下可提供超過10 petaFLOPS的算力,在8位精度(FP8)下提供超過5 petaFLOPS的性能,所有這些性能都在750瓦的芯片功耗范圍內實現。
Guthrie在博客中強調,“實際應用中,一個Maia 200節點可以輕松運行當今最大的模型,并為未來更大的模型留有充足空間。” 該芯片配備216GB HBM3e內存,帶寬達7 TB/s,以及272MB片上SRAM,專門設計的DMA引擎和數據傳輸架構確保大規模模型能夠快速高效地運行。
在系統層面,Maia 200采用基于標準以太網的雙層擴展網絡設計。每個加速器提供2.8 TB/s的雙向專用擴展帶寬,可在最多6144個加速器的集群中實現可預測的高性能集體操作。每個托盤內四顆Maia加速器通過直連、非交換鏈路完全互聯,在機架內和機架間使用統一的Maia AI傳輸協議,實現跨節點、跨機架的無縫擴展。
![]()
云業務關鍵支撐:從Copilot到OpenAI模型
Maia 200芯片已成為微軟異構AI基礎設施的重要組成部分,將為多個模型提供服務。Scott Guthrie的博客稱,新一代AI加速器使微軟云Azure在更快、更經濟高效地運行AI模型方面占據優勢。
Guthrie披露,該芯片將支持OpenAI的最新GPT-5.2模型,為Microsoft Foundry和Microsoft 365 Copilot帶來性能價格比優勢。
微軟超級智能團隊將使用Maia 200進行合成數據生成和強化學習,以改進下一代內部模型。Guthrie在博客中指出,“對于合成數據管道用例,Maia 200的獨特設計有助于加快生成和過濾高質量、特定領域數據的速度,為下游訓練提供更新鮮、更有針對性的信號。”
面向商業生產力軟件套件的Microsoft 365 Copilot附加服務以及用于在AI模型基礎上構建應用的Microsoft Foundry服務都將采用這款芯片。隨著Anthropic和OpenAI等生成式AI模型開發商以及在熱門模型基礎上構建AI代理和其他產品的公司需求激增,云服務提供商正努力提升計算能力,同時控制能耗。
Maia 200目前已部署在微軟位于愛荷華州得梅因附近的美國中部數據中心區域,隨后將進駐亞利桑那州鳳凰城附近的美國西部3區,未來還將部署到更多區域。微軟已邀請開發者、學術界和AI實驗室于周一開始使用Maia軟件開發工具包,盡管尚不清楚Azure云服務用戶何時能夠使用運行該芯片的服務器。
減少英偉達依賴:科技巨頭的芯片競賽
微軟的芯片計劃啟動時間晚于亞馬遜和谷歌,但三家公司有著相似的目標:打造成本效益高、可無縫接入數據中心的機器,為云客戶提供節省成本和其他效率優勢。英偉達最新業界領先芯片的高昂成本和供應短缺,推動了尋找替代算力來源的競爭。
谷歌擁有張量處理單元TPU,這些單元不作為芯片出售,而是通過其云服務提供計算能力。亞馬遜則推出了自己的AI加速器芯片Trainium,其最新版本Trainium3于去年12月發布。在每種情況下,這些自研芯片都可以分擔原本分配給英偉達GPU的部分計算任務,從而降低整體硬件成本。
據Scott Guthrie在博客中披露的數據,Maia 200在性能上明顯超越競爭對手:FP4性能是第三代亞馬遜Trainium芯片的三倍,FP8性能超過谷歌第七代TPU。每顆Maia 200芯片配備的高帶寬內存超過AWS第三代Trainium AI芯片或谷歌第七代張量處理單元(TPU)。該芯片每美元性能比微軟當前部署的最新一代硬件提升30%。
微軟云與AI執行副總裁Guthrie稱Maia 200為“所有超大規模云服務商中性能最強的自研芯片”。值得注意的是,該芯片使用以太網電纜連接,而非InfiniBand標準——后者是英偉達在2020年收購Mellanox后銷售的交換機所采用的標準。
快速迭代:Maia 300已在設計中
微軟表示已在設計Maia 200的后續產品Maia 300。據Scott Guthrie在博客中透露,微軟的Maia AI加速器項目被設計為多代迭代計劃,“隨著我們在全球基礎設施中部署Maia 200,我們已經在為未來幾代產品進行設計,預計每一代都將不斷為最重要的AI工作負載樹立新標桿,提供更好的性能和效率。”
Maia 200距離上一代產品Maia 100發布已有兩年。2023年11月,微軟發布Maia 100時從未向云客戶提供租用服務。Guthrie在周一的博客文章中表示,對于新芯片,“未來將有更廣泛的客戶可用性”。
微軟芯片開發項目的核心原則是在最終芯片可用之前盡可能驗證端到端系統。一個精密的預硅環境從最早期階段就指導了Maia 200架構,以高保真度模擬大語言模型的計算和通信模式。這種早期協同開發環境使微軟能夠在首批芯片生產之前,將芯片、網絡和系統軟件作為統一整體進行優化。得益于這些投入,Maia 200芯片在首批封裝零件到達后數天內就運行了AI模型,從首批芯片到首次數據中心機架部署的時間縮短至同類AI基礎設施項目的不到一半。
如果內部努力遇挫,微軟還有其他選擇:作為與密切合作伙伴OpenAI交易的一部分,該公司可以獲得ChatGPT制造商的新興芯片設計。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.