微軟于美東時(shí)間26日周一發(fā)布第二代自研人工智能(AI)芯片Maia 200,這是微軟減少對(duì)英偉達(dá)芯片依賴(lài)、更高效驅(qū)動(dòng)自身服務(wù)的核心舉措。這款采用臺(tái)積電3納米工藝制造的芯片已開(kāi)始部署至愛(ài)荷華州的數(shù)據(jù)中心,隨后將進(jìn)駐鳳凰城地區(qū),標(biāo)志著微軟在自研芯片領(lǐng)域的重大進(jìn)展。
![]()
微軟云與AI業(yè)務(wù)負(fù)責(zé)人Scott Guthrie在博客文章中表示,Maia 200是“微軟有史以來(lái)部署的最高效推理系統(tǒng)”,每美元性能比微軟當(dāng)前最新一代硬件提升30%。這些芯片將首先供應(yīng)給微軟的超級(jí)智能團(tuán)隊(duì)用于生成數(shù)據(jù)以改進(jìn)下一代AI模型,同時(shí)為面向企業(yè)的Copilot助手及包括OpenAI最新模型在內(nèi)的AI服務(wù)提供算力支持。
據(jù)Scott Guthrie披露,Maia 200在某些性能指標(biāo)上超越了谷歌和亞馬遜的同類(lèi)芯片。該芯片在FP4精度下的性能是第三代亞馬遜Trainium芯片的三倍,F(xiàn)P8性能則超過(guò)谷歌第七代TPU。微軟已向開(kāi)發(fā)者、學(xué)術(shù)界和前沿AI實(shí)驗(yàn)室開(kāi)放Maia 200軟件開(kāi)發(fā)工具包的預(yù)覽版,并計(jì)劃“未來(lái)向更多客戶(hù)開(kāi)放”該芯片的云服務(wù)租用。
這一發(fā)布凸顯了科技巨頭爭(zhēng)奪AI算力自主權(quán)的激烈競(jìng)爭(zhēng)。在英偉達(dá)芯片供應(yīng)緊張且成本高昂的背景下,微軟、亞馬遜和谷歌均加快自研芯片進(jìn)程,力求為云客戶(hù)提供成本更低、集成更順暢的替代方案。微軟已表示正在設(shè)計(jì)Maia 300后續(xù)產(chǎn)品。
發(fā)布Maia 200后,美股早盤(pán)尾聲時(shí),盤(pán)初轉(zhuǎn)漲的微軟股價(jià)漲幅擴(kuò)大到1%以上,臨近午盤(pán)時(shí)曾漲逾1.6%,收漲逾0.9%,連續(xù)三個(gè)交易日收漲,刷新將近兩周來(lái)收盤(pán)高位。
![]()
性能參數(shù):超1400億晶體管的推理算力
據(jù)Scott Guthrie在微軟官方博客中介紹,Maia 200采用臺(tái)積電尖端3納米工藝制造,每顆芯片包含超過(guò)1400億個(gè)晶體管。該芯片專(zhuān)為大規(guī)模AI工作負(fù)載定制,在4位精度(FP4)下可提供超過(guò)10 petaFLOPS的算力,在8位精度(FP8)下提供超過(guò)5 petaFLOPS的性能,所有這些性能都在750瓦的芯片功耗范圍內(nèi)實(shí)現(xiàn)。
Guthrie在博客中強(qiáng)調(diào),“實(shí)際應(yīng)用中,一個(gè)Maia 200節(jié)點(diǎn)可以輕松運(yùn)行當(dāng)今最大的模型,并為未來(lái)更大的模型留有充足空間。” 該芯片配備216GB HBM3e內(nèi)存,帶寬達(dá)7 TB/s,以及272MB片上SRAM,專(zhuān)門(mén)設(shè)計(jì)的DMA引擎和數(shù)據(jù)傳輸架構(gòu)確保大規(guī)模模型能夠快速高效地運(yùn)行。
在系統(tǒng)層面,Maia 200采用基于標(biāo)準(zhǔn)以太網(wǎng)的雙層擴(kuò)展網(wǎng)絡(luò)設(shè)計(jì)。每個(gè)加速器提供2.8 TB/s的雙向?qū)S脭U(kuò)展帶寬,可在最多6144個(gè)加速器的集群中實(shí)現(xiàn)可預(yù)測(cè)的高性能集體操作。每個(gè)托盤(pán)內(nèi)四顆Maia加速器通過(guò)直連、非交換鏈路完全互聯(lián),在機(jī)架內(nèi)和機(jī)架間使用統(tǒng)一的Maia AI傳輸協(xié)議,實(shí)現(xiàn)跨節(jié)點(diǎn)、跨機(jī)架的無(wú)縫擴(kuò)展。
![]()
云業(yè)務(wù)關(guān)鍵支撐:從Copilot到OpenAI模型
Maia 200芯片已成為微軟異構(gòu)AI基礎(chǔ)設(shè)施的重要組成部分,將為多個(gè)模型提供服務(wù)。Scott Guthrie的博客稱(chēng),新一代AI加速器使微軟云Azure在更快、更經(jīng)濟(jì)高效地運(yùn)行AI模型方面占據(jù)優(yōu)勢(shì)。
Guthrie披露,該芯片將支持OpenAI的最新GPT-5.2模型,為Microsoft Foundry和Microsoft 365 Copilot帶來(lái)性能價(jià)格比優(yōu)勢(shì)。
微軟超級(jí)智能團(tuán)隊(duì)將使用Maia 200進(jìn)行合成數(shù)據(jù)生成和強(qiáng)化學(xué)習(xí),以改進(jìn)下一代內(nèi)部模型。Guthrie在博客中指出,“對(duì)于合成數(shù)據(jù)管道用例,Maia 200的獨(dú)特設(shè)計(jì)有助于加快生成和過(guò)濾高質(zhì)量、特定領(lǐng)域數(shù)據(jù)的速度,為下游訓(xùn)練提供更新鮮、更有針對(duì)性的信號(hào)。”
面向商業(yè)生產(chǎn)力軟件套件的Microsoft 365 Copilot附加服務(wù)以及用于在AI模型基礎(chǔ)上構(gòu)建應(yīng)用的Microsoft Foundry服務(wù)都將采用這款芯片。隨著Anthropic和OpenAI等生成式AI模型開(kāi)發(fā)商以及在熱門(mén)模型基礎(chǔ)上構(gòu)建AI代理和其他產(chǎn)品的公司需求激增,云服務(wù)提供商正努力提升計(jì)算能力,同時(shí)控制能耗。
Maia 200目前已部署在微軟位于愛(ài)荷華州得梅因附近的美國(guó)中部數(shù)據(jù)中心區(qū)域,隨后將進(jìn)駐亞利桑那州鳳凰城附近的美國(guó)西部3區(qū),未來(lái)還將部署到更多區(qū)域。微軟已邀請(qǐng)開(kāi)發(fā)者、學(xué)術(shù)界和AI實(shí)驗(yàn)室于周一開(kāi)始使用Maia軟件開(kāi)發(fā)工具包,盡管尚不清楚Azure云服務(wù)用戶(hù)何時(shí)能夠使用運(yùn)行該芯片的服務(wù)器。
減少英偉達(dá)依賴(lài):科技巨頭的芯片競(jìng)賽
微軟的芯片計(jì)劃啟動(dòng)時(shí)間晚于亞馬遜和谷歌,但三家公司有著相似的目標(biāo):打造成本效益高、可無(wú)縫接入數(shù)據(jù)中心的機(jī)器,為云客戶(hù)提供節(jié)省成本和其他效率優(yōu)勢(shì)。英偉達(dá)最新業(yè)界領(lǐng)先芯片的高昂成本和供應(yīng)短缺,推動(dòng)了尋找替代算力來(lái)源的競(jìng)爭(zhēng)。
谷歌擁有張量處理單元TPU,這些單元不作為芯片出售,而是通過(guò)其云服務(wù)提供計(jì)算能力。亞馬遜則推出了自己的AI加速器芯片Trainium,其最新版本Trainium3于去年12月發(fā)布。在每種情況下,這些自研芯片都可以分擔(dān)原本分配給英偉達(dá)GPU的部分計(jì)算任務(wù),從而降低整體硬件成本。
據(jù)Scott Guthrie在博客中披露的數(shù)據(jù),Maia 200在性能上明顯超越競(jìng)爭(zhēng)對(duì)手:FP4性能是第三代亞馬遜Trainium芯片的三倍,F(xiàn)P8性能超過(guò)谷歌第七代TPU。每顆Maia 200芯片配備的高帶寬內(nèi)存超過(guò)AWS第三代Trainium AI芯片或谷歌第七代張量處理單元(TPU)。該芯片每美元性能比微軟當(dāng)前部署的最新一代硬件提升30%。
微軟云與AI執(zhí)行副總裁Guthrie稱(chēng)Maia 200為“所有超大規(guī)模云服務(wù)商中性能最強(qiáng)的自研芯片”。值得注意的是,該芯片使用以太網(wǎng)電纜連接,而非InfiniBand標(biāo)準(zhǔn)——后者是英偉達(dá)在2020年收購(gòu)Mellanox后銷(xiāo)售的交換機(jī)所采用的標(biāo)準(zhǔn)。
快速迭代:Maia 300已在設(shè)計(jì)中
微軟表示已在設(shè)計(jì)Maia 200的后續(xù)產(chǎn)品Maia 300。據(jù)Scott Guthrie在博客中透露,微軟的Maia AI加速器項(xiàng)目被設(shè)計(jì)為多代迭代計(jì)劃,“隨著我們?cè)谌蚧A(chǔ)設(shè)施中部署Maia 200,我們已經(jīng)在為未來(lái)幾代產(chǎn)品進(jìn)行設(shè)計(jì),預(yù)計(jì)每一代都將不斷為最重要的AI工作負(fù)載樹(shù)立新標(biāo)桿,提供更好的性能和效率。”
Maia 200距離上一代產(chǎn)品Maia 100發(fā)布已有兩年。2023年11月,微軟發(fā)布Maia 100時(shí)從未向云客戶(hù)提供租用服務(wù)。Guthrie在周一的博客文章中表示,對(duì)于新芯片,“未來(lái)將有更廣泛的客戶(hù)可用性”。
微軟芯片開(kāi)發(fā)項(xiàng)目的核心原則是在最終芯片可用之前盡可能驗(yàn)證端到端系統(tǒng)。一個(gè)精密的預(yù)硅環(huán)境從最早期階段就指導(dǎo)了Maia 200架構(gòu),以高保真度模擬大語(yǔ)言模型的計(jì)算和通信模式。這種早期協(xié)同開(kāi)發(fā)環(huán)境使微軟能夠在首批芯片生產(chǎn)之前,將芯片、網(wǎng)絡(luò)和系統(tǒng)軟件作為統(tǒng)一整體進(jìn)行優(yōu)化。得益于這些投入,Maia 200芯片在首批封裝零件到達(dá)后數(shù)天內(nèi)就運(yùn)行了AI模型,從首批芯片到首次數(shù)據(jù)中心機(jī)架部署的時(shí)間縮短至同類(lèi)AI基礎(chǔ)設(shè)施項(xiàng)目的不到一半。
如果內(nèi)部努力遇挫,微軟還有其他選擇:作為與密切合作伙伴OpenAI交易的一部分,該公司可以獲得ChatGPT制造商的新興芯片設(shè)計(jì)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.