財(cái)聯(lián)社1月27日訊(編輯 史正丞)繼去年底谷歌、亞馬遜先后發(fā)布自研算力芯片后,同為全球云計(jì)算“三巨頭”的微軟終于在本周“交卷”——傳聞已久的Maia 200芯片正式面世。
微軟在公告中表示,這款“為推理而生”的芯片在多項(xiàng)測(cè)試中超越亞馬遜的第三代Trainium和谷歌第七代TPU。因此,微軟將Maia 200公開(kāi)稱為“所有超大規(guī)模云服務(wù)商中性能最強(qiáng)的自研芯片”。
![]()
(來(lái)源:公司官網(wǎng))
據(jù)公司介紹,Maia 200采用臺(tái)積電3nm工藝制造,內(nèi)建原生FP8/FP4張量核。每顆芯片包含超過(guò)1400億個(gè)晶體管,專為大規(guī)模AI工作負(fù)載量身打造,特別是采用低精度計(jì)算的最新一代AI大模型。
微軟披露,單顆Maia 200芯片在4位精度(FP4)可提供超過(guò)10 PetaFLOPS的算力,在8位精度(FP8)下也能超過(guò)5 PetaFLOPS,而且整個(gè)SoC的熱設(shè)計(jì)功耗能夠控制在750W以內(nèi)。科技巨頭強(qiáng)調(diào),在實(shí)際運(yùn)行中,單塊Maia 200就能輕松運(yùn)行當(dāng)今最大的AI模型,同時(shí)還為未來(lái)更大型的模型留有余量。
除了芯片本身的算力外,微軟也在存儲(chǔ)參數(shù)上猛“堆料”。公司披露,Maia 200配備216GB、帶寬達(dá)7TB/s的HBM3e,以及272MB的片上SRAM。在拓展層面,每塊芯片提供2.8TB/s的雙向?qū)S脭U(kuò)展帶寬,支持在6144個(gè)加速器集群中提供可預(yù)測(cè)的高性能集合操作。
因此,微軟芯片在“跑分”上贏過(guò)另外兩家競(jìng)品也在情理之中。微軟在公告中表示,Maia 200的FP4性能是亞馬遜第三代Trainium的3倍有余,且在FP8性能上超越谷歌第七代TPU。
![]()
除了性能外,作為云服務(wù)商的自研芯片,省錢(qián)也是一項(xiàng)關(guān)鍵指標(biāo)。微軟透露,Maia 200是公司迄今部署過(guò)的效率最高推理系統(tǒng),其“每美元性能”相比當(dāng)前機(jī)群中最新一代硬件提升了30%。
作為云服務(wù)商競(jìng)相推出自研芯片的背景,隨著AI服務(wù)日漸成熟,推理成本已經(jīng)成為整體運(yùn)營(yíng)中日益重要的部分,促使云服務(wù)供應(yīng)商關(guān)注如何單獨(dú)為這塊需求提供更具性價(jià)比的方案,特別是要比英偉達(dá)GPU更具性價(jià)比。本質(zhì)上,微軟、谷歌和亞馬遜發(fā)布的自研芯片,都是在承擔(dān)原本需要英偉達(dá)GPU處理的計(jì)算任務(wù),從而降低整體成本。
非常有趣的是,微軟似乎不止“優(yōu)化”了英偉達(dá)的芯片。公司披露,每臺(tái)Maia 200服務(wù)器中包含4塊芯片,依靠以太網(wǎng)連接,而不是InfiniBand標(biāo)準(zhǔn)。而InfiniBand交換機(jī)正是英偉達(dá)在2020年收購(gòu)Mellanox后所銷(xiāo)售的產(chǎn)品。
微軟透露,目前正在為美國(guó)中部地區(qū)的數(shù)據(jù)中心配備最新款芯片,之后會(huì)在更多地點(diǎn)部署。目前尚不清楚Azure云服務(wù)的用戶何時(shí)能使用搭載該芯片的服務(wù)器。
微軟此前也表示,已經(jīng)在設(shè)計(jì)該芯片的后續(xù)產(chǎn)品Maia 300。科技巨頭也與OpenAI達(dá)成協(xié)議,可以使用初創(chuàng)公司的芯片設(shè)計(jì)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.