![]()
新智元報(bào)道
編輯:傾傾
【新智元導(dǎo)讀】噩夢(mèng)成真!微軟Maia 200正式殺進(jìn)數(shù)據(jù)中心,左手3nm自研芯,右手Triton,照著老黃的大動(dòng)脈砍。當(dāng)頭號(hào)金主爸爸搖身一變成了頭號(hào)死敵,這場(chǎng)千億美金的算力大逃殺,微軟不光為了省錢,更是要革了CUDA的命。
老黃的噩夢(mèng)成真了!2026年1月26日,微軟數(shù)據(jù)中心(愛荷華)一聲巨響,黃仁勛的后背瞬間涼透。
微軟正式官宣:第二代自研AI芯片Maia 200上線!
這哪里是發(fā)新品?這分明是全球最大買家對(duì)賣家的背刺。
當(dāng)全世界還在卷HBM顯存大小的時(shí)候,微軟反手就是一個(gè)「降級(jí)打擊」,用更務(wù)實(shí)的內(nèi)存架構(gòu),切開了英偉達(dá)最驕傲的護(hù)城河。
特洛伊木馬:OpenAI遞給微軟的刀
表面看,Maia 200是一塊臺(tái)積電3nm工藝的硬核硅片;但讓老黃睡不著覺的,是隨芯片捆綁發(fā)布的軟件核武:Triton。
在芯片圈,有一條心照不宣規(guī)則:硬件決定下限,軟件決定上限。
英偉達(dá)十年無敵,全靠CUDA鎖死開發(fā)者——換芯片?代碼重寫能廢掉半個(gè)團(tuán)隊(duì)。
微軟這次祭出的Triton,核心開發(fā)者正是英偉達(dá)的好基友——OpenAI。
![]()
開發(fā)者實(shí)測(cè),在Transformer注意力內(nèi)核等場(chǎng)景,代碼量比CUDA減少75-90%,性能媲美甚至局部超CUDA 5-37%。
微軟直接喊話:開發(fā)者,來吧,無痛遷移!
![]()
測(cè)試代碼:https://github.com/leandrolcampos/flash-attention/
更狠的是,Meta和Google也在后面遞刀子。2025年底Google與Meta合作TorchTPU,目標(biāo)2026年把CUDA「柏林墻」徹底推倒。
![]()
如果Maia 200是廉價(jià)引擎,Triton就是傻瓜式自動(dòng)駕駛系統(tǒng)。
當(dāng)寫代碼不再求著CUDA,英偉達(dá)那個(gè)萬億市值的軟件稅,基本上就收到了頭。
為什么能反殺?
答案藏在參數(shù)表里:Maia 200塞滿了272MB on-chip SRAM。
![]()
大模型訓(xùn)練拼帶寬,推理拼響應(yīng)速度。億級(jí)用戶同時(shí)調(diào)戲ChatGPT,瓶頸早不是帶寬,而是毫秒級(jí)延遲。
對(duì)此,微軟的解法簡(jiǎn)單粗暴:在芯片里塞爆SRAM,思路直接致敬Cerebras和Groq。
結(jié)果,Maia 200單次Token生成經(jīng)濟(jì)性大幅提升,官方宣稱性能比現(xiàn)有硬件高30%——同價(jià)位下,推理成本更低,效率更高。
![]()
老黃的Blackwell還在賣高價(jià)堆料,Maia 200專為「特化打擊」而來。
在開發(fā)者眼里,它也許不是絕對(duì)最快,但絕對(duì)最便宜。
塑料友誼正式破裂
微軟和OpenAI看似恩愛,實(shí)則早已同床異夢(mèng)。
Maia 200發(fā)布前夜,OpenAI甩出一張100億美金的采購單,接盤的竟然不是微軟,而是Cerebras!
![]()
OpenAI理所當(dāng)然地表示:
我們追求算力多樣化,避免任何供應(yīng)商成單點(diǎn)故障。
這波操作,讓微軟尷尬,也讓英偉達(dá)感受到前所未有的生存危機(jī)。
為了補(bǔ)推理短板,英偉達(dá)甚至緊急從Groq許可技術(shù),試圖續(xù)命。
這波四方博弈簡(jiǎn)直是硅谷版《甄嬛傳》:
· 微軟:砸錢OpenAI,同時(shí)瘋狂造芯搞「去OpenAI化」;
· OpenAI:吃微軟的飯,砸英偉達(dá)的鍋,還偷偷給第三方送錢;
·英偉達(dá):眼看大客戶造反,被迫花200億買Groq技術(shù)防身;
· Google/Meta:蹲在旁邊磨刀,隨時(shí)準(zhǔn)備趁亂分一杯羹。
Maia 200的上線,本質(zhì)上就是微軟的「財(cái)產(chǎn)公證」。對(duì)于納德拉來說,最好的盟友不是Sam Altman,而是那塊成本可控的3nm硅片。
納德拉9600萬美金的「對(duì)賭協(xié)議」
技術(shù)吹得再牛,在華爾街眼里也是生意。
Maia 200能不能成,直接決定了納德拉今年能不能拿到那9650萬美金 。
對(duì)于4萬億市值的巨獸來說,省錢=賺錢。
微軟每跑一塊Maia芯片,對(duì)英偉達(dá)的依賴就少一分,毛利就多一成。
![]()
這根本不是技術(shù)競(jìng)賽,這是打工皇帝的錢包保衛(wèi)戰(zhàn)。納德拉絕對(duì)不甘心讓微軟變成幫黃仁勛賣鏟子的「長(zhǎng)工」。
微軟2025年在AI基礎(chǔ)設(shè)施上的資本開支預(yù)計(jì)將突破800億美元。
這意味著,微軟每向英偉達(dá)支付1美元的租金,其利潤(rùn)率就會(huì)被削薄一層。
在4萬億市值的盤子里,哪怕是1%的降本增效,都意味著數(shù)百億美元的估值溢價(jià)。
在3納米的晶圓背后,跳動(dòng)的是納德拉對(duì)「算力主權(quán)」的野心——他絕對(duì)不甘心讓微軟成為幫黃仁勛賣鏟子的「長(zhǎng)工」。
從「訓(xùn)得快」到「回得快」
AI算力圈徹底變天
隨著Maia 200誕生,AI算力圈變天了。
前兩年比的是大煉模型,誰卡多誰牛X;2026年比的是極速降本,誰便宜誰贏。
英偉達(dá)靠CUDA+HBM贏了上半場(chǎng),但推理時(shí)代,Maia 200正在把高溢價(jià)底褲一點(diǎn)點(diǎn)扒下來。
Google TPU、Amazon Inferentia、Cerebras都在搶灘登陸,誰能把算力從奢侈品變自來水,誰就能贏。
黃仁勛曾說,CUDA是英偉達(dá)最深的護(hù)城河。但現(xiàn)在,水被抽干,露出了底部的淤泥。
當(dāng)全網(wǎng)最強(qiáng)買家不再愿意支付信仰稅,那個(gè)靠賣鏟子躺賺的時(shí)代,徹底寄了。
Maia 200,它告訴我們一個(gè)真理:
在絕對(duì)的資本意志面前,沒有永遠(yuǎn)的護(hù)城河,只有嫌你太貴的生意人。
參考資料:
https://www.bloomberg.com/news/articles/2026-01-26/microsoft-unveils-latest-ai-chip-to-reduce-reliance-on-nvidia
https://www.reuters.com/business/microsoft-rolls-out-next-generation-its-ai-chips-takes-aim-nvidias-software-2026-01-26/
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.