![]()
2026年1月1日,MacaronAI旗下MindLab搞出了個大動靜。
他們推出的首款產(chǎn)品MinT平臺,居然讓普通CPU機器就能訓練萬億參數(shù)的AI模型,一天就能跑完一輪訓練。
![]()
之前AI圈里練萬億參數(shù)模型,那可是大公司的專屬游戲。
沒上千張頂級GPU,想都別想啟動訓練,中小團隊和高校研究者只能看著算力門檻嘆氣。
MinT偏要打破這個規(guī)矩,它用了LoRA技術,不用改動模型全部參數(shù),只針對性訓練一小部分關鍵模塊就行。
這個技術方案已經(jīng)開源,還得到了NVIDIA官方的轉(zhuǎn)載。
![]()
我本來以為這種級別的技術突破,得是老牌巨頭才能搞定,沒想到是一群年輕人牽頭。
MindLab的團隊配置確實亮眼,創(chuàng)始人Andrew畢業(yè)于MIT,現(xiàn)在還擔任深圳清華大學研究院研發(fā)中心主任,之前做的FireAct是Agent微調(diào)領域的經(jīng)典工作。
首席科學家馬驍騰博士是清華自動化系出身,一直深耕強化學習。
![]()
這樣的團隊做出來的產(chǎn)品,技術底子自然不用懷疑。
MinT最讓人驚喜的是成本控制,之前大模型強化學習的花費高到嚇人,現(xiàn)在它直接把成本壓了下來,讓更多人有了參與的可能。
AI圈之前一直圍著預訓練打轉(zhuǎn),模型越做越大,數(shù)據(jù)越用越多。
但練完之后問題就來了,模型參數(shù)一旦定死,就像被凍住了一樣,遇到新情況還是會重復犯錯,沒法適應變化的需求。
![]()
后來大家慢慢發(fā)現(xiàn),強化學習才是破局的關鍵。
它能讓模型不再只是記數(shù)據(jù),而是學會推理,這一點已經(jīng)被DeepSeekR1、Gemini這些前沿模型驗證過。
海外那邊,前OpenAICTOMira創(chuàng)辦的ThinkingMachines,早就盯上了這個賽道,推出的Tinker平臺在硅谷火得一塌糊涂,還拿了巨額融資。
本來以為Tinker會一直領跑后訓練領域,沒想到MinT不僅追了上來,還實現(xiàn)了反超。
![]()
MinT和Tinker的接口完全兼容,開發(fā)者不用改多少代碼就能遷移過來。
更關鍵的是,MinT比Tinker更早實現(xiàn)了萬億參數(shù)的LoRA-RL,這可是業(yè)界首個該級別的成果。
如此看來,后訓練賽道的競爭,已經(jīng)從海外獨角戲變成了全球同臺競技。
MinT的出現(xiàn),最受益的當屬Agent領域的創(chuàng)業(yè)公司和高校實驗室。
![]()
這些團隊手里有好數(shù)據(jù)、好想法,卻常常被算力和復雜的訓練框架困住。
現(xiàn)在有了MinT,他們不用再為硬件發(fā)愁,本地CPU寫幾行代碼,就能把訓練任務分發(fā)到GPU集群執(zhí)行。
切換不同模型也特別簡單,只需要修改代碼里的一個字符串就行。
目前已經(jīng)有頂尖高校用它做基礎研究,原本需要多節(jié)點才能完成的訓練,現(xiàn)在單節(jié)點就能搞定。
![]()
創(chuàng)業(yè)公司也在垂直行業(yè)里落地,從智能客服到專業(yè)工具適配,都能看到MinT的身影。
在AI核心工具領域,國產(chǎn)產(chǎn)品能做到對標甚至超越海外標桿,真的很不容易。
現(xiàn)在數(shù)據(jù)安全越來越受重視,MinT作為國產(chǎn)平臺,還能適配KimiK2、Qwen3-VL這些國內(nèi)前沿模型,這一點尤為關鍵。
它沒有搞技術封鎖,反而開源方案、降低門檻,讓更多人能用上先進的后訓練工具。
![]()
MinT的橫空出世,其實是給AI后訓練時代帶來了新的玩法。
它證明了AI技術不一定非要靠堆算力、砸錢才能推進,極致的工程效率同樣能實現(xiàn)突破。
未來,隨著這類國產(chǎn)工具的不斷迭代,相信會有更多中小團隊和研究者參與到AI創(chuàng)新中,中國AI也能在這個關鍵賽道上掌握更多主動權(quán)。
AI的下半場,從來不是少數(shù)人的游戲,而是更多人的共同探索。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.