「AI工程師」正在重新定義生產(chǎn)關系。
最近有個感受:無論是寫代碼、調(diào)試Agent,還是部署一個內(nèi)部智能系統(tǒng),模型的“理解力”和“執(zhí)行力”,比任何花拳繡腿的小功能都更重要。
而這一波紅利,正在從懂得調(diào)用模型的“提示詞工程師”,轉(zhuǎn)向能夠整合模型、讓其自動行動的“AI工程師”手中。
每一個普通人,都能借助更好的一站式AI模型,實現(xiàn)頭號玩家一般的生產(chǎn)力!
海外有Claude 4.5、GPT-5,那么誰是國內(nèi)大模型的「頭號AI工程師呢」?
10月27日,MiniMax發(fā)布了全新的M2模型,“專為 Agent 和代碼而生”。
![]()
刷到海外博主,標題就特別直接:比GLM 4.6還強,跟Claude 4.5/GPT-5一樣的能力,但是,免費!
Claude、GPT效果好雖好,價格也確實不低;現(xiàn)在,就輪到MiniMax M2來掀桌子了……
01. 多模態(tài)強者,文本也強
印象里,MiniMax是多模態(tài)能力很強的,各類全球榜單時常登頂。
![]()
多模態(tài)的優(yōu)勢,對于MiniMax來說不算新聞,畢竟早已經(jīng)把音頻/視頻/文本模型,分別做到了全球第一/第二/第五。
但這次,殺回編程和文本領域,直接正面迎上Claude、ChatGPT最強勢的核心腹地,沒點能耐,還真不敢這么對標。
在全球權威測評榜單Artificial Analysis (AA)中,MiniMax-M2(紅色)表現(xiàn)卓越,總分位列全球前五,在開源模型中排第一。
這個評測體系,覆蓋了模型在數(shù)學、科學與編碼等多個核心領域的能力。
![]()
尤其在數(shù)學、科學與編碼領域,M2的得分非常接近Claude 4.5與Gemini 2.5 Pro,在國產(chǎn)模型中顯著第一。
![]()
而且,在GPQA-Diamond、HLE、LiveCodeBench等關鍵指標上,M2表現(xiàn)極為穩(wěn)健。
但價格卻僅為Claude的8%,堪稱性價比之王。
簡單來說,就是 Claude的性能,ChatGPT的速度,國產(chǎn)模型的價格。
02. 效果案例測評,從Coding、Deep Search到Agent
用M2,第一印象是“干凈”。
界面延續(xù)了MiniMax一貫的極簡設計,模型響應速度明顯快于上一代M1,生成流暢,沒有Claude那種稍顯“沉穩(wěn)”的延遲感。
![]()
MiniMax在M2中強調(diào)了兩個關鍵詞——Code Native和Agent Native。
這就是說,它不是我一開始想象的,簡單在語言模型上疊加編程能力,是從底層架構上針對工程師使用場景進行了優(yōu)化。
模型在執(zhí)行多輪任務、代碼修正和工具調(diào)用上的能力被顯著提升。
用更直白的話說,M2在生成解釋性代碼的同時,也能推理出任務目標的意圖層,具備初步的“執(zhí)行理解”。
![]()
MiniMax M2還不單單是榜單上牛,開發(fā)者真實場景下的體驗也確實不錯。
傳統(tǒng)LLM寫代碼,邏輯通常停留在“輸出片段”層面,而M2的最大優(yōu)勢在于完整的端到端循環(huán)能力。它可以:
同時處理多個代碼文件;
自動執(zhí)行“編寫 → 運行 → 調(diào)試 → 修復”全過程;
通過單元測試驗證代碼正確性;
甚至能主動修改依賴和邏輯結構。

https://0vw4prtvqi3d.space.minimax.io/
嘗試做了一個能跟隨鼠標變化的表情包小游戲,效果很絲滑。

MiniMax M2做的AI會議紀要產(chǎn)品的動態(tài)官網(wǎng),審美不錯,小細節(jié)也很到位,功能交互上完成度比較好。

生成的AI中國象棋對戰(zhàn)游戲,我真的能和AI玩上一整天。
Deep Search和Agentic能力也是MiniMax的傳統(tǒng)技能,在M2上有了更極致的發(fā)揮。

用Deep Search提了一個很具象的要求:選取近90天微博/小紅書/抖音/B站關于Sora的爆款帖(互動量前20),去重后統(tǒng)計主題分布。
結果就是數(shù)據(jù)準確度和全面性都很高。
![]()
測評統(tǒng)計來看,MiniMax M2接近GPT-5的能力,優(yōu)于Claude-4.5、DeepSeek V3.2等。
Agentic能力上,MiniMax-M2能夠出色地規(guī)劃并執(zhí)行復雜的工具鏈,協(xié)同調(diào)用 Shell、瀏覽器、Python代碼執(zhí)行器和各種MCP工具。
在 BrowseComp 評測中,它不僅可以挖掘到難以查找的信息源,還能保持信息來源的可追溯性,并具備自我糾錯與恢復的能力。
![]()
調(diào)用MCP,執(zhí)行復雜Pipeline,很多后段的任務也能真正落地了。
就像視頻里演示的,開發(fā)一個基于 Markdown 的blog網(wǎng)站,同樣的指令下,反而是Claude出現(xiàn)的負向反饋更多。
03. 性價比王者:又好又快還便宜
說回來模型本身,端到端的代碼能力,已經(jīng)很顯著了。
而一個能做到Claude 4.5相當水準、但只需8%價格的模型,本身就改變了工程師生態(tài)的底層成本。
![]()
以智能能力和價格作為象限的兩個坐標軸,右上角是兩者兼?zhèn)涞膮^(qū)間,MiniMax M2處在優(yōu)勢位置。
之前,像我們團隊在內(nèi)部做Agent實驗時,最擔心的是模型調(diào)用費用高昂,尤其是涉及多輪邏輯任務時,Claude或GPT成本確實不低。
而M2的開放策略,幾乎讓這種顧慮消失了。甚至近期還能免費!!
如果一個模型既能編程、又能推理、擅長多模態(tài),還能在團隊部署中以更低價格持續(xù)運行,那么創(chuàng)業(yè)團隊也就能負擔得起AI研發(fā),一個模型就能全棧全鏈路解決問題了。
速度的提升也值得單獨提一下。
M2在響應復雜任務時的延遲比上一代明顯縮短,特別是在代碼生成場景中,它幾乎可以與Claude并行對話。
眼下100 TPS的速度已經(jīng)很流暢了,而且還在持續(xù)提速。
更有意思的是,它沒有為了追求速度犧牲穩(wěn)定性。在長輸入、復雜語義和多任務調(diào)用下,它依然保持一致的上下文連貫性。
對工程師而言,這種“穩(wěn)定快”意味著工作節(jié)奏可以更自然地與模型融合,而不是等待一個遲鈍的響應。
![]()
04. M2的開源,新的無限可能性
國內(nèi)大模型生態(tài)過去常被詬病“封閉”,而MiniMax這次的開放態(tài)度,為工程師社區(qū)提供了一個可以真正動手改造和測試的基礎。
過去,很多國產(chǎn)模型選擇以「服務閉源 + API 調(diào)用」的方式提供訪問權限,而 MiniMax 這次直接開放了模型權重、部署文檔和二次開發(fā)接口,讓工程師第一次能以更低成本、更自由的方式觸及核心智能。
![]()
目前,MiniMax已在 GitHub 與 Hugging Face 上同步開放模型權重與本地部署指南。
開源協(xié)議采用寬松的 Apache 2.0 許可,這意味著開發(fā)者可以自由下載、修改、集成,甚至用于商業(yè)用途,也讓 M2 成為了少數(shù)真正能“落地”的國產(chǎn)通用模型之一。
更關鍵的是,MiniMax 并沒有只開放一個基礎模型,而是連同面向 Coding 與 Agent 場景優(yōu)化的版本一并開放。
![]()
據(jù)官方技術說明,M2 采用約 10B 激活參數(shù)、230B 總參數(shù)的架構,特別強化了工具調(diào)用、長任務規(guī)劃與程序生成能力。
對很多想要構建自主智能體或在內(nèi)部搭建私有大模型系統(tǒng)的開發(fā)團隊來說,這幾乎相當于拿到了一把能直接上手的鑰匙。
無論是二次開發(fā)、模型微調(diào),還是在企業(yè)內(nèi)部部署自定義Agent,可玩性都太高了!
04. 從Agent產(chǎn)品化,到全棧新生態(tài)
打造一個AI基礎設施生態(tài),正在成為國內(nèi)AI應用頭號玩家們的共識。
回看整個行業(yè),中國的AI模型們正經(jīng)歷從“追趕”到“分化”的階段。
過去的模型更像是在語言能力上對標國外,而現(xiàn)在的競爭焦點正在轉(zhuǎn)向“能不能在工程體系中落地”。
M2顯然抓住了這一點——它不追求花哨、娛樂化的對話表現(xiàn),而是直指工程師的真實需求。
![]()
這種“為使用者設計”的方向感,恰恰是國產(chǎn)模型真正需要的突破口。
更大的背景是,AI工程師紅利正在顯現(xiàn)。
過去依賴提示詞的門檻已經(jīng)越來越低,未來的競爭關鍵將是如何將模型嵌入產(chǎn)品,讓它真正參與執(zhí)行。
M2這樣的模型,正好處在這個時代拐點:既能編程、又能協(xié)作,既具工程思維、又可本地部署。
開發(fā)者、創(chuàng)意者們,終于有了一個“聰明的助手”,也擁有了一種新的工作模式——工程師與模型的協(xié)同開發(fā)。
而且這次發(fā)布,不搞套路,手機電腦上直接都能免費用~
![]()
兩類模式,一鍵切換:pro專業(yè)模式下有專業(yè)的agent能力,還有一種是lightning高效模式:高效極速版的agent。
![]()
在效果上,能以強大agentic能力,降維打擊普通chat模型。
如果說Claude象征著一種理性優(yōu)雅的推理范式,那么M2代表的是工程實用主義的崛起。
它讓智能不再是昂貴的研究資源,而成為每個團隊都能使用的工具。這種“智能平權”,是AI紅利真正落地的標志。
如今,越來越多的國產(chǎn)模型正在向這一方向靠攏,但MiniMax M2的出現(xiàn),無疑讓這個競爭格局更具現(xiàn)實意義。
它證明,國產(chǎn)模型不僅能做對話,更能做事;不僅能輸出答案,更能生成系統(tǒng)。對于AI工程師而言,這意味著一個新的時代正在到來——
一個模型不只是被問問題,而是能和你一起完成工作的時代。
最值得一提的是,目前MiniMax M2對外仍然免費開放。
![]()
這一下,很多海外科技大V也坐不住了。
不管APP安卓還是IOS版本,接入了最新M2的Agent和模型,全球限時免費14天,現(xiàn)在就可以用起來!
在一個模型調(diào)用還被視為成本負擔的行業(yè),M2的免費策略讓更多開發(fā)者有機會真正體驗、實驗和構建。
或許這正是國產(chǎn)模型真正能超越的路徑:不以炫技為目的,而以可用性和開放性贏得未來。
MiniMax創(chuàng)始人閆俊杰,之前在2025世界人工智能大會演講中就提到:“我們希望AI不再只是大公司的特權,而是每個開發(fā)者、每家中小企業(yè)都能觸及的智能基礎設施。”
![]()
憑借模型技術優(yōu)勢、生態(tài)整合能力、前沿的判斷和探索,MiniMax已經(jīng)不止擁有一流的AI模型和產(chǎn)品,更是擁有了“AI+千行百業(yè)“的核心新引擎。
從產(chǎn)品到產(chǎn)業(yè),從成為獨角獸,到賦能更多獨角獸,MiniMax的每一步,都踩在人工智能發(fā)展的關鍵脈絡上,并正在引領新的可能。
MiniMax-M2開源這一天,也許會被記作國產(chǎn)模型生態(tài)的一個轉(zhuǎn)折點——
從語言到行動,從對話到執(zhí)行,從封閉到開放。
MiniMax-M2的出現(xiàn),像是一次宣言:屬于AI工程和系統(tǒng)的紅利,正在中國被重新定義……
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.