網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

開源模型榜首MiniMax-M2，新的「AI工程師」紅利要來了

2025-10-28 16:19:13　來源: AI異類

北京舉報

分享至

「AI工程師」正在重新定義生產(chǎn)關系。

最近有個感受：無論是寫代碼、調(diào)試Agent，還是部署一個內(nèi)部智能系統(tǒng)，模型的“理解力”和“執(zhí)行力”，比任何花拳繡腿的小功能都更重要。

而這一波紅利，正在從懂得調(diào)用模型的“提示詞工程師”，轉(zhuǎn)向能夠整合模型、讓其自動行動的“AI工程師”手中。

每一個普通人，都能借助更好的一站式AI模型，實現(xiàn)頭號玩家一般的生產(chǎn)力！

海外有Claude 4.5、GPT-5，那么誰是國內(nèi)大模型的「頭號AI工程師呢」？

10月27日，MiniMax發(fā)布了全新的M2模型，“專為 Agent 和代碼而生”。

刷到海外博主，標題就特別直接：比GLM 4.6還強，跟Claude 4.5/GPT-5一樣的能力，但是，免費！

Claude、GPT效果好雖好，價格也確實不低；現(xiàn)在，就輪到MiniMax M2來掀桌子了……

01. 多模態(tài)強者，文本也強

印象里，MiniMax是多模態(tài)能力很強的，各類全球榜單時常登頂。

多模態(tài)的優(yōu)勢，對于MiniMax來說不算新聞，畢竟早已經(jīng)把音頻/視頻/文本模型，分別做到了全球第一/第二/第五。

但這次，殺回編程和文本領域，直接正面迎上Claude、ChatGPT最強勢的核心腹地，沒點能耐，還真不敢這么對標。

在全球權威測評榜單Artificial Analysis (AA)中，MiniMax-M2(紅色)表現(xiàn)卓越，總分位列全球前五，在開源模型中排第一。

這個評測體系，覆蓋了模型在數(shù)學、科學與編碼等多個核心領域的能力。

尤其在數(shù)學、科學與編碼領域，M2的得分非常接近Claude 4.5與Gemini 2.5 Pro，在國產(chǎn)模型中顯著第一。

而且，在GPQA-Diamond、HLE、LiveCodeBench等關鍵指標上，M2表現(xiàn)極為穩(wěn)健。

但價格卻僅為Claude的8%，堪稱性價比之王。

簡單來說，就是 Claude的性能，ChatGPT的速度，國產(chǎn)模型的價格。

02. 效果案例測評，從Coding、Deep Search到Agent

用M2，第一印象是“干凈”。

界面延續(xù)了MiniMax一貫的極簡設計，模型響應速度明顯快于上一代M1，生成流暢，沒有Claude那種稍顯“沉穩(wěn)”的延遲感。

MiniMax在M2中強調(diào)了兩個關鍵詞——Code Native和Agent Native。

這就是說，它不是我一開始想象的，簡單在語言模型上疊加編程能力，是從底層架構上針對工程師使用場景進行了優(yōu)化。

模型在執(zhí)行多輪任務、代碼修正和工具調(diào)用上的能力被顯著提升。

用更直白的話說，M2在生成解釋性代碼的同時，也能推理出任務目標的意圖層，具備初步的“執(zhí)行理解”。

MiniMax M2還不單單是榜單上牛，開發(fā)者真實場景下的體驗也確實不錯。

傳統(tǒng)LLM寫代碼，邏輯通常停留在“輸出片段”層面，而M2的最大優(yōu)勢在于完整的端到端循環(huán)能力。它可以：

同時處理多個代碼文件；
自動執(zhí)行“編寫 → 運行 → 調(diào)試 → 修復”全過程；
通過單元測試驗證代碼正確性；
甚至能主動修改依賴和邏輯結構。

https://0vw4prtvqi3d.space.minimax.io/

嘗試做了一個能跟隨鼠標變化的表情包小游戲，效果很絲滑。

MiniMax M2做的AI會議紀要產(chǎn)品的動態(tài)官網(wǎng)，審美不錯，小細節(jié)也很到位，功能交互上完成度比較好。

生成的AI中國象棋對戰(zhàn)游戲，我真的能和AI玩上一整天。

Deep Search和Agentic能力也是MiniMax的傳統(tǒng)技能，在M2上有了更極致的發(fā)揮。

用Deep Search提了一個很具象的要求：選取近90天微博/小紅書/抖音/B站關于Sora的爆款帖（互動量前20），去重后統(tǒng)計主題分布。

結果就是數(shù)據(jù)準確度和全面性都很高。

測評統(tǒng)計來看，MiniMax M2接近GPT-5的能力，優(yōu)于Claude-4.5、DeepSeek V3.2等。

Agentic能力上，MiniMax-M2能夠出色地規(guī)劃并執(zhí)行復雜的工具鏈，協(xié)同調(diào)用 Shell、瀏覽器、Python代碼執(zhí)行器和各種MCP工具。

在 BrowseComp 評測中，它不僅可以挖掘到難以查找的信息源，還能保持信息來源的可追溯性，并具備自我糾錯與恢復的能力。

調(diào)用MCP，執(zhí)行復雜Pipeline，很多后段的任務也能真正落地了。

就像視頻里演示的，開發(fā)一個基于 Markdown 的blog網(wǎng)站，同樣的指令下，反而是Claude出現(xiàn)的負向反饋更多。

03. 性價比王者：又好又快還便宜

說回來模型本身，端到端的代碼能力，已經(jīng)很顯著了。

而一個能做到Claude 4.5相當水準、但只需8%價格的模型，本身就改變了工程師生態(tài)的底層成本。

以智能能力和價格作為象限的兩個坐標軸，右上角是兩者兼?zhèn)涞膮^(qū)間，MiniMax M2處在優(yōu)勢位置。

之前，像我們團隊在內(nèi)部做Agent實驗時，最擔心的是模型調(diào)用費用高昂，尤其是涉及多輪邏輯任務時，Claude或GPT成本確實不低。

而M2的開放策略，幾乎讓這種顧慮消失了。甚至近期還能免費！！

如果一個模型既能編程、又能推理、擅長多模態(tài)，還能在團隊部署中以更低價格持續(xù)運行，那么創(chuàng)業(yè)團隊也就能負擔得起AI研發(fā)，一個模型就能全棧全鏈路解決問題了。

速度的提升也值得單獨提一下。

M2在響應復雜任務時的延遲比上一代明顯縮短，特別是在代碼生成場景中，它幾乎可以與Claude并行對話。

眼下100 TPS的速度已經(jīng)很流暢了，而且還在持續(xù)提速。

更有意思的是，它沒有為了追求速度犧牲穩(wěn)定性。在長輸入、復雜語義和多任務調(diào)用下，它依然保持一致的上下文連貫性。

對工程師而言，這種“穩(wěn)定快”意味著工作節(jié)奏可以更自然地與模型融合，而不是等待一個遲鈍的響應。

04. M2的開源，新的無限可能性

國內(nèi)大模型生態(tài)過去常被詬病“封閉”，而MiniMax這次的開放態(tài)度，為工程師社區(qū)提供了一個可以真正動手改造和測試的基礎。

過去，很多國產(chǎn)模型選擇以「服務閉源 + API 調(diào)用」的方式提供訪問權限，而 MiniMax 這次直接開放了模型權重、部署文檔和二次開發(fā)接口，讓工程師第一次能以更低成本、更自由的方式觸及核心智能。

目前，MiniMax已在 GitHub 與 Hugging Face 上同步開放模型權重與本地部署指南。

開源協(xié)議采用寬松的 Apache 2.0 許可，這意味著開發(fā)者可以自由下載、修改、集成，甚至用于商業(yè)用途，也讓 M2 成為了少數(shù)真正能“落地”的國產(chǎn)通用模型之一。

更關鍵的是，MiniMax 并沒有只開放一個基礎模型，而是連同面向 Coding 與 Agent 場景優(yōu)化的版本一并開放。

據(jù)官方技術說明，M2 采用約 10B 激活參數(shù)、230B 總參數(shù)的架構，特別強化了工具調(diào)用、長任務規(guī)劃與程序生成能力。

對很多想要構建自主智能體或在內(nèi)部搭建私有大模型系統(tǒng)的開發(fā)團隊來說，這幾乎相當于拿到了一把能直接上手的鑰匙。

無論是二次開發(fā)、模型微調(diào)，還是在企業(yè)內(nèi)部部署自定義Agent，可玩性都太高了！

04. 從Agent產(chǎn)品化，到全棧新生態(tài)

打造一個AI基礎設施生態(tài)，正在成為國內(nèi)AI應用頭號玩家們的共識。

回看整個行業(yè)，中國的AI模型們正經(jīng)歷從“追趕”到“分化”的階段。

過去的模型更像是在語言能力上對標國外，而現(xiàn)在的競爭焦點正在轉(zhuǎn)向“能不能在工程體系中落地”。

M2顯然抓住了這一點——它不追求花哨、娛樂化的對話表現(xiàn)，而是直指工程師的真實需求。

這種“為使用者設計”的方向感，恰恰是國產(chǎn)模型真正需要的突破口。

更大的背景是，AI工程師紅利正在顯現(xiàn)。

過去依賴提示詞的門檻已經(jīng)越來越低，未來的競爭關鍵將是如何將模型嵌入產(chǎn)品，讓它真正參與執(zhí)行。

M2這樣的模型，正好處在這個時代拐點：既能編程、又能協(xié)作，既具工程思維、又可本地部署。

開發(fā)者、創(chuàng)意者們，終于有了一個“聰明的助手”，也擁有了一種新的工作模式——工程師與模型的協(xié)同開發(fā)。

而且這次發(fā)布，不搞套路，手機電腦上直接都能免費用～

兩類模式，一鍵切換：pro專業(yè)模式下有專業(yè)的agent能力，還有一種是lightning高效模式：高效極速版的agent。

在效果上，能以強大agentic能力，降維打擊普通chat模型。

如果說Claude象征著一種理性優(yōu)雅的推理范式，那么M2代表的是工程實用主義的崛起。

它讓智能不再是昂貴的研究資源，而成為每個團隊都能使用的工具。這種“智能平權”，是AI紅利真正落地的標志。

如今，越來越多的國產(chǎn)模型正在向這一方向靠攏，但MiniMax M2的出現(xiàn)，無疑讓這個競爭格局更具現(xiàn)實意義。

它證明，國產(chǎn)模型不僅能做對話，更能做事；不僅能輸出答案，更能生成系統(tǒng)。對于AI工程師而言，這意味著一個新的時代正在到來——

一個模型不只是被問問題，而是能和你一起完成工作的時代。

最值得一提的是，目前MiniMax M2對外仍然免費開放。

這一下，很多海外科技大V也坐不住了。

不管APP安卓還是IOS版本，接入了最新M2的Agent和模型，全球限時免費14天，現(xiàn)在就可以用起來！

在一個模型調(diào)用還被視為成本負擔的行業(yè)，M2的免費策略讓更多開發(fā)者有機會真正體驗、實驗和構建。

或許這正是國產(chǎn)模型真正能超越的路徑：不以炫技為目的，而以可用性和開放性贏得未來。

MiniMax創(chuàng)始人閆俊杰，之前在2025世界人工智能大會演講中就提到：“我們希望AI不再只是大公司的特權，而是每個開發(fā)者、每家中小企業(yè)都能觸及的智能基礎設施。”

憑借模型技術優(yōu)勢、生態(tài)整合能力、前沿的判斷和探索，MiniMax已經(jīng)不止擁有一流的AI模型和產(chǎn)品，更是擁有了“AI+千行百業(yè)“的核心新引擎。

從產(chǎn)品到產(chǎn)業(yè)，從成為獨角獸，到賦能更多獨角獸，MiniMax的每一步，都踩在人工智能發(fā)展的關鍵脈絡上，并正在引領新的可能。

MiniMax-M2開源這一天，也許會被記作國產(chǎn)模型生態(tài)的一個轉(zhuǎn)折點——

從語言到行動，從對話到執(zhí)行，從封閉到開放。

MiniMax-M2的出現(xiàn)，像是一次宣言：屬于AI工程和系統(tǒng)的紅利，正在中國被重新定義……

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

面壁智能開源全模態(tài)模型MiniCPM-o4.5，邊看邊聽還能主動搶答

量子位 2026-02-05 23:20:12
0 跟貼 0
AI研發(fā)AI--世界上最重要也最危險的技術，也是眾多AI巨頭的目標

華爾街見聞官方 2026-02-05 16:19:12
11 跟貼 11

論文配圖一鍵封神！北大谷歌開源PaperBanana，5個Agent全包了

新智元 2026-02-05 17:24:39
3 跟貼 3

國產(chǎn)AI路由系統(tǒng)開源逆襲！僅用19%成本達到Gemini-2.5-Pro同性能

量子位 2025-08-20 15:41:20
0 跟貼 0
陳天橋鄧亞峰聯(lián)手破解大模型記憶難題！4個月打造SOTA系統(tǒng)

量子位 2026-02-05 22:38:39
0 跟貼 0

ICLR 2026 Workshop二輪征稿：聚焦終身智能體的學習、對齊、演化

機器之心Pro 2026-02-05 16:35:52
0 跟貼 0

大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
OpenClaw、Cowork引爆AI代理革命，桌面Agent入口之爭悄然升溫，每經(jīng)記者實測Cowork國產(chǎn)版

每日經(jīng)濟新聞 2026-02-05 17:03:03
4 跟貼 4

SOLO Coder 在現(xiàn)有項目基礎上繼續(xù)完善功能、修復問題

機器之心Pro 2025-11-13 14:18:40
0 跟貼 0
三維空間太難懂？2

機器之心Pro 2025-12-31 13:49:19
0 跟貼 0
陳天橋聯(lián)手鄧亞峰，為AI裝上“不失憶大腦”，8萬美元大賽引爆生態(tài)

鈦媒體APP 2026-02-05 17:02:47
0 跟貼 0
互聯(lián)網(wǎng)大廠布局漫劇野心：3倍速出片，3個人干50人的活

鈦媒體APP 2026-02-05 19:41:08
0 跟貼 0
AI熱潮帶飛馬桶廠？不起眼的日企，控制了芯片命脈

英國那些事兒 2026-02-05 23:24:14
0 跟貼 0
Moltbot作者被Claude刁難后：MiniMax M2.1是最優(yōu)秀的開源模型

量子位 2026-01-29 13:17:17
21 跟貼 21
港大開源極致輕量OpenClaw, 1%代碼量打造個人專屬賈維斯

機器之心Pro 2026-02-05 14:40:31
3 跟貼 3
聯(lián)合國教科文組織啟動了溯源核查程序，沒有證據(jù)，直接取消！

包子同學呀 2026-02-05 11:28:00
0 跟貼 0
25歲進醫(yī)院、3個月胖15公斤：“80%程序員都經(jīng)歷過的「職業(yè)倦怠」，讓我徹底清醒了”

CSDN 2026-02-04 14:41:37
4 跟貼 4
小姑子強勢霸占嫂子房子，我哥的就是我的，奇葩邏輯讓人憤怒

熊樣動漫 2026-02-04 05:09:10
0 跟貼 0
清華系創(chuàng)企，拿下國內(nèi)視頻生成領域最大單筆融資！

智東西 2026-02-05 16:20:07
0 跟貼 0
男孩問小姨該怎么稱呼她的老公，小姨不語，只是一味地笑，網(wǎng)友：別說，他的邏輯好像沒錯

城市大眼睛 2026-02-05 15:15:00
0 跟貼 0
8歲父母雙亡因"一道光"男子成7家飯店老板年銷400萬

極目新聞 2026-02-05 10:42:35
562 跟貼 562
兩個「最強AI」塞進Xcode！蘋果這波殺瘋了

新智元 2026-02-04 19:46:07
10 跟貼 10
馬斯克個人財富突破8000億美元 4個月內(nèi)4次刷新個人財富紀錄

財聯(lián)社 2026-02-05 15:52:02
578 跟貼 578
網(wǎng)民建議將距仙桃城區(qū)更近的天門南站更名，官方回應：車站命名符合規(guī)定

澎湃新聞 2026-02-05 19:13:13
15 跟貼 15
“罵死王朗”神場面：看似潑婦罵街，實為諸葛亮邏輯嚴密

老劉聊歷史 2026-02-01 18:00:00
1 跟貼 1
一個人逆襲頂多需要四個月

記憶承載 2026-02-05 11:26:02
19 跟貼 19
“阿嬤手作”55元一碗螺螄粉被吐槽貴店員：最近風評不佳，但售價高是有原因的

封面新聞 2026-02-03 22:36:18
522 跟貼 522
印奇“大于”50億

鈦媒體APP 2026-02-05 17:02:52
0 跟貼 0
3.5億！AI創(chuàng)企獲種子輪融資，打造會進化的智能機器

智東西 2026-02-05 18:58:22
0 跟貼 0
哈爾濱冰雪大世界部分冰雕熱到滴水，一周后當?shù)剡€將升溫超10℃，工作人員：不會再補冰，閉園時間待定

極目新聞 2026-02-05 17:56:17
6 跟貼 6
嚴肅版AI編程助手 GitHub星標3k+

量子位 2025-12-08 15:29:06
0 跟貼 0
Claude Code之父，推特親傳使用技巧，超 500 萬人關注

機器之心Pro 2026-01-05 13:26:18
0 跟貼 0
開源AI編程工具CoStrict，GitHub星標3K+

量子位 2025-12-09 01:52:08
0 跟貼 0
開源鴻蒙重寫世界，從一行微小的代碼開始

量子位 2025-12-31 01:50:02
0 跟貼 0
中考對孩子壓力巨大，分流意義已越來越小，可以為取消中考做好政策儲備

縱相新聞 2026-02-05 17:25:02
262 跟貼 262
購房邏輯，需求排序，看房之前想清楚

老薛的直播日常 2026-02-05 13:38:14
0 跟貼 0
他一句話，80% App 將消失：OpenClaw之父親手拆掉“復雜AI編程神話”

新智元 2026-02-03 19:11:33
0 跟貼 0
我提前約好了領回家的AI搭子

AI異類 2026-02-05 19:06:06
0 跟貼 0
海天轉(zhuǎn)債今日申購

每日經(jīng)濟新聞 2026-02-05 08:55:04
0 跟貼 0
國乒12人全員開門紅今天將上演6場“中日對決”

央視新聞客戶端 2026-02-05 09:27:09
111 跟貼 111

AI異類

從硅谷到中關村，AI信息與測評

108文章數(shù) 5關注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

時尚

親子

家居

藝術

房產(chǎn)

手機 / 數(shù)碼

房產(chǎn) / 家居

開源模型榜首MiniMax-M2，新的「AI工程師」紅利要來了

美團買下叮咚買菜，防御還是進擊？

上海男子剛退休就癱瘓 小23歲女友照護崩潰：無名無分

上海男子剛退休就癱瘓 小23歲女友照護崩潰：無名無分

奇才：我學生……獨行俠：成交！

微博之夜卷入座位風波！楊冪超話淪陷

中美"只會有好消息" 經(jīng)濟冷暖看房價

李想為全新L9預熱 all in AI造更好的車

態(tài)度原創(chuàng)

她隨手打賞就是6兩黃金：人美，心善，錢多！

從來沒吃過飯的寶寶第一次見大席

簡雅序章 自然且閑適

成都綠地468新動向，班組進場，打破再次停工謠言！

新春三亞置業(yè)，看過這個熱盤再說！

上海男子剛退休就癱瘓小23歲女友照護崩潰：無名無分

上海男子剛退休就癱瘓小23歲女友照護崩潰：無名無分

簡雅序章自然且閑適