![]()
在智譜率先宣布開源GLM-5后不到半天的時間里,MiniMax立馬跟進上線M2.5編程模型。
就在發布模型的當日,智譜股價開盤大漲,一度漲超25%,周內累計漲幅超過 77%,市值突破1700億港元。
MiniMax同日漲幅一度超過20%,總市值超過1800億港元。兩家公司的股價表現遠超大盤。
這種漲幅在港股AI板塊并不常見。
要知道,智譜在1月8日IPO時,發行價為116.2港元,當時的市值是518億港元。短短一個月時間,市值翻了三倍多。
此外,智譜和MiniMax選擇這個時間點發布,是有其現實考量。
2月12日正是企業和開發者春節前最后的工作窗口。
此時發布模型,既能趕在假期前完成技術社區的首輪傳播,又能讓開發者在春節長假期間有充足時間試用和討論。
此前我曾認為,春節窗口期可能是裹著AI外皮的紅包大戰,歸根結底,比的是紅包的數量和額度。但現在看來,我的推斷是錯的。
AI產業在春節期間,進入了一個“萬模齊發”的盛況。
從1月底開始,阿里的Qwen3-Max-Thinking、月之暗面的Kimi 2.5、階躍星辰的Step 3.5 Flash已接連發布。
隨后在2月8日,阿里千問團隊又向Hugging Face提交了Qwen 3.5的支持代碼,確認新模型即將到來。
字節跳動則計劃在2月14日推出豆包 2.0,并且新的豆包包含了Seedream 5.0和SeedDance 2.0的完整矩陣。
至于DeepSeek的V4版本,其是否會在春節期間發布仍存疑,但即便不發布新版本,市場也已經足夠熱鬧。
真正的戰場,在于模型能力本身,紅包退居其次。
花旗銀行曾在1月26日明確指出,2026年標志著AI助手從技術驗證邁向全民級應用的拐點,春節成為檢驗用戶習慣養成的關鍵窗口。
誰能在這個長假,用模型留住用戶,誰就能在接下來的一年里占據主動,就像2025年的DeepSeek一樣。
01
智譜和MiniMax兩大模型究竟怎樣?
GLM-5的核心定位,是面向復雜系統工程與長程agent任務。
如果說過去的AI編程工具只是幫你寫代碼,那GLM-5想做的,是幫你完成整個系統工程。
智譜將這一模式叫做“agent engineering”,并且表示,這是“vibe coding”的下一階段。
不過這個說法并非空穴來風,前OpenAI聯合創始人兼AI主管安德烈·卡爾帕西(Andrej Karpathy)在“vibe coding”實踐一周年時就曾表示過,開發者的角色正在從“寫代碼”轉向“編排AI agent”。
GLM-5某種程度上是對這一趨勢的回應。
幾周前,開源社區曾流傳一個名為“Pony Alpha”的神秘模型。它能進行長程交互、拆解復雜任務、在多輪對話中保持穩定上下文,一度引發廣泛猜測。
如今答案揭曉,Pony Alpha正是GLM-5的匿名測試版本。
GLM-5在技術規格上實現了顯著躍升。參數量從GLM-4.7的355B(激活 32B)擴展至744B(激活40B),預訓練數據從23T token增加到28.5T token。
更大的參數規模意味著更強的知識儲備和推理能力,但更關鍵的地方在于GLM-5的兩項創新。
第一項是名為“Slime”的異步強化學習框架。
這套系統支持模型從長程交互中持續學習,在處理需要數十步操作的工程任務時保持策略一致性。
傳統的AI編程工具往往在短對話中表現出色,但一旦任務鏈條拉長,模型就容易犯錯,前后邏輯出現斷裂。
Slime框架的設計初衷,就是讓模型在長周期任務中保持“記憶”和“目標感”。
第二項是集成了DeepSeek的稀疏注意力機制(DSA)。
這套機制能讓模型在保持長文本處理能力的同時,大幅降低部署成本。
DSA的機制其實很好理解,我舉個例子,當你讓AI分析一個包含數萬行代碼的項目時,它不需要對每一行代碼都投入同等的計算資源,而是能夠識別出哪些是關鍵邏輯、哪些是重復模板。
因此整個模型的運行效率就會提升,整體運行成本也會降低。
根據智譜給出的測試分數,GLM-5在SWE-bench-Verified和Terminal Bench 2.0中分別獲得77.8和56.2,是目前開源模型的最高分數。
![]()
著重介紹一下后者,Terminal Bench 2.0是測試模型在命令行環境中的操作能力,比如能否正確執行文件操作、調用工具、處理錯誤。
56.2的分數表明,GLM-5已經具備了相當程度的“動手能力”。
在agent能力上,GLM-5在 BrowseComp、MCP-Atlas 和τ2-Bench 等多個評測基準中取得開源 OTA表現。
特別值得關注的是Vending Bench 2測試。
這是最近比較火的基準。它的要求是模型在模擬環境中經營一家自動售貨機公司,周期為一年。
它要自己決定進貨、定價、庫存結構、現金流管理,在資源有限的情況下持續優化利潤。
GLM-5在這個測試中,最終賬戶余額達到4432美元,也就是說其具備一定的長期規劃和資源管理能力,至少比我強。
MiniMax的最新模型M2.5目前在模型界面已經可以選擇調用。
這是一個為agent場景原生設計的模型,MiniMax官方稱其對標的是 Claude Opus 4.6。
不過與智譜不同,MiniMax官方并未公布其論文或Hugging Face權重。
M2.5模型激活參數量為10B,在顯存占用和推理能效比上具有明顯優勢。
相比GLM-5的40B激活參數,M2.5走的是“小而美”的路線,用更少的參數實現更高的效率。
該模型支持PC、App、跨端應用的全棧編程開發,尤其適配Excel、深度研究(deep research)、PPT 等生產力場景。
從社區反饋來看,MiniMax M2.5在成本效益上保持了該企業一貫風格,便宜、實惠。
有開發者在外網論壇上分享,M2.5在處理日常編程任務時,速度比 Claude Sonnet 4.5快2倍,API成本卻只有后者的8%。
02
它們有何不同?
兩個模型都將編程能力作為核心競爭力,但技術路徑有所不同。
GLM-5通過更大的參數規模和更強的預訓練數據來實現能力提升,在處理大型代碼倉庫和復雜系統工程方面展現優勢。
它就像一個經驗豐富的架構師,見過足夠多的代碼模式、理解足夠深的系統邏輯,因此能夠在復雜場景中給出更全面的解決方案。
而MiniMax M2.5則通過更高效的架構設計,在推理速度和成本控制上更具優勢。
![]()
雖然經驗積累不如架構師豐富,但在常見任務上反應更快、執行更高效。
依我推測,GLM-5應該更適合專業程序員處理復雜的、長時的、系統級任務,比如一鍵克隆Web UI、構建仿真桌面,這些需要深度理解和長程規劃的工程項目。
MiniMax M2.5則更適合全棧開發、跨端應用等生產力場景中表現更好,特別適合那些需要快速迭代、頻繁調用的日常開發任務。
03
股價上漲并非模型
但我認為這輪上漲并非單純的新模型發布效應。
智譜除了發布模型以外,還宣布了產品的漲價,GLM Coding Plan價格上調30%以上。
智譜在價格調整函中明確表示,此次漲價源于“GLM Coding Plan市場需求持續強勁增長,用戶規模與調用量快速提升”。
為保障高負載下的穩定性與服務質量,智譜還同步加大算力與模型優化投入。
這個邏輯耐人尋味。
在AI大模型行業,大多數公司都在通過降價來搶占市場份額,DeepSeek就是如此,以極低的價格沖擊市場,各家紛紛跟進降價。
但智譜選擇了相反的策略,提升產品能力,然后漲價。
但用戶真的愿意為更強的能力付費嗎?
GLM-4.7發布后,其MaaS平臺的年度經常性收入(ARR)從2000萬元增至超5億元,10個月獲得25倍增幅。
這說明,在AI編程這個細分市場,專業用戶確實愿意為真正能提升生產力的工具買單。
不過,和智譜股價上漲一樣,MiniMax股價上漲的原因,也不全是來自于新模型的發布。
2月10日,MiniMax獲得了摩根大通的首次覆蓋,獲得“超配”評級和 700 港元目標價,并在當日引發股價一度上漲10.7%。
![]()
摩根大通明確指出,MiniMax 2025年前三季度海外收入占比高達 73.1%,遠超國內AI同行。
因此摩根大通將MiniMax描述為 “天生全球化”的AI企業,認為其全球化布局是核心競爭力。
國際市場中,OpenAI、Anthropic、谷歌的定價方案都遠遠高于MiniMax,這就導致后者的核心競爭力更強。
不僅如此,歐美市場對AI工具的接受度和付費能力,普遍高于國內市場。
MiniMax的這一優勢,在當前的國際環境下顯得尤為寶貴。
可以預見的是,2026年的春節,注定會成為中國AI發展史上的一個重要節點。
智譜和MiniMax的同時搶跑,雖然只是這個宏大敘事中的一個小小章節。
但它至少說明了一件事,國產大模型公司已經不執著于比參數和融資規模了,而是真的在琢磨怎么把技術變成開發者愿意掏錢的工具。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.