![]()
作者 | 木子
閆俊杰在商湯敲鐘前夕離開,創立了 MiniMax(上海希宇科技),也造就了全球從創立到 IPO 用時最短的 AI 企業——4 年,進程明顯快于行業常態。
就在剛剛,1 月 9 日,MiniMax緊隨其后掛牌上市,股票代碼 00100。招股書顯示,MiniMax 的ToC 收入已經反超 ToB,這在中國大模型公司中極為罕見。
其招股書還透露了一堆硬核數據,截至 2025 年 9 月 30 日:
累計個人用戶:超過2 億
覆蓋200+ 國家和地區
AI 原生產品 MAU:約2760 萬
企業與開發者客戶:超過10 萬家
在這次 IPO 中,Mini Max 計劃發行約 2540 萬股 H 股,開盤價 235.4 港元,截至上午 10:30,股價已飆升超 60%,市值超 820 億港元(約合人民幣 738 億元)。
![]()
據富途證券數據,MiniMax 此次 IPO 超級火爆,公開發售部分的超額認購倍數高達 1209 倍,投資者通過保證金方式認購的金額累計超過 2533 億港元。
資本市場為 MiniMax 的技術野心“買單”
在國內近年來涌現的一批 AI 獨角獸中,唯二高頻更新技術論文、投資開發者生態的,是 MiniMax 和 DeepSeek 背后的深度求索。
閆俊杰曾在各種場合明確表達: MiniMax 是一家技術驅動的公司。據招股書顯示,MiniMax 最大的成本就是研發成本,為了在基礎模型技術上集中注意力,海外版 App 甚至沒有第一時間做英文化。投資人的評價大體也能回歸到技術要素,即閆俊杰是一個真正對 AGI 有信仰的人,“他很真”。
這是除市場數據外,MiniMax 市值最明確的支點。
僅在 2025 年,MiniMax 已通過至少兩篇公開科研論文系統闡述其大模型架構與推理優化方案,其核心成果包括 MiniMax-01,即基于 Lightning Attention 與 MoE 的超長上下文大模型;以及 MiniMax-M1,即針對推理計算效率進一步優化的模型版本。
相關論文不僅披露了核心機制,還在處理百萬級 token 上下文和推理效率上提出可復現技術路徑,而非簡單參數展示。
回到 2024 年初,在稠密模型仍占主流的背景下,MiniMax 率先推出了中國首個混合專家系統(MoE)大模型 abab6——比 DeepSeek 火出圈 R1 早了約一整年。
在行業仍普遍依賴 Softmax Attention、并為其二次計算復雜度付出高昂算力成本時,MiniMax 開始在模型中大量引入自研的Lightning Attention(線性注意力)。
具體做法,簡單來說就是在每 8 層模型結構中,只保留 1 層傳統注意力,其余 7 層改用線性注意力,從而把長上下文推理的計算壓力“削薄”。
改動后的直接效果是:模型在面對超長文本、長代碼或多輪復雜推理時,不再隨著上下文變長而指數級變慢。
這套注意力設計與 MoE 架構疊加后,進一步放大了效率優勢,使模型在保持推理能力的前提下,大幅提升了長文本、長代碼和復雜任務場景下的計算效率。
相比智譜以 GLM 系列基座模型為核心,在 ToB 與 ToG 側已跑出較為穩健盈利能力的路徑;MiniMax 展現出的是另一種取向:模型更強調產業化落地,已在 ToC 端取得了不錯的成果。
圍繞自研大模型,MiniMax 已形成包括MiniMax Agent、海螺 AI、MiniMax 語音、星野以及開放平臺在內的產品矩陣。
同時在海外市場亦已有實質進展:其產品和服務已覆蓋 200 多個國家和地區,累計觸達超過 2.12 億名個人用戶,并服務超過 13 萬家海外企業與開發者(包括訂閱、API 調用等渠道)。
按 2024 年基于模型的收入計算,MiniMax 是全球第四大 pure-play 大模型技術公司,還是全球第十大大模型公司,覆蓋文本、視覺、音頻、視頻的全模態模型體系。
在上市前的近一年內,MiniMax 完成了從MoE 架構探索(abab 6 / 6.5)到基礎大模型開源(MiniMax-01),再到高級推理模型(MiniMax-M1)的連續迭代。
以 MiniMax-01 系列為例,模型總參數規模已達數千億量級,但單個 token 實際參與計算的參數僅為幾十億,使得模型可以在控制成本的前提下,原生支持百萬級乃至更長的上下文窗口。
在 2025 年 12 月 23 日,MiniMax 還對外發布了最新旗艦級 Coding & Agent 模型 M2.1。
在衡量多語言軟件工程能力的 Multi-SWE-bench 測試中,該模型在僅約 10B 激活參數的前提下取得 49.4% 的成績,超越了 Claude Sonnet 4.5 等國際頂尖競品,拿下全球 SOTA。
![]()
M2.1 要補上的,是此前不少模型在工程能力上的短板——過去的模型在編寫簡單腳本或前端代碼時尚可應付,但一旦進入后端工程、系統架構或底層邏輯層面,表現往往迅速失穩。
這個模型的關鍵變化在于,其能力邊界首次延伸至更完整的后端開發規范。
這些技術實現背后,是一支極其年輕的團隊。據每日經濟新聞消息,截至 2025 年 9 月底,MiniMax 員工 385 人,平均年齡 29 歲,研發人員占比近 74%,董事會平均年齡 32 歲。
其核心團隊由一批來自商湯科技、全球一流高校和頂級科研機構的技術骨干組成,以創始人閆俊杰為首,包括楊斌、周彧聰等聯合創始人。
閆俊杰擁有東南大學、本科到中科院自動化所博士及清華博士后背景,曾擔任商湯副總裁與研究院副院長。
![]()
楊斌具備加拿大博士及 Uber ATG 與國際初創工程經驗;周彧聰則是商湯早期算法團隊核心成員。
團隊多數來自 AI 與深度學習前沿領域,在 NLP、語音、視覺、生成模型等方向擁有豐富經驗和多項全球發明專利。
站在年輕團隊另一面的,是 AI 投資界的“老炮”們。
早期有阿里、騰訊、紅杉中國、高瓴、IDG、云啟、米哈游等產業與風投參與;IPO 前夕,阿布扎比投資局、Mirae Asset、Aspex、易方達等長線機構接力。
尤其是阿里,持有的 MiniMax 股權占比還要大于在智譜的比重。連續兩場 IPO 后,一場投資界和 AI 創業團隊之間的化學反應和默契已經誕生。
上市之后,還需直面 Claude Codex 等問題
需要指出的是,由商湯的 ToB/ToG 模式,轉到如今的 ToC/ToB 模式,閆俊杰麾下的 MiniMax 還未實現整理盈利;至少想贏得全球 AICoding 市場,繞不開和 Claude Codex 的直接競爭。
Claude Codex 是一個面向真實軟件工程的 Coding / Agent 模型,由 Anthropic 公司推出。該模型的重點是在 AI 生成代碼以外,確保模型在工程約束下不失控,堪稱 AICoding 神器。近日, Anthropic 宣布,Claude Code 上線僅 6 個月,已經創造了近 10 億美元年化營收。
從公開信息看,MiniMax 并沒有試圖直接復刻 Claude Codex 的路徑,而是選擇了另一種更偏效率驅動的技術路線。
MiniMax 在Lightning Attention + MoE上的投入,本質上是在解決一個問題:如何在成本可控的前提下,把上下文和工程復雜度拉到“真實軟件世界”的尺度。
對于 Coding 模型來說,長上下文不是加分項,而是入場券。 沒有足夠高效的注意力結構,就無法在真實代碼庫上長期運行 Agent。
M2.1 針對 Multi-SWE-bench 的表現,某種程度上正是在回應 Claude Codex 的“主戰場”——不是寫某一段代碼,而是完成跨語言、跨模塊、帶驗證的軟件工程任務。
這意味著 MiniMax 正在補的,并不是單點能力,而是:后端規范、工程一致性,和多語言協作能力,這正是 Claude Codex 最難被替代的部分。
MiniMax 若想在全球市場正面競爭,最終比拼的也不會只是 Benchmark,而是 Agent 是否可控、錯誤是否可解釋,以及是否敢被放進 CI / CD 流程。
從招股書來看,MiniMax 的研發投入在過去三年中持續攀升:
2022 年為 1060 萬美元,2023 年增至 7000 萬美元,2024 年進一步擴大至 1.89 億美元;截至 2024 年及 2025 年 9 月 30 日止的九個月,研發開支分別達到 1.387 億美元和 1.803 億美元。相關投入主要用于模型訓練過程中產生的云服務費用。
另外,在頭部云廠商和海外獨角獸的夾擊之下,MiniMax 同時承受著 ToB 與 ToC 兩個市場的競爭壓力。
模型技術仍在快速演進,這場拼性能、拼效率、拼工程化的技術馬拉松還在繼續;上市,只是把比賽帶入了下一個賽段。
在一次采訪中,閆俊杰提到,MiniMax 確實放棄過一些 ToB 訂單,是基于對自身交付能力的判斷,避免分散注意力。那么,如果 ToB 領域的工程化交付,當下還不是 MiniMax 的“長板”,短期來看,就只剩“技術登頂”一條路能幫 MiniMax 走到終局。
閆俊杰說他在 Dota2 游戲里愛玩小精靈,因為這個英雄實現過從五號位(輔助)轉型成為一號位(核心),最終主宰比賽。
目前看來,對于 MiniMax 而言情況類似,能否在 Benchmark 上五轉一,保持模型能力長期領先,是上市后走向 AGI 的關鍵。
https://www1.hkexnews.hk/listedco/listconews/sehk/2025/1231/2025123100026\_c.pdf
https://huggingface.co/MiniMaxAI/MiniMax-M2.1?utm\_source
聲明:本文為 AI 前線整理,不代表平臺觀點,未經許可禁止轉載。
技術人的年度儀式感! 年度盤點與趨勢洞察 啟動!
《2025 年度盤點與趨勢洞察》由 InfoQ 技術編輯組策劃。覆蓋大模型、Agent、具身智能、AI Native 開發范式、AI 工具鏈與開發、AI+ 傳統行業等方向,通過長期跟蹤、與業內專家深度訪談等方式,對重點領域進行關鍵技術進展、核心事件和產業趨勢的洞察盤點。
力求以體系化視角幫助讀者理解年度技術演化的底層邏輯、創新方向與落地價值,并為新一年決策提供參考。內容將在 InfoQ 媒體矩陣陸續放出,歡迎大家持續關注。
今日薦文
你也「在看」嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.