![]()
截至昨天下午,OpenClaw僅用一百天,已經超越所有GitHub開源軟件項目的星標數,成為史上最受歡迎開源項目。
這一世界頂流項目,意外成為中國模型廠商對外敘事的加速器。剛過去不久的春節,被視為資本預期的集中表達窗口,疊加模型廠商的競賽,Kimi估值從40多億美金上漲到百億美元,近20天累計收入已超過2025年全年總收入。
MiniMax和智譜市值也飆升到3000多億港幣,不過截止目前,MiniMax市值已回落到2500多億港元。
昨天MiniMax發布年報稱,2025年中國內地收入2138萬美元,占比27.0%,海外收入5766萬美元,占比73.0%。MiniMax2月ARR也已突破1.5億美元。
值得關注的是,除了原有C端產品收入外,體現B端收入的開放平臺及其他企業服務收入達到近2600萬美元,占比接近三分之一,增速最快。這被視為MinMax有了更穩定的收入結構。
MinMax創始人閆俊杰是個追求極致效率的人,其中包括模型迭代效率,token消耗效率,甚至還體現在他僅用四年就帶領MiniMax成功上市。外界通常認為他是一位純粹的技術人員,實際上他的商業嗅覺也異常靈敏。
閆俊杰依靠token經濟學,在過去追求智能上限的全方位敘事中,分化出一條自己的道路。他也因此提出了一個新問題,優先成本考慮的技術路線,在追求智能上限的道路上是否是一個更優的選擇。
至少2026年春節,模型廠商的集體沖榜,已經給出了某些信號。
01
模型免費策略沖榜
今年1月初,MiniMax為了推廣新模型M2.1,找到許多開發者推廣,最知名的一位是OpenClaw創始人Peter。早在Peter的龍蝦項目尚未火爆前,MiniMax就曾邀約Peter免費體驗M2.1模型,自此建立連接。
Peter感慨于MiniMax M2.1的低價,多次發布X帖子推薦使用M2.1模型,還在和網友互動中大力推薦MiniMax。“Claude opus是王者,MiniMax是個不錯的備選。”Peter也有推薦Kimi K2.5和智譜的GLM5,不過提及頻率沒有MiniMax高。
這或許有個人偏好,也可能因為MiniMax 的工作人員和Peter互動更頻繁。這種細致的經營策略,確實讓MiniMax迅速在開發者出圈。
一位國內大廠技術人員告訴我們,他在部署龍蝦項目時,就是因為看到Peter的推薦,所以充值了50刀MiniMax M2.1,M2.5發布后還購買了10刀/月的Coding Plan。
優惠力度也是一個重要策略。2月1日MiniMax宣布,直接為龍蝦用戶推出了7天免費方案。12天后,為了給M2.5新模型預熱,MiniMax還聯合AI編程工具Kilocode,推出一周免費試用體驗。
![]()
OpeRouter數據顯示,經過一周的免費方案后,MiniMax M2.5在龍蝦上的調用量直線上升。從2月23日開始,原本排名第一的Kimi K2.5每日調用量有所下滑,M2.5反超K2.5,成為每天調用量最大的模型。
實際上,MiniMax的模型調用定價確實非常便宜。根據OpenRouter3月2日的數據,MiniMax M2.5的有效定價輸入0.120美元/百萬token,輸出價格是1.37美元/百萬token。而Kimi K2.5的有效定價輸入0.232美元/百萬token,輸出價格是2.77美元/百萬token,智譜的GLM5輸入價格是0.669美元/百萬token,輸出價格是3.16美元/百萬token。
對開發者而言,使用國產模型意味著量大管飽,成本幾乎是海外頂級模型Claude Opus 4.6的1/20。
![]()
當然,MiniMax M2.5定價便宜,是因為它的參數量相比Kimi、智譜要小得多。通常而言,參數量越小模型的聰明程度相對越低,消耗的算力成本也更低。
不過短期來看,MiniMax 的策略取得不錯的效果。OpenRouter數據顯示,2月token調用量總排名中,M2.5以5.64T tokens的數據排名第一。
沖榜OpenRouter 獲得較高的排名,與其說是模型能力的勝利,不如說是一種商業策略的成功。
一位創業者告訴我們,OpenRouter并不能代表AI調用量的整體情況,因為它只是一個中轉平臺。大部分請求還是直接使用官方接口。他根據Claude模型營收和token單價的方式去估算,OpenRouter的流量只占Claude模型總流量的5%。
國產模型廠商集體沖榜OpenRouter,是因為這是唯一公開排行數據的中轉平臺,沖榜背后看中的更是開發者生態以及商業收入敘事。它會擴大開發者使用口碑,迅速在海外出圈。
這一點對MiniMax尤為重要。當MiniMax的市值沖上3000億甚至更高時,它需要證明自己的造血能力,打消外界對其PS高達數百倍的質疑。
02
極度精明和務實
盡管閆俊杰一再強調,MiniMax是一家技術驅動的公司,他也被塑造成AGI信徒,事實上MiniMax底層邏輯依然更偏重商業化考量。
這或許和閆俊杰早年在商湯工作的經歷有關,商湯成立7年才上市,長期高投入低盈利。MiniMax僅用4年就迅速上市,試圖用二級市場資金反哺研發,避免走商湯式“長期燒錢、盈利滯后”的老路。
根據公開資料梳理,閆俊杰在模型發展路徑上的核心理念與追求AGI的廠商存在顯著差異。他更早地將戰略重心從單純追求模型“更聰明”,轉向聚焦可量化的“效果”產出。而效果直接與商業化收入掛鉤。
對閆俊杰來說,追求token效率已經大于追求智能上限。
2025年1月,MiniMax發布文本模型MiniMax-Text-01,押注長上下文,自稱開啟Agent時代。該模型放棄業界普遍使用的Transformer架構,改用線性注意力結構。這個新架構相當于簡化計算過程,當文本非常長所需算力更小,但在捕捉復雜依賴關系上不如非線性注意力機制。
MiniMax-Text-01模型只強調Agent能力,代碼能力不足。從投入產出策略上看,代碼能力賽道強者如云,對算法要求也更高,Benchmark排名極易形成壓制敘事。一直到9個月后M2模型公布時,MiniMax方補齊代碼能力。
閆俊杰對成本效率的極致追求,也體現在后來發布的M2模型上。閆俊杰曾提出“不可能三角”理論,高度評價M2是“大巧若拙”。
“海外最好的模型可以有不錯的效果,但是價格非常貴且推理速度比較慢;國內的模型價格也相對便宜,但是效果和推理速度有差距。”閆俊杰稱,能不能有一款模型能在效果、價格和速度上能取得比較好的平衡,從而讓更多的人能受益于Agent時代的智能提升,M2正是不可能三角平衡下的產物。
后續M2模型的更新迭代中,MiniMax沒有追求高參數,而是繼續選擇在算力優化下的性能提升。2025年1月發布的MiniMax-01是4000億參數,而一年后發布M2.5總參數量只有2300億,相當于同時期發布的Kimi K2.5(1萬億)的1/5,智譜GLM5的1/3。
即使在智能體能力上,MiniMax M2.5的技術路線和Kimi K2.5也不同。Kimi K2.5除了編碼能力和視覺理解能力升級外,最大的不同是首次引入“Agent集群”能力,也就是根據任務需求,現場可以調度多達100個分身,并行處理1500個步驟。這也讓Kimi K2.5在處理復雜任務時,具備更快的速度和效率。
MiniMax的M2.5同樣強調深度搜索能力和token消耗的效率,在這方面,它公布的路徑不同于Kimi K2.5,而是強調用更精準的搜索輪次,降低無效搜索,優化真實效果。
很明顯,一個用并行算力換取任務完成率和速度,用規模解決復雜性,另一個是通過路徑優化降低復雜性。這是2025年模型行業產生的巨大分化。
閆俊杰的商業感覺再次得到證明。一位MiniMax內部人告訴我們:“M2.5只是M2大版本里迭代出的小版本,OpenClaw智能體爆發,帶來市場對token的需求激增,市場也急需要一個能夠滿足需求、而token消耗小的模型。所以迅速推出M2.5。”
閆俊杰迅速給M2.5定義,稱其為第一個能支持agent無限運行、沒有成本負擔的模型。
這也意味著MiniMax的敘事主線,依然是押注token效率,而不是智能上限。這個token效率,最終反映到MiniMax2025年的年報里,成了漂亮的數字。MiniMax用428名員工,花了2.5億美金訓練支出,創造了8000萬美元收入。
03
潛在的代價
MiniMax追求技術效率的路線,相比以往,也不是完全沒有潛在的代價。
在當前技術范式下,參數規模更大的模型,仍然具備更高的知識容量,也具備更復雜的推理潛力和更強的跨任務泛化能力。一旦頭部萬億級模型形成代際差距,MiniMax 的效率優勢可能會被斷層碾壓。
不少業內人士認為,模型性能效果上,仍然存在一分價錢一分貨的鐵律。大就是好,參數越大就會越聰明。
多位部署OpenClaw的技術人員告訴我們,體驗完更便宜的M2.5模型,發現它推理表現不錯,但在代碼能力上容易出問題,復雜任務的成功率也不高。
我們獲悉,2026年MiniMax仍會重點發力多模態,M3模型將會加速多模態融合,具備視覺理解能力。
這個賽道也非常擁擠,擁有更多資源、人才和生態優勢的字節、阿里、騰訊和百度,都相繼推出原生多模態模型。早在去年4月,豆包深度思考模型已具備視覺推理能力,今年2月,字節發布首個原生支持文本、圖像、音頻與視頻四模態輸入的生成模型Seedance2.0,成為2026年開春真正的現象級產品。
去年11月,百度推出全新一代原生全模態文心5.0,支持全模態輸入和輸出。今年1月底,Kimi發布的K2.5,就是原生多模態架構的多模態模型,擁有萬億參數,具備視覺理解能力。2月16日,阿里也推出的Qwen3.5,主打多模態和自動干活。
中國模型獨立廠商里,最大變量還有即將發布V4的DeepSeek,作為一個從去年7月一直推遲至今的模型,國內外技術圈都對其抱有極高的期待,期望它能再將模型的極致質價比推到更高的臺階。
假如DeepSeek超出預期,又會重新迎來大模型格局的變動。外媒傳出,DeepSeek將在3月第一周發布新模型,而MiniMax 率先選擇在3月2日發布財報,大概率是為了躲避DeepSeek新模型可能帶來的流量沖擊。
據雷鋒網報道,3年前閆俊杰在杭州和梁文鋒約過一頓飯。閆俊杰直言,自己和梁文鋒還有不小的認知差距。后來梁文鋒帶著DeepSeek R1殺進市場,閆俊杰和MiniMax 遭受“DeepSeek 即將殺死大模型競爭”的輿論轟炸。
接下來DeepSeek新模型發布后又會帶來什么,可能沒人比閆俊杰更焦慮。
撰寫|柳嘉
編輯|八尺
「白鯨實驗室」原創文章
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.