網易首頁 > 網易號 > 正文申請入駐

商人閆俊杰，找到捷徑

2026-03-03 20:15:44　來源: 白鯨實驗室one

北京舉報

分享至

截至昨天下午，OpenClaw僅用一百天，已經超越所有GitHub開源軟件項目的星標數，成為史上最受歡迎開源項目。

這一世界頂流項目，意外成為中國模型廠商對外敘事的加速器。剛過去不久的春節，被視為資本預期的集中表達窗口，疊加模型廠商的競賽，Kimi估值從40多億美金上漲到百億美元，近20天累計收入已超過2025年全年總收入。

MiniMax和智譜市值也飆升到3000多億港幣，不過截止目前，MiniMax市值已回落到2500多億港元。

昨天MiniMax發布年報稱，2025年中國內地收入2138萬美元，占比27.0%，海外收入5766萬美元，占比73.0%。MiniMax2月ARR也已突破1.5億美元。

值得關注的是，除了原有C端產品收入外，體現B端收入的開放平臺及其他企業服務收入達到近2600萬美元，占比接近三分之一，增速最快。這被視為MinMax有了更穩定的收入結構。

MinMax創始人閆俊杰是個追求極致效率的人，其中包括模型迭代效率，token消耗效率，甚至還體現在他僅用四年就帶領MiniMax成功上市。外界通常認為他是一位純粹的技術人員，實際上他的商業嗅覺也異常靈敏。

閆俊杰依靠token經濟學，在過去追求智能上限的全方位敘事中，分化出一條自己的道路。他也因此提出了一個新問題，優先成本考慮的技術路線，在追求智能上限的道路上是否是一個更優的選擇。

至少2026年春節，模型廠商的集體沖榜，已經給出了某些信號。

模型免費策略沖榜

今年1月初，MiniMax為了推廣新模型M2.1，找到許多開發者推廣，最知名的一位是OpenClaw創始人Peter。早在Peter的龍蝦項目尚未火爆前，MiniMax就曾邀約Peter免費體驗M2.1模型，自此建立連接。

Peter感慨于MiniMax M2.1的低價，多次發布X帖子推薦使用M2.1模型，還在和網友互動中大力推薦MiniMax。“Claude opus是王者，MiniMax是個不錯的備選。”Peter也有推薦Kimi K2.5和智譜的GLM5，不過提及頻率沒有MiniMax高。

這或許有個人偏好，也可能因為MiniMax 的工作人員和Peter互動更頻繁。這種細致的經營策略，確實讓MiniMax迅速在開發者出圈。

一位國內大廠技術人員告訴我們，他在部署龍蝦項目時，就是因為看到Peter的推薦，所以充值了50刀MiniMax M2.1，M2.5發布后還購買了10刀/月的Coding Plan。

優惠力度也是一個重要策略。2月1日MiniMax宣布，直接為龍蝦用戶推出了7天免費方案。12天后，為了給M2.5新模型預熱，MiniMax還聯合AI編程工具Kilocode，推出一周免費試用體驗。

OpeRouter數據顯示，經過一周的免費方案后，MiniMax M2.5在龍蝦上的調用量直線上升。從2月23日開始，原本排名第一的Kimi K2.5每日調用量有所下滑，M2.5反超K2.5，成為每天調用量最大的模型。

實際上，MiniMax的模型調用定價確實非常便宜。根據OpenRouter3月2日的數據，MiniMax M2.5的有效定價輸入0.120美元/百萬token，輸出價格是1.37美元/百萬token。而Kimi K2.5的有效定價輸入0.232美元/百萬token，輸出價格是2.77美元/百萬token，智譜的GLM5輸入價格是0.669美元/百萬token，輸出價格是3.16美元/百萬token。

對開發者而言，使用國產模型意味著量大管飽，成本幾乎是海外頂級模型Claude Opus 4.6的1/20。

當然，MiniMax M2.5定價便宜，是因為它的參數量相比Kimi、智譜要小得多。通常而言，參數量越小模型的聰明程度相對越低，消耗的算力成本也更低。

不過短期來看，MiniMax 的策略取得不錯的效果。OpenRouter數據顯示，2月token調用量總排名中，M2.5以5.64T tokens的數據排名第一。

沖榜OpenRouter 獲得較高的排名，與其說是模型能力的勝利，不如說是一種商業策略的成功。

一位創業者告訴我們，OpenRouter并不能代表AI調用量的整體情況，因為它只是一個中轉平臺。大部分請求還是直接使用官方接口。他根據Claude模型營收和token單價的方式去估算，OpenRouter的流量只占Claude模型總流量的5%。

國產模型廠商集體沖榜OpenRouter，是因為這是唯一公開排行數據的中轉平臺，沖榜背后看中的更是開發者生態以及商業收入敘事。它會擴大開發者使用口碑，迅速在海外出圈。

這一點對MiniMax尤為重要。當MiniMax的市值沖上3000億甚至更高時，它需要證明自己的造血能力，打消外界對其PS高達數百倍的質疑。

極度精明和務實

盡管閆俊杰一再強調，MiniMax是一家技術驅動的公司，他也被塑造成AGI信徒，事實上MiniMax底層邏輯依然更偏重商業化考量。

這或許和閆俊杰早年在商湯工作的經歷有關，商湯成立7年才上市，長期高投入低盈利。MiniMax僅用4年就迅速上市，試圖用二級市場資金反哺研發，避免走商湯式“長期燒錢、盈利滯后”的老路。

根據公開資料梳理，閆俊杰在模型發展路徑上的核心理念與追求AGI的廠商存在顯著差異。他更早地將戰略重心從單純追求模型“更聰明”，轉向聚焦可量化的“效果”產出。而效果直接與商業化收入掛鉤。

對閆俊杰來說，追求token效率已經大于追求智能上限。

2025年1月，MiniMax發布文本模型MiniMax-Text-01，押注長上下文，自稱開啟Agent時代。該模型放棄業界普遍使用的Transformer架構，改用線性注意力結構。這個新架構相當于簡化計算過程，當文本非常長所需算力更小，但在捕捉復雜依賴關系上不如非線性注意力機制。

MiniMax-Text-01模型只強調Agent能力，代碼能力不足。從投入產出策略上看，代碼能力賽道強者如云，對算法要求也更高，Benchmark排名極易形成壓制敘事。一直到9個月后M2模型公布時，MiniMax方補齊代碼能力。

閆俊杰對成本效率的極致追求，也體現在后來發布的M2模型上。閆俊杰曾提出“不可能三角”理論，高度評價M2是“大巧若拙”。

“海外最好的模型可以有不錯的效果，但是價格非常貴且推理速度比較慢；國內的模型價格也相對便宜，但是效果和推理速度有差距。”閆俊杰稱，能不能有一款模型能在效果、價格和速度上能取得比較好的平衡，從而讓更多的人能受益于Agent時代的智能提升，M2正是不可能三角平衡下的產物。

后續M2模型的更新迭代中，MiniMax沒有追求高參數，而是繼續選擇在算力優化下的性能提升。2025年1月發布的MiniMax-01是4000億參數，而一年后發布M2.5總參數量只有2300億，相當于同時期發布的Kimi K2.5(1萬億)的1/5，智譜GLM5的1/3。

即使在智能體能力上，MiniMax M2.5的技術路線和Kimi K2.5也不同。Kimi K2.5除了編碼能力和視覺理解能力升級外，最大的不同是首次引入“Agent集群”能力，也就是根據任務需求，現場可以調度多達100個分身，并行處理1500個步驟。這也讓Kimi K2.5在處理復雜任務時，具備更快的速度和效率。

MiniMax的M2.5同樣強調深度搜索能力和token消耗的效率，在這方面，它公布的路徑不同于Kimi K2.5，而是強調用更精準的搜索輪次，降低無效搜索，優化真實效果。

很明顯，一個用并行算力換取任務完成率和速度，用規模解決復雜性，另一個是通過路徑優化降低復雜性。這是2025年模型行業產生的巨大分化。

閆俊杰的商業感覺再次得到證明。一位MiniMax內部人告訴我們：“M2.5只是M2大版本里迭代出的小版本，OpenClaw智能體爆發，帶來市場對token的需求激增，市場也急需要一個能夠滿足需求、而token消耗小的模型。所以迅速推出M2.5。”

閆俊杰迅速給M2.5定義，稱其為第一個能支持agent無限運行、沒有成本負擔的模型。

這也意味著MiniMax的敘事主線，依然是押注token效率，而不是智能上限。這個token效率，最終反映到MiniMax2025年的年報里，成了漂亮的數字。MiniMax用428名員工，花了2.5億美金訓練支出，創造了8000萬美元收入。

潛在的代價

MiniMax追求技術效率的路線，相比以往，也不是完全沒有潛在的代價。

在當前技術范式下，參數規模更大的模型，仍然具備更高的知識容量，也具備更復雜的推理潛力和更強的跨任務泛化能力。一旦頭部萬億級模型形成代際差距，MiniMax 的效率優勢可能會被斷層碾壓。

不少業內人士認為，模型性能效果上，仍然存在一分價錢一分貨的鐵律。大就是好，參數越大就會越聰明。

多位部署OpenClaw的技術人員告訴我們，體驗完更便宜的M2.5模型，發現它推理表現不錯，但在代碼能力上容易出問題，復雜任務的成功率也不高。

我們獲悉，2026年MiniMax仍會重點發力多模態，M3模型將會加速多模態融合，具備視覺理解能力。

這個賽道也非常擁擠，擁有更多資源、人才和生態優勢的字節、阿里、騰訊和百度，都相繼推出原生多模態模型。早在去年4月，豆包深度思考模型已具備視覺推理能力，今年2月，字節發布首個原生支持文本、圖像、音頻與視頻四模態輸入的生成模型Seedance2.0，成為2026年開春真正的現象級產品。

去年11月，百度推出全新一代原生全模態文心5.0，支持全模態輸入和輸出。今年1月底，Kimi發布的K2.5，就是原生多模態架構的多模態模型，擁有萬億參數，具備視覺理解能力。2月16日，阿里也推出的Qwen3.5，主打多模態和自動干活。

中國模型獨立廠商里，最大變量還有即將發布V4的DeepSeek，作為一個從去年7月一直推遲至今的模型，國內外技術圈都對其抱有極高的期待，期望它能再將模型的極致質價比推到更高的臺階。

假如DeepSeek超出預期，又會重新迎來大模型格局的變動。外媒傳出，DeepSeek將在3月第一周發布新模型，而MiniMax 率先選擇在3月2日發布財報，大概率是為了躲避DeepSeek新模型可能帶來的流量沖擊。

據雷鋒網報道，3年前閆俊杰在杭州和梁文鋒約過一頓飯。閆俊杰直言，自己和梁文鋒還有不小的認知差距。后來梁文鋒帶著DeepSeek R1殺進市場，閆俊杰和MiniMax 遭受“DeepSeek 即將殺死大模型競爭”的輿論轟炸。

接下來DeepSeek新模型發布后又會帶來什么，可能沒人比閆俊杰更焦慮。

撰寫｜柳嘉

編輯｜八尺

「白鯨實驗室」原創文章

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.