![]()
當整個 AI 圈都在為 DAU(日活躍用戶數)和融資額焦慮時,MiniMax 創始人閆俊杰卻表現出一種近乎冷酷的淡漠。
坐在羅永浩對面的閆俊杰,并不像一位掌管著 AI 獨角獸企業的技術新貴。
![]()
他拒絕談論改變世界,反而坦承恐懼。那種恐懼不是來自商業競爭,而是來自技術本身——當模型的能力開始超越人類時,創造者反而成了最先感到不安的人。
只要是一個東西能被量化,模型就一定會強于人,或者一定是能到最好的人類的那一檔水平。所有做得比較成功的模型,在做出來之前都會有點害怕。
據晚點采訪,在 MiniMax 內部,互聯網行業奉為圭臬的 DAU ,被閆俊杰直接定義為「虛榮指標」。
在巨頭環伺、算力短缺、熱錢褪去的 2025 年,MiniMax 正在進行一場關于認知的修正:不再沿用移動互聯網的邏輯,即通過大規模投放換取增長、通過堆砌功能留住用戶,而是回歸本質:把模型當作最重要的產品。
在大模型時代,真正的產品其實是模型本身,傳統意義上的產品更像是一個渠道。如果模型不夠聰明,產品做得再好也沒有用。
在羅永浩和閆俊杰這期對談里,我發現 MiniMax 這家 AI 公司從創業第一天就選擇了注定與主流背道而馳的技術路徑。
當所有人都試圖尋找中國的 OpenAI 和 Sam Altman 時,閆俊杰卻在試圖證明「非天才」的價值。MiniMax 的故事不是關于天才的靈光乍現,而是一場關于如何在資源受限的縫隙中,通過極度理性地計算與修正,撕開一道通往 AGI 窄門的精密實驗。
用 1/50 的籌碼通往 AGI
MiniMax 過去三年的技術路線,表面看是一連串孤立的賭注,實則暗藏著一條統一的邏輯線索:在資源受限的前提下,如何用更聰明的方式優化,而非更多的算力堆砌,逼近 AGI 的上限。
當行業還在卷文本時,MiniMax 做了一個在當時看來極度冒險的決定:創業第一天就押注全模態。閆俊杰后來解釋說,他們一開始就想得很清楚,真正的 AGI 一定是多模態的輸入、多模態的輸出。
三年多前創業時完全沒有現成的技術路線,他們的策略就是每個模態至少先走通,等時機成熟再融合。這種堅持在當時備受質疑——業界主流認為應該先聚焦單一模態做到極致。
但閆俊杰的邏輯是,AGI 的本質是多模態融合,如果現在不同步推進,等到需要融合時技術債會成為致命傷。這種非共識的堅持,讓 MiniMax 在 2025 年擁有了全球音頻第一、視頻第二、文本穩坐第一梯隊的全模態能力。
![]()
前不久 OpenAI 的 Sora 2 通過多模態融合取得了顯著成果,這在一定程度上也印證了 MiniMax 早在創業初期就選擇這一技術路徑的前瞻性。
但更激進的是,閆俊杰在創業初期就打破了 AI 研究的傳統模式。
這是公司剛組建時打破的第一個認知——把大模型做好這件事一定不能迷信之前的經驗,得用第一性原理拆開來看。大概在四五年前,人工智能領域大家追求的是寫很多數學公式,把理論搞得很好、很花哨。 但這代人工智能最核心的其實就是 Scaling(縮放定律),就是讓它能夠用最簡單的方法把效果做得更好,并且隨著數據跟算力變多,效果就能夠持續往上漲。
閆俊杰的技術直覺源自 2014 年在百度的實習經歷。那時 Anthropic 的 CEO Dario Amodei 也在百度實習,正是在那里他發現了 Scaling Law 的雛形。
閆俊杰說,Scaling Law 其實在 2014 年做語音識別時就已經被發現了,但真正被廣泛認知是大概 2020 年左右。「六年前就有了,并且那件事發生在中國公司,所以后面的事就有點遺憾。」
這段往事讓閆俊杰意識到,中國并非沒有機會,而是錯失了把技術洞察轉化為產業優勢的時機。
現實是殘酷的。閆俊杰很清楚中美之間的差距。他算過一筆賬:美國最好的公司的估值是中國創業公司的 100 倍,收入基本上也是 100 倍,但技術可能就領先 5%,花的錢大概是 50 到 100 倍之間。
那為什么中國的公司可以花他們 1/50 的錢就做出來效果,差距可能只差 5%?核心原因是中國的人才還是非常好的。而更關鍵的是,中國的算力比美國有很大差距,因此必須得用更加創新的方式,才有可能做到同樣的效果。 原則可能是一樣,但方法上,在每個模塊上其實都有很多創新。
算力限制不一定是詛咒,反而能成為倒逼創新的鞭子。
這就解釋了為什么 MiniMax 從 2023 年起就率先探索 MoE 架構,為什么在 2025 年敢于押注線性注意力機制,又為什么在 M2 模型中回歸全注意力機制。
每一次技術選擇,都是在有限資源下尋找質量、速度、價格的三角平衡。
如果說 DeepSeek的邏輯是「用極致的工程優化榨干每一分算力」,那么MiniMax 就是在通過算法突破和機制創新在有限資源中撬動更大可能。
一個穩扎穩打,一個劍走偏鋒。
![]()
其中一個出奇的創新, 是 MiniMax 在模型推理機制提出的「交錯思維(Interleaved Thinking)」,讓模型在「動手做事—停下來思考—再動手」的循環里推進任務。
這一新的機制很快推動了 OpenRouter、Ollama 等國外主流推理框架的適配支持,也帶動 Kimi 和 DeepSeek 等國內模型陸續補齊類似能力。
但這些成果背后,更值得追問的是:一支沒有硅谷海歸坐鎮、被外界視作「草根」的團隊,如何做出全球領先的模型?
閆俊杰的回答出人意料。
AI 不是玄學,而是可以被第一性原理拆解的工程問題,比如算法該怎么設計,數據的鏈路該怎么搭建,訓練效率該怎么優化,每個東西都有非常明確的目標。
正是基于這一判斷,讓閆俊杰放棄了尋找「天才」,轉而相信科學方法論可以讓普通人發揮非凡價值。 他還提到,公司的海歸是不少的,但真正能起到關鍵作用的同學,很多人基本上都是第一份工作。
在 MiniMax 會議室墻上有一行字——Intelligence with Everyone,這是閆俊杰創業的初衷,也是不少人選擇加入 MiniMax 的理由。
![]()
這行字今天也正在成為現實,全球超過兩百個國家和地區的用戶正在使用 MiniMax 的多模態模型,其中既有 2.12億用戶,也有 10 多萬企業和開發者來創造更多產品和服務。
非天才主義的 AI 掌舵人
如果說技術路線的非共識是顯性的,那么閆俊杰本人的成長軌跡,則是一場關于「反脆弱性」的修行。
閆俊杰出身河南小縣城,在資源極度匱乏的環境下培養了極強的自學能力。
上小學的時候自己會看很多書,而且這些書有可能不應該是那個時間點的人來看的。比如很多高中甚至大學的書,上小學的時候提前就看。我爸爸是教初中的,就開始看初中的東西,上初中的時候就開始看高中的東西,高中的時候又開始學微積分,那些東西其實也沒有人教,就是自己看。
小學自學初中,高中自學微積分——這種不受環境限制、超前學習的特質,貫穿了閆俊杰的整個創業生涯。當別人在等待導師指點時,他已經通過第一性原理自我拆解問題;當別人在抱怨資源不足時,他已經通過極致的自學能力補上了差距。
但自學能力并不意味著一帆風順。這和閆俊杰在商湯受到的「殘酷訓練」不無關系。那時候他開始意識到要真正做一個最好的東西,就做了人臉識別,從倒數到第一大概花了一年半。
這一年半是非常痛苦的,每次技術測試都是倒數第幾名,這種煎熬足以擊垮大多數人。 但閆俊杰沒有放棄,反而從這段經歷中提煉出了核心方法論:一定要做取舍,一定要選一些更加長期、能夠根本性發生變化的東西,而不是去做一些修補的東西。
經歷這事之后,最核心的還是對自己這些最底層的判斷有信心。
這段磨煉鍛造了閆俊杰兩個關鍵特質:一是極致的取舍能力,愿意放棄短期修補,聚焦長期突破;二是極高的心理韌性,能夠承受長周期的失敗和質疑。
這兩個特質,恰恰是 MiniMax 能夠在技術路線上堅持非共識這種近乎「佛系」的定力,讓閆俊杰在硅谷銀行危機、模型訓練失敗等困境中都能保持冷靜。
中國 AI 的第三條路
MiniMax 的故事講到這里,一個更大的問題自然浮出水面:當人才培養需要時間,技術追趕需要周期,中國 AI 公司靠什么在當下就建立自己的生存空間?
MiniMax 不一定是標準答案,但閆俊杰倒是有三個創業至今一直堅持的原則:
第一,不做項目,只做用戶;第二,國內海外同時做。
2022 年,國內大廠還在觀望 AI 是否值得投入,創業公司普遍選擇 ToB 路徑(做項目、賣解決方案)以求快速變現。但閆俊杰選擇了最難的一條路:ToC,并且從第一天就瞄準全球市場。

因此,閆俊杰選擇在海外更激烈的競爭中打磨技術,而非卷入國內與巨頭的流量爭奪。事實證明,這是正確的——MiniMax 在海外市場的 DAU 和付費率都維持在健康區間,而這正在成為它的護城河。
但最難的,是第三個原則:技術驅動 vs 用戶增長。
這是對所有 AI 創業公司的終極拷問。閆俊杰坦白也糾結過,最終選擇了前者,哪怕這意味著短期數據的犧牲、中層的流失和外界的質疑。
通過模型能力推動產品和業務發展,或者通過移動互聯網時代的增長方式來發展,兩者有可能都是對的,但它們是沒法共存的。最后我們發現技術驅動的這種方式才適合我們。
在技術驅動的戰略下,閆俊杰做出另外一個關鍵選擇:開源。
年初 DeepSeek R1 橫空出世后不久,閆俊杰曾表示,如果可以重新選,應該第一天就開源。在和羅永浩的對談里他再次談到開源。 實際上開源這件事,在手機操作系統上其實都發生過。蘋果是閉源的,安卓是開源的,第二名后面的人必須得開源才有自己的獨特定位,才能發出新的生態。
為了讓我們能夠進展,需要別人有選擇我們的理由,模型的開放性恰好是一個非常重要的理由,因為它可以讓你有足夠強的技術信任,知道你的研發能力,也愿意更加深度來合作。
而 MiniMax 也延續著 DeepSeek 掀起的開源浪潮, MiniMax M2 發布后,大模型分析平臺 Artificial Analysis 是這樣介紹的:
中國 AI 實驗室在開源領域持續保持領先地位。 MiniMax 的發布延續了中國 AI 在開源領域的領先地位,這一地位由 DeepSeek 在 2024 年底開啟,并由 DeepSeek 的后續發布、阿里巴巴、智譜、和 Kimi 等公司持續保持。
![]()
最近全球模型聚合平臺 OpenRouter 聯合a16z 發布了一份報告 State of AI 的100 Trillion Tokens ,可以看到 M2 開源之后,快速受到了全球開發者歡迎和采納。
中國開源模型在全球使用量占比從 2024 年初的 1.2%,現在這個數字已經飆升至 30%,全球開源生態的重心已經向中國傾斜。
但這場競賽遠未結束。閆俊杰的判斷是,算力和芯片的物理限制,決定了模型參數量和成本是有天花板的。在一個有限的參數量的情況下,不同的人來做不同的取舍,就一定會有些不一樣的成果。
AI 不會一家獨大,但也不會百家爭鳴,最終會收斂到少數幾家基于不同取舍的共存格局。
羅永浩關于「中國錯失 GPT-3.5」的追問,閆俊杰展現出了一種務實的樂觀。他表示把技術做好最重要的東西,說到底其實是兩個詞,一個是想象力,一個是自信。
美國那些企業很多浪潮是他們引領的,所以有自信在,要引領這個行業。在中國有些產業里面其實也是這樣的,比如通訊、還有其他領域。 至少人工智能這個行業目前還沒有到引領這個地步,但這個事情已經越來越具備了。
這或許就是中國 AI 公司需要走出的第三條路:
用更聰明的架構設計,對抗算力差距;
通過科學的組織進化,培養 AI 原生人才 ;
在夾縫中長出自己的形狀,而非附庸于巨頭。
MiniMax 的故事還在繼續,中國 AI 的篇章墨跡尚未干。勝負不由起跑線決定,而由你選擇在哪條路上、用什么樣的節奏、堅持多久來定義。
閆俊杰在訪談中說道:
再往后三年看,即使不是我們,也會有中國其他的人能夠做到這件事。
三年后,會是誰?又會用怎樣的方式?
沒有一部續集如此令人期待,因為我們都會是其中的角色。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.