![]()
2026 年小模型或成為關鍵。
作者|徐珊
編輯|鄭玄
如果說 2025 年 DeepSeek 的爆發讓全球意識到算力并非通往 AGI 的唯一方式,那么 2026 年開年,MiroThinker 1.5 的發布,讓人更關注小模型的潛力所在。
MiroThinker 1.5 是盛大集團創始人陳天橋與 AI 科學家代季峰創辦的 MiroMind 所推出的新一代模型,MiroThinker 1.5 通過 其 30B 小模型規格,通過極小的算力調度,在復雜推理任務中取得了不輸大模型的表現,同時響應速度更快、成本更低、智能表現效果更好。目前,MiroThinker 1.5 正處于公開發布階段,人人皆可上手免費使用。
除了 MiroThinker 1.5 性能表現優越以外,MiroThinker 備受關注的另一大原因是,這是一個強強聯手打造出來的創業項目。
MiroMind 是陳天橋在 AI 領域,少有的,自己下場主導并參與的創業項目,他曾憑借《傳奇》締造網游神話、登頂中國首富。在淡出中心視野這些年里,他扎進腦科學領域,砸下十億美金建立 TCCI,試圖挖掘人類大腦的秘密。
公司的另一個創始人則是代季峰,從微軟亞洲研究院到商湯科技,一直扎根在計算機視覺領域。他主導過 InternVL 等開源項目,是物體檢測與具身智能領域的風云人物。兩者組合,讓 MiroThinker 1.5 哪怕只是剛上線不久,也得到業內不少關注。
![]()
圖片來源: MiroMind 官網
不過,如果小模型的性能真的能夠與大模型相媲美,Agent 或許將會迎來一輪落地爆發,隨著 Agent 真正完成端側落地,AI 硬件的能力與玩法,或許也會迎來新一輪的變革。
01
梁文鋒牽線搭橋,
MiroMind 想要成為下一個 DeepSeek
就在前不久,MiroMind 首席科學家代季峰在知乎上親自下場,還原了這段頗有江湖色彩的創業故事。
出人意料的是,為 MiroMind 兩位核心人物牽線搭橋的正是 DeepSeek 的掌門人梁文鋒。
2025 年初,當陳天橋目睹了 DeepSeek 能力后,就意識到通往 AGI 的道路已開始明晰。當發現自己完全有能力打造下一個 DeepSeek 時,他詢問梁文鋒,誰最適合帶隊沖刺 AGI?梁文鋒當時就推薦了代季峰,陳天橋沒有任何遲疑,直接鎖定了他,兩人聯合創辦了 MiroMind。
據代季峰回憶道,在創業前最關鍵的那場談話中,沒有冗長的商務談判,只有相見恨晚的共鳴。
當時,陳天橋問代季峰 DeepSeek 成功的核心原因是什么,代季峰提到因為梁文鋒一人集齊了「有錢、有理想、懂技術」三個要素,溝通與管理的成本降到極限。代老師隨后坦誠相待說:「我有理想和技術,但唯獨少了點『資金』。」陳天橋對此相視一笑提到,「我有資本,有對 AGI 的執著理想,但確實缺一位懂技術的領路人。」
這種各有所長的組合,補齊了他們通往 AGI 創業道路的最后一塊拼圖。代季峰在組建團隊時,帶有一種近乎純粹的「少年感」,他提到自己不需要那種在大廠下午發消息、深夜十點才帶著滿身疲憊回家的員工,而是更希望團隊伙伴們都能做到「眼里有光」的狀態。
![]()
圖片來源:清華大學官網
在選擇究竟以什么方向切入賽道時,代季峰很清醒地意識到,現在 LLM 預訓練的曲線已經走到了極其平緩的平臺期,作為一個后來者,選擇再去大模型賽道拼參數并沒有意義。
于是,MiroMind 毅然選擇殺入了剛興起的 Agent Modeling 賽道,他們想看看,如果不再推崇算力至上,而是追求最懂、最實用的模型,能不能在 Agent 時代跑出一條不一樣的生路。
02
模型參數量降至 1/30,
成本下降 1/20
過去七個月,MiroMind 一直在思考一個更為根本的問題:智能的「奇點」究竟在哪里?
最后他們給出的的答案并非是「用參數推出世界記憶模型」,而是追求「發現智能」。
他們在官網中寫道:真正的智能并非依賴于全知全能,而是依賴于研究、驗證和糾正的能力。因為真正的智能不是過目不忘的死記硬背,而是像科學家一樣,在不確定性中通過糾錯抵達真相。
MiroThinker 1.5 測試的最終的效果,也非常令人欣喜。面對萬億級參數的 Kimi-K2-Thinking,僅有 30B 參數規模的 MiroThinker-v1.5 表現出了相當的推理水平。而最直觀的表現是模型性能與模型成本成倒掛的態勢,在衡量搜索代理能力的基準測試 BrowseComp-ZH 中,30B 版本的表現位列全球前列。
![]()
BrowseComp 基準測試的性能比較 |圖片來源:MiroMind 官網
由于參數量縮減到對方的 1/30,MiroThinker 1.5 30B 調用成本大幅下降至每次 0.07 美元,僅為萬億模型成本的 1/20,且推理速度更快。
![]()
智能搜索基準測試的性能比較|圖片來源:MiroMind 官網
MiroMind 在官網解釋了自己的設計思路與原理。他們認為傳統的 Scaling Law 路徑傾向于將盡可能多的人類知識記憶在模型參數中。這種做法的弊端在于,當模型面對未知領域或實時變動的信息時,往往會基于統計概率「捏造」答案,從而產生幻覺。而 MiroMind 團隊則將技術重點放在了交互式縮放(Interactive Scaling)上。
具體而言,在技術實現上,MiroThinker 1.5 引入了幾個核心的新機制:
交互式推理閉環:模型不再進行簡單的線性思維鏈(CoT)外推。它構建了一個「提出假設—查詢外部數據—發現沖突—修正假設」的研究循環。在得出結論前,模型會主動發起多輪外部檢索,利用確定性的外部證據流來抵御不確定的內部推理偏差。
證據驅動的訓練機制:在訓練階段,團隊改變了獎勵函數。系統不再單純獎勵答案的正確性,而是強化模型搜尋證據的行為。缺乏來源支持的高置信度輸出會被懲罰,這迫使模型形成一種「先驗證、后判斷」的本能。
時間敏感型訓練沙箱:為了解決 AI 的「后見之明」問題,標準訓練中,模型通常能看到數據的最終結果,這使其在預測未來時傾向于先「回憶過去」。簡單來說,MiroMind 構建了一個沙箱,嚴格限制模型只能訪問特定時間戳之前的信息,迫使它在信息不完整、存在延遲的真實環境下學習推理和糾錯。
如此一來,MiroThinker 1.5 不再是一個試圖記住所有百科知識的容器,而是一個擅長使用工具的專業研究員。在處理金融分析、時效性預測等任務時,它能夠展示完整的邏輯驗證鏈條。
![]()
演示提問:下周有哪些重大事件可能會影響美國納斯達克指數?|圖片來源:MiroMind 官網
03
通往 AGI 的另一種道路
MiroThinker 1.5 的出現,在行業內引發了一定反響。不少業內人士認為,AI 競爭即將從拼參數拼規模的時代,轉向「拼智力」的時代。
隨著模型參數規模的持續下降和推理成本的邊際遞減,2026 年小模型或成為關鍵。當 AI 模型的參數規模最夠小、價格最夠低,且表現性能足夠好時,能夠更高效地集成進各類移動終端和邊緣設備中,那么 AI 落地硬件的算力門檻問題將會迎刃而解。那些已經在大廠實驗室、初創公司里打磨了一兩年的 AI 硬件,才算真正具備了底層技術支撐,迎來了真正的「開智」時刻,且能夠進一步迎接更豐富的功能,更有趣的交互設計。
就如同電力時代剛開啟時,人類必須依賴龐大的變壓器和錯綜復雜的電網供電,那時的電力是昂貴且固定的。但當電池技術成熟、電力變得可隨身攜帶后,電器才真正爆發并改變了每一個人的生活。如今的大模型就像初期的電網中心,而 MiroThinker 1.5 這樣的小模型,則更像隨處可見的「電池」。
可以預見的是,2026 年,AI 變革將不再僅僅局限于行業內部的技術狂歡,而是會通過手機、眼鏡、穿戴設備等每一個真實的硬件入口,觸達每一個普通人。當 AI 能夠以極低的成本在端側實時運行、自主研究并解決問題時,所有人都會比以往任何時候,都更直觀地感受到 AI 時代對生活的影響。
*頭圖來源:MiroMind
本文為極客公園原創文章,轉載請聯系極客君微信 geekparkGO
極客一問
你看好 MiroThinker 1.5 嗎?
未來 AI 在微觀型操作上,占比將被大大壓縮,轉而提升構建角色交流感。
點贊關注極客公園視頻號,
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.