![]()
2026 年小模型或成為關鍵。
作者|徐珊
編輯|鄭玄
如果說 2025 年 DeepSeek 的爆發(fā)讓全球意識到算力并非通往 AGI 的唯一方式,那么 2026 年開年,MiroThinker 1.5 的發(fā)布,讓人更關注小模型的潛力所在。
MiroThinker 1.5 是盛大集團創(chuàng)始人陳天橋與 AI 科學家代季峰創(chuàng)辦的 MiroMind 所推出的新一代模型,MiroThinker 1.5 通過 其 30B 小模型規(guī)格,通過極小的算力調度,在復雜推理任務中取得了不輸大模型的表現,同時響應速度更快、成本更低、智能表現效果更好。目前,MiroThinker 1.5 正處于公開發(fā)布階段,人人皆可上手免費使用。
除了 MiroThinker 1.5 性能表現優(yōu)越以外,MiroThinker 備受關注的另一大原因是,這是一個強強聯手打造出來的創(chuàng)業(yè)項目。
MiroMind 是陳天橋在 AI 領域,少有的,自己下場主導并參與的創(chuàng)業(yè)項目,他曾憑借《傳奇》締造網游神話、登頂中國首富。在淡出中心視野這些年里,他扎進腦科學領域,砸下十億美金建立 TCCI,試圖挖掘人類大腦的秘密。
公司的另一個創(chuàng)始人則是代季峰,從微軟亞洲研究院到商湯科技,一直扎根在計算機視覺領域。他主導過 InternVL 等開源項目,是物體檢測與具身智能領域的風云人物。兩者組合,讓 MiroThinker 1.5 哪怕只是剛上線不久,也得到業(yè)內不少關注。
![]()
圖片來源: MiroMind 官網
不過,如果小模型的性能真的能夠與大模型相媲美,Agent 或許將會迎來一輪落地爆發(fā),隨著 Agent 真正完成端側落地,AI 硬件的能力與玩法,或許也會迎來新一輪的變革。
01
梁文鋒牽線搭橋,
MiroMind 想要成為下一個 DeepSeek
就在前不久,MiroMind 首席科學家代季峰在知乎上親自下場,還原了這段頗有江湖色彩的創(chuàng)業(yè)故事。
出人意料的是,為 MiroMind 兩位核心人物牽線搭橋的正是 DeepSeek 的掌門人梁文鋒。
2025 年初,當陳天橋目睹了 DeepSeek 能力后,就意識到通往 AGI 的道路已開始明晰。當發(fā)現自己完全有能力打造下一個 DeepSeek 時,他詢問梁文鋒,誰最適合帶隊沖刺 AGI?梁文鋒當時就推薦了代季峰,陳天橋沒有任何遲疑,直接鎖定了他,兩人聯合創(chuàng)辦了 MiroMind。
據代季峰回憶道,在創(chuàng)業(yè)前最關鍵的那場談話中,沒有冗長的商務談判,只有相見恨晚的共鳴。
當時,陳天橋問代季峰 DeepSeek 成功的核心原因是什么,代季峰提到因為梁文鋒一人集齊了「有錢、有理想、懂技術」三個要素,溝通與管理的成本降到極限。代老師隨后坦誠相待說:「我有理想和技術,但唯獨少了點『資金』。」陳天橋對此相視一笑提到,「我有資本,有對 AGI 的執(zhí)著理想,但確實缺一位懂技術的領路人。」
這種各有所長的組合,補齊了他們通往 AGI 創(chuàng)業(yè)道路的最后一塊拼圖。代季峰在組建團隊時,帶有一種近乎純粹的「少年感」,他提到自己不需要那種在大廠下午發(fā)消息、深夜十點才帶著滿身疲憊回家的員工,而是更希望團隊伙伴們都能做到「眼里有光」的狀態(tài)。
![]()
圖片來源:清華大學官網
在選擇究竟以什么方向切入賽道時,代季峰很清醒地意識到,現在 LLM 預訓練的曲線已經走到了極其平緩的平臺期,作為一個后來者,選擇再去大模型賽道拼參數并沒有意義。
于是,MiroMind 毅然選擇殺入了剛興起的 Agent Modeling 賽道,他們想看看,如果不再推崇算力至上,而是追求最懂、最實用的模型,能不能在 Agent 時代跑出一條不一樣的生路。
02
模型參數量降至 1/30,
成本下降 1/20
過去七個月,MiroMind 一直在思考一個更為根本的問題:智能的「奇點」究竟在哪里?
最后他們給出的的答案并非是「用參數推出世界記憶模型」,而是追求「發(fā)現智能」。
他們在官網中寫道:真正的智能并非依賴于全知全能,而是依賴于研究、驗證和糾正的能力。因為真正的智能不是過目不忘的死記硬背,而是像科學家一樣,在不確定性中通過糾錯抵達真相。
MiroThinker 1.5 測試的最終的效果,也非常令人欣喜。面對萬億級參數的 Kimi-K2-Thinking,僅有 30B 參數規(guī)模的 MiroThinker-v1.5 表現出了相當的推理水平。而最直觀的表現是模型性能與模型成本成倒掛的態(tài)勢,在衡量搜索代理能力的基準測試 BrowseComp-ZH 中,30B 版本的表現位列全球前列。
![]()
BrowseComp 基準測試的性能比較 |圖片來源:MiroMind 官網
由于參數量縮減到對方的 1/30,MiroThinker 1.5 30B 調用成本大幅下降至每次 0.07 美元,僅為萬億模型成本的 1/20,且推理速度更快。
![]()
智能搜索基準測試的性能比較|圖片來源:MiroMind 官網
MiroMind 在官網解釋了自己的設計思路與原理。他們認為傳統的 Scaling Law 路徑傾向于將盡可能多的人類知識記憶在模型參數中。這種做法的弊端在于,當模型面對未知領域或實時變動的信息時,往往會基于統計概率「捏造」答案,從而產生幻覺。而 MiroMind 團隊則將技術重點放在了交互式縮放(Interactive Scaling)上。
具體而言,在技術實現上,MiroThinker 1.5 引入了幾個核心的新機制:
交互式推理閉環(huán):模型不再進行簡單的線性思維鏈(CoT)外推。它構建了一個「提出假設—查詢外部數據—發(fā)現沖突—修正假設」的研究循環(huán)。在得出結論前,模型會主動發(fā)起多輪外部檢索,利用確定性的外部證據流來抵御不確定的內部推理偏差。
證據驅動的訓練機制:在訓練階段,團隊改變了獎勵函數。系統不再單純獎勵答案的正確性,而是強化模型搜尋證據的行為。缺乏來源支持的高置信度輸出會被懲罰,這迫使模型形成一種「先驗證、后判斷」的本能。
時間敏感型訓練沙箱:為了解決 AI 的「后見之明」問題,標準訓練中,模型通常能看到數據的最終結果,這使其在預測未來時傾向于先「回憶過去」。簡單來說,MiroMind 構建了一個沙箱,嚴格限制模型只能訪問特定時間戳之前的信息,迫使它在信息不完整、存在延遲的真實環(huán)境下學習推理和糾錯。
如此一來,MiroThinker 1.5 不再是一個試圖記住所有百科知識的容器,而是一個擅長使用工具的專業(yè)研究員。在處理金融分析、時效性預測等任務時,它能夠展示完整的邏輯驗證鏈條。
![]()
演示提問:下周有哪些重大事件可能會影響美國納斯達克指數?|圖片來源:MiroMind 官網
03
通往 AGI 的另一種道路
MiroThinker 1.5 的出現,在行業(yè)內引發(fā)了一定反響。不少業(yè)內人士認為,AI 競爭即將從拼參數拼規(guī)模的時代,轉向「拼智力」的時代。
隨著模型參數規(guī)模的持續(xù)下降和推理成本的邊際遞減,2026 年小模型或成為關鍵。當 AI 模型的參數規(guī)模最夠小、價格最夠低,且表現性能足夠好時,能夠更高效地集成進各類移動終端和邊緣設備中,那么 AI 落地硬件的算力門檻問題將會迎刃而解。那些已經在大廠實驗室、初創(chuàng)公司里打磨了一兩年的 AI 硬件,才算真正具備了底層技術支撐,迎來了真正的「開智」時刻,且能夠進一步迎接更豐富的功能,更有趣的交互設計。
就如同電力時代剛開啟時,人類必須依賴龐大的變壓器和錯綜復雜的電網供電,那時的電力是昂貴且固定的。但當電池技術成熟、電力變得可隨身攜帶后,電器才真正爆發(fā)并改變了每一個人的生活。如今的大模型就像初期的電網中心,而 MiroThinker 1.5 這樣的小模型,則更像隨處可見的「電池」。
可以預見的是,2026 年,AI 變革將不再僅僅局限于行業(yè)內部的技術狂歡,而是會通過手機、眼鏡、穿戴設備等每一個真實的硬件入口,觸達每一個普通人。當 AI 能夠以極低的成本在端側實時運行、自主研究并解決問題時,所有人都會比以往任何時候,都更直觀地感受到 AI 時代對生活的影響。
*頭圖來源:MiroMind
本文為極客公園原創(chuàng)文章,轉載請聯系極客君微信 geekparkGO
極客一問
你看好 MiroThinker 1.5 嗎?
未來 AI 在微觀型操作上,占比將被大大壓縮,轉而提升構建角色交流感。
點贊關注極客公園視頻號,
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.