聞樂 發自 凹非寺
量子位 | 公眾號 QbitAI
先別聊什么參數、benchmark了,來看個狠活——
米版“macOS Sequoia”桌面系統(doge)。
![]()
開機動畫、用戶登錄、窗口管理、Dock欄縮放、Spotlight搜索、明暗顯示風格、Launchpad啟動臺,全都有。
還自帶54個原生應用,打開計算器能算賬,打開日歷能看日子,打開地圖能查地址,打開備忘錄能寫東西,Grapher還能畫3D函數圖……拖一拖轉一轉,挺像那么回事。
![]()
甚至!還有個能真實沖浪的Safari瀏覽器,好你個“Aqqle”(狗頭.jpg)。
![]()
關鍵這個系統是AI 4個小時全程無中斷、無人類接管,就這么一直肝出來的。
沒錯,用的就是主打長程任務、模糊指令遵循,躋身國產Agent第一梯隊的小米MiMo?V2.5 Pro
![]()
小米最新發布的MiMo?V2.5系列,包含Pro旗艦Agent、全模態基座、TTS語音合成、ASR語音識別四大模型,綜合實力對標國際頂尖水準。
![]()
就在今天凌晨,MiMo-V2.5系列模型(包含base版)已經正式官宣開源,權重全量開放
4個月,從入場到進入開源第一梯隊,小米這位“超速”選手,咱得扒一扒。
國際頂模的飯桌,它坐上去了
先看看成績單。
首先,新一代模型在通用智能體能力、復雜軟件工程與長程任務三大核心維度,相較前代MiMo-V2-Pro實現顯著躍升。
國際競技場上,在Coding Agent、SWE-Bench Pro、GDPVal-AA等多項權威基準測試中成績逼近Claude Opus 4.6、GPT-5.4等頂尖閉源模型,甚至大幅超越Gemini 3.1 Pro。
這么看下來,MiMo?V2.5-Pro不僅躋身國產開源第一梯隊,而且已經跟Claude Opus 4.6、GPT-5.4等國際頂模坐在一張桌子上吃飯了。
![]()
要說劃個重點,小米這次升級,最主要的是長周期任務和模糊指令遵循能力。
官方數據顯示,它可以穩定支撐超千次工具調用的長周期任務,自主完成人類專家數天甚至數周的高難度工作。
就拿北大SysY項目來說,從零寫一個完整編譯器這種級別的復雜工程,MiMo?V2.5-Pro自己吭哧吭哧就能從頭肝到尾,詞法分析、語法分析、中間代碼生成、RISC-V后端、性能優化……全包。
4.3小時、672次工具調用,任務中間都能不崩、不跑偏、不失憶,拿到233/233的滿分。
![]()
還有個事兒必須提一嘴——Token效率
在ClawEval標準Agent任務中,MiMo單軌跡只用約7萬Token,就能達到64%的Pass3通過率。
而Claude Opus 4.6、Gemini 3.1 Pro、GPT-5.4,普遍在12-18萬Token。
同樣的能力,一樣的效果,MiMo直接省了40%-60%的成本
![]()
這“Token半功倍”實打實的省錢能力,咱還真得點個贊。
![]()
不只代碼強,小米模型的語音能力也齊活了。
V2.5家族里的TTS支持文本描述造音色、零樣本克隆,不用上傳參考音頻,直接用文字描述就能生成想要的聲線;
![]()
視頻地址:https://mp.weixin.qq.com/s/TX5_KfchdvfWGd0iltwcdw
ASR拿到中英SOTA,粵語、川語、吳語、閩南語都能識別,連帶伴奏的歌詞都能精準轉寫。
![]()
而且,MiMo-V2.5-Pro和MiMo-V2.5都標配了1M上下文窗口,音頻模型也大幅進化,從基座到TTS、ASR全棧升級,一個不落。
好好好,小米這波根本不是單點突圍,這是直接端出了一整套Agent全家桶啊……
那它到底有多能跑?咱上實測!
實測,真不虛!
必須得來扒一下開頭那個macOS系統的代碼層,畢竟效果是真行。
整個項目由React 18+TypeScript+Zustand+Tailwind CSS以及Vite構建,68個組件撐起了54個原生應用。
![]()
XcodeApp里面塞了一個真實可瀏覽的網頁引擎、包含完整的國際象棋邏輯的小游戲,支持3D函數繪圖的Grapher等等。
![]()
窗口管理系統也不是簡單的彈個框,做了一套完整的窗口狀態機:拖拽、縮放、最小化、最大化、焦點切換、z-index層級管理、還復刻了macOS標志性的Traffic Lights三色燈邏輯。
4個小時,MiMo-V2.5 Pro自己把這套架構搭起來、把54個應用一個個填滿、把窗口管理的狀態同步理順。
全程無中斷、無人類接管,這編程能力屬實是不虛,真把人類程序員給解放了。
然后,我把模型接到了龍蝦里,給了一個超長提示詞,讓它從零開發了一個3D像素風農場模擬游戲。
![]()
什么3D場景搭建、像素風格美術、作物生長系統、天氣循環、玩家交互邏輯……全都給我塞進去。
MiMo-V2.5 Pro一路肝下來,從架構到核心玩法,工程量大環節多的農場給我搞定了。
![]()
最終交出來的版本質感很足。畫面里是三種不同顏色劃分的農場區域,外圍還點綴著像素風花草點綴氛圍;
商店里能買到胡蘿卜、番茄、南瓜三種作物,游戲里不僅有晴雨交替的天氣變化,還做了實時更新的金幣計數和像素小人的體力條。
![]()
那就開始種地吧!
進游戲第一件事,先鋤地。扛著鋤頭走到空地上,DuangDuangDuang幾下,一塊耕地就出來了。
然后去商店買種子,番茄、小麥、胡蘿卜……選完往兜里一揣,回到地里一顆顆種下去。
種完澆水,看著小苗苗冒頭,作物成熟之后會有閃光效果,這時候就能收獲了,收割完再去商店賣掉,金幣叮叮當當到賬了~
![]()
從場景裝飾到核心玩法,一套完整閉環直接拉滿,種地→澆水→收獲→賣錢→再買種子→再種……好,循環起來停不下,賽博種地也太上頭了!!
接下來,我用MiMo-V2.5做了一個山野風格治愈系自然漫游數字手賬本。
和小游戲不一樣,咱這次就給了一句大白話:
幫我做個山野風格的治愈系網站,像一本旅行手賬,自然、安靜、有呼吸感,那種逃離城市走進曠野的感覺。
沒給配色、沒給字體、沒給布局、沒給動效方案,啥都沒給。
![]()
這類任務考驗的就是模糊指令理解了,山野到底是個啥感覺?治愈系配色要怎么搭?
MiMo-V2.5的理解是:大地色系、手寫感字體、墨水質感、以及柔和的動畫。
![]()
于是,我就得到了一個細節拉滿、內容豐富的手賬。
山巒背景做視差,滾動的時候遠近山層拉出縱深感,畫面上還飄著小粒子。鼠標一挪,柔和光暈就跟過來了。
復選框點擊還有彈跳動畫,全文滾動的時候每個元素都是淡入淡出,氛圍感滿滿。
![]()
甚至最后的手賬本還有交互功能,行囊里的裝備可以標記選擇,這個小設計屬于意外之喜了。
![]()
沒告訴它具體用什么顏色、什么字體,它自己從山野這個詞里讀懂了我要的氛圍,自行完成了交互、視覺和動效。
這種模糊指令遵循能力,最適合普通人上手,不用把提示詞寫成PRD(產品需求文檔),大白話也能出好東西。
代碼能力看完了,語音這塊兒咱也得試試!
讓MiMo-V2.5-TTS一個人撐起一臺戲,分別生成了三種角色聲音,年輕理性女生音、中年夜市老板音、吃貨少年音,來場減肥辯論!
![]()
視頻地址:https://mp.weixin.qq.com/s/TX5_KfchdvfWGd0iltwcdw
出來的效果嘛……各有各的味兒,毫不串戲~
最后試試ASR語音識別。
丟了一段粵語過去,轉寫結果基本準確,只有最后一句的“歡迎來到香港”的“來”聽錯了,不過無傷大雅,識別度達到99.999%。
![]()
視頻地址:https://mp.weixin.qq.com/s/TX5_KfchdvfWGd0iltwcdw
只能說,小米這波語音能力補齊的姿勢,屬實優雅。
4個月,它拿出了真東西
效果看完了,最后咱聊聊這支團隊。
小米AI團隊這波節奏,確實有點超出預期,從去年年底V2系列進場,到現在V2.5沖到開源第一梯隊,前后也就4個月時間。
放在行業里,正常節奏基本上是8-12個月,小米相當于直接把周期砍了一半。
快也就算了,它東西還齊,旗艦、全模態、全鏈路語音模型一口氣全更完。
好好好,“趕工期”趕出頂尖全家桶,也是頭一回見(doge) 。
![]()
當然了,咱用戶雖然看中模型能力,但性價比咱也真的很在乎。
小米這次全系升級到1M上下文,但憑借著超高Token效率,計費規則反而簡化了。
![]()
1M和256K采取同樣的Credit倍率,Pro從4x降到2x,標準版從2x降到1x。
加上夜間再打8折(北京時間00:00~08:00)Token Plan用戶Credits全量重置,這組合拳打下來,就倆字——
普惠。讓普通用戶和開發者都能低成本體驗高階AI能力。
這不,國外開發者馬上種草了。
![]()
技術做得好,落地普及也得跟上。小米顯然懂這個道理,于是在打折之外,又端出MiMo Orbit這個開發者扶持計劃。
這個計劃分兩塊:
一塊是百萬億Token創造者激勵計劃,面向AI開發者發放100萬億Token,完全免費。全球個人開發者、團隊、企業都能申請參與。
而且小米方面會認真評估每份申請,按需發放,確保Token給到真正需要的人手里。
另一塊是面向全球新興Agent框架,提供起步階段的專項支持。
不管你的框架做到什么階段、用戶規模多大,MiMo都愿意當你的底層模型引擎。
不僅限免接入,還會搞定底層適配技術的技術支持,幫你把用戶體驗門檻拉低到……幾乎沒有門檻。
我看明白了,這是個“手牽手我們一起走,創造幸福的生活~”的大動作(期待.jpg)。
![]()
放在當下這個節點看,其實也不難理解——
國際上幾家家底厚的模型已經把生態鋪得很穩,開發者習慣基本固定,后來者想擠進去并不容易。國產模型想要站穩,速度、實力、誠意三樣缺一不可。
小米的打法很明確:用更快的迭代搶時間,用更強的能力留用戶,用真金白銀降低大家的嘗試成本。
算不算“彎道超車”不好說,但至少態度和動作都很干脆。
至于能不能真正站穩,雖然最后還是得開發者說了算,但就這份答卷來看,小米這支AI團隊是真·All in。
下一個4個月,它會掏出什么呢?我先蹲一波~
體驗地址:https://aistudio.xiaomimimo.com/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.