![]()
智東西
作者 程茜
編輯 李水青
智東西4月23日報道,剛剛,小米MiMo大模型一口氣官宣4款新模型:旗艦推理模型MiMo-V2.5、全模態Agent模型V2.5-Pro開啟公測、即將開源;V2.5-TTS Series、V2.5-ASR即將推出。
![]()
小米MiMo大模型負責人正是原DeepSeek核心成員、被業內稱為“天才少女”的羅福莉,這距離上次MiMo-V2系列重磅三連更僅36天。與上一代模型類似,MiMo-V2.5全系列同樣是為智能體場景打造,MiMo-V2.5-Pro專為長難Agent任務打造,MiMo-V2.5可覆蓋絕大多數通用Agent場景。
小米還貼心為用戶提供了官方使用指南:MiMo-V2.5支持原生全模態Agent能力,涵蓋圖像、音頻與視頻,相比Pro版模型平均推理速度更快,更適應對時延敏感的任務。
![]()
除性能外,此次小米MiMo新模型還有一大升級點是更高的Token效率。根據官方信息,在拿到智能體基準榜單ClawEval相同分數的情況下:
MiMo-V2.5-Pro相比Kimi本周發布的開源旗艦多模態智能體模型Kimi K2.6節省了42% Token;MiMo-V2.5相比Meta本月初發布的閉源多模態推理模型Muse Spark節省了50% Token。
![]()
此外,小米此次還全面升級了模型訂閱計劃Token Plan:取消4倍的Credits計費方式、計費不區分256k和1M上下文、夜間享有專屬優惠速率、新增自動續費模式。值得一提的是,其Token Plan計劃剛發布時,就有不少用戶吐槽價格太貴,便宜的套餐Token不夠用。
智東西體驗了MiMo-V2.5-Pro,讓其“制作一個3D橫版格斗游戲”,MiMo-V2.5-Pro在幾分鐘內、寫了1123行代碼,就生成了“龍虎格斗游戲”。該游戲界面的血條、雙方角色名、倒計時、對戰提示清晰,還包含命中火花、格擋碎片、鏡頭震動+命中停頓等反饋系統,具備一定可玩性,但人物角色造型簡單,除顏色和帽子幾乎沒差異。
![]()
▲MiMo Studio主頁
有意思的是,今年3月,小米MiMo-V2-Pro曾以匿名模型Hunter Alpha的身份現身OpenRouter平臺,一度被開發者誤認為是即將發布的DeepSeek V4。如今小米新一代MiMo-V2.5推出,又正值DeepSeek V4被傳出將于本周發布。
Xiaomi MiMo開放平臺:https://platform.xiaomimimo.com
官方公布的體驗地址Xiaomi MiMo Studio:https://aistudio.xiaomimimo.com/#/c
一、MiMo-V2.5-Pro:專攻長難智能體任務,4.3小時搞定本科生數周項目
小米官方稱,MiMo-V2.5-Pro是小米MiMo迄今最強大模型,在通用智能體能力、復雜軟件工程以及長程任務等維度上,能與Claude Opus 4.6、GPT-5.4等全球頂尖Agent模型相當,相較其上一代模型MiMo-V2-Pro提升。
根據小米內部測試,搭配合適的運行框架,MiMo-V2.5-Pro可以穩定完成單次涉及近千輪工具調用的長程任務。且在智能體場景下,該模型指令遵循能力提升,其既能捕捉上下文中的隱性要求,又能在超長周期內保持邏輯一致。
![]()
基于小米MiMo團隊開發的評估套件MiMo Coding Bench,MiMo-V2.5-Pro與Claude Opus 4.6的差距進一步縮小,得分分別為73.7分和77.1分,MiMo-V2-Pro是71.5分。
![]()
有推特網友用此前的網紅問題實測了MiMo-V2.5-Pro,其問題是“我想去洗車,洗車店離我50米遠,我應該走著去還是開車去”,MiMo-V2.5-Pro不負眾望,給出了正確答案。
![]()
小米MiMo放出了幾個MiMo-V2.5-Pro的實操案例。
首先是“用Rust實現完整的SysY編譯器”。這一任務的難點在于,模型需獨立完成詞法分析器、語法分析器、AST、Koopa IR代碼生成、RISC-V匯編后端,以及性能優化。
在實際操作中,該模型采用逐層搭建整個編譯器的方式,其先搭完整流水線骨架再逐層攻克,在各項的具體分數中,其在Koopa IR、RISC-V后端、性能優化上都拿到了滿分,首次編譯實現了59%的冷啟動通過率,這意味著在跑任何測試之前,架構是對的。在第512輪,該模型一次重構令lv9/riscv回退了兩個測試點;模型自行診斷、恢復、繼續推進。
這一任務是北京大學《編譯原理》課程項目,北大本科生通常需要數周時間才能完成,MiMo-V2.5-Pro用時4.3小時、經過672次工具調用完成,在隱藏測試集上取得滿分233分。
![]()
第二個官方案例是開發視頻編輯器,其提示詞為“構建一個視頻編輯器Web應用”。MiMo-V2.5-Pro交付的Web應用具備多軌道時間線、片段裁剪、交叉淡化、音頻混合以及導出流程等功能。其最終構建的代碼量達8192行、歷經1868次工具調用,在11.5小時的自主工作中完成。
![]()
第三個案例是模擬電路EDA任務,其需求是“基于臺積電180nm CMOS工藝,從零開始設計并優化一款完整的翻轉電壓跟隨器低壓差線性穩壓器(FVF-LDO)”。
完成任務期間,該模型需要確定功率晶體管尺寸、調整補償網絡并選擇合適偏置電壓,以使相位裕度、線路調整率、負載調整率、靜態電流、電源抑制比和瞬態響應六個指標同時符合規格。
經驗豐富的模擬電路設計師通常需要花費數天時間才能完成此類項目。研究人員將MiMo-V2.5-Pro連接到ngspice仿真循環中,并使用Claude Code作為仿真框架,經過大約一個小時的閉環迭代,其就生成了一個滿足所有目標指標的設計,并且下面顯示的四個指標比其初始版本提高了一個數量級:
![]()
二、MiMo-V2.5:能聽能看能讀,負責通用智能體場景
MiMo-V2.5是專為智能體場景打造的原生全模態模型,能通過同時看、聽、讀,并根據感知到的信息采取行動。
該模型此次有兩個關鍵升級點:Agent能力全面超越MiMo-V2-Pro、多模態感知全面超越MiMo-V2-Omni,MiMo-V2-Pro是小米MiMo系列上一代旗艦基座大模型、MiMo-V2-Omni是上一代全模態Agent模型。
其中,在面向AI智能體的端到端可信評測基準Claw-Eval中,MiMo-V2.5表現超過MiMo-V2-Pro,同時API成本降低約50%;在關于跨模態推理、視頻理解、圖表分析等的基準測試VideoMME、CharXiv、MMMU-Pro等評測中,MiMo-V2.5表現逼近甚至超越了Claude Opus 4.6、Gemini 3 Pro、GPT-5.4等閉源模型。
![]()
在編程方面,小米內部的MiMo編程基準測試顯示,MiMo-V2.5在日常編程任務中超越了Gemini 3.1 Pro,與Claude Opus 4.6仍有明顯差距。
![]()
三、Token Plan:夜間專屬時段可享8倍優惠,包年訂閱至高可減近1000元
伴隨MiMo-V2.5系列發布,小米還同步優化了其訂閱式API調用套餐MiMo Token Plan,該計劃允許用戶使用MiMo系列8款模型,分別是旗艦推理模型MiMo-V2-Pro、MiMo-V2.5-Pro,全能多模態模型MiMo-V2-Omni、MiMo-V2.5,語音合成模型MiMo-V2-TTS、MiMo-V2.5-TTS、MiMo-V2.5-TTS-VoiceClone、MiMo-V2.5-TTS-VoiceDesign,后三個模型待發布。
首先是Credits速率更新、更優惠,取消1 Token=4 Credits計費方式,且不再區分256k和1M上下文窗口的Credit倍率。
新模型的Credits計費方式為:
MiMo-V2.5:1x(消耗1 Token=1 Credit)
MiMo-V2.5-Pro:2x(消耗1 Token=2 Credits)
作為對比,MiMo Token Plan剛發布時的計費方式為:
![]()
此外,MiMo Token Plan還會提供夜間專屬優惠速率,每天00:00~08:00,所有模型Credits消耗速率在原有基礎上再打8折。
在付費模式上,其此前預告的連續包月、包年訂閱也已上線。連續包月中,老用戶開通自動續費享次月7折,新用戶享次月77折,包年訂閱中,一次訂閱享全年88折,包年至高可減948.96元。
![]()
截至北京時間4月22日22:00前,所有已購買Token Plan用戶Credits額度將全部重置清零,但不重置套餐計時。
![]()
結語:小米再發力,跑通終端系統級原生智能體?
小米MiMo V2.5系列的升級圍繞著智能體場景性能提升及更高Token效率兩大關鍵,其在保障長鏈推理、工具調用、多任務協同等核心智能體性能的同時,大幅提升Token使用效率,降低算力與推理成本,或證明輕量化模型既能實現媲美超大模型的智能體表現,又能兼顧實用與普惠。
此次,小米MiMo旗艦模型再升級,也意味著其作為終端硬件廠商,正將自研底層大模型、系統級權限、全生態服務進行深度綁定與融合,打造真正意義上的系統級原生智能體,加速其人車家全場景AI的規模化落地。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.