小米MiMo大模型推出最高659元/月的訂閱套餐,直接對標Anthropic Claude,并宣布日調用量破萬億。不同于行業通用的“無限制訂閱”,MiMo采用“Token配額制”以解決Agent濫用導致的成本倒掛,明確拒絕“賤賣Token”。這標志著小米正試圖打破手機廠商僅將AI作為生態附庸的慣例,走上一條更為激進的獨立基座模型運營之路。
———— / BEGIN / ————
最近,小米宣布MiMo大模型面向全球開發者推出Token Plan訂閱套餐,雷軍親自發微博官宣:Max檔659元/月,面向國際開發者定價100美元/月,與Anthropic Claude Max 5x相同。同一天,雷軍發文稱MiMo大模型前一日調用量突破1萬億Token。
作為一家從手機做到汽車,制造業基因極強的公司,如今把大模型訂閱套餐價格直接錨定全球AI第一梯隊,這在行業里還是唯一一家,也引起了不少的爭議。仔細看,Mimo Token Plan的訂閱制,和大模型行業慣用的訂閱制還有一些根本上的不同。
羅福莉的發聲,不踩Anthropic踩過的坑?
MiMo Token Plan發布三天后,Anthropic宣布禁止Claude Pro和Max訂閱用戶通過OpenClaw等第三方Agent框架調用。
MiMo大模型負責人羅福莉隨即在社交平臺發布長文,詳細分析了這件事。
她首先解釋了Anthropic的困境。Claude的訂閱制(Pro 20美元/月,Max 100-200美元/月)原本是為個人用戶的正常使用強度設計的,但OpenClaw等Agent框架的調用模式完全不同:在單個用戶查詢中,框架會以獨立API請求的形式發出多輪低價值的工具調用,每個請求都包含超過10萬Token的上下文窗口,即使命中緩存,這也是一種浪費,在極端情況下還會拉低其他查詢的緩存命中率。
她表示:“實際每次查詢的請求數比Claude Code自身的框架高出數倍。換算成API定價,實際成本可能是訂閱價格的幾十倍。這可不是小差距,而是天壤之別。”
換句話說,Claude訂閱制的本質問題是:固定月費無法覆蓋Agent場景下的實際算力消耗。用戶付200美元,卻用掉了幾千美元的計算資源。
羅福莉由此引出MiMo Token Plan的設計邏輯。她說,Token Plan支持第三方框架接入,但按Token配額計費,“與Claude新推出的額外使用套餐的邏輯相同”。這意味著用戶用多少付多少,不會出現訂閱制下“薅羊毛式”的成本倒掛。“我們的目標是長期穩定地交付高質量的模型和服務,而不是讓你沖動付費后就棄用。”
她也扮演了一次行業定價的“吹哨人”角色:“我建議LLM公司在弄清楚如何在不造成資金流失的情況下為Coding方案定價之前,不要盲目地競相壓低價格。以極低的價格出售Token,同時對第三方敞開大門,這看起來對用戶很有吸引力,但這卻是一個陷阱——Anthropic剛剛擺脫的那個陷阱。”
這篇帖子瀏覽量超過71萬,引發了大量討論。有開發者認同她對OpenClaw上下文管理低效的判斷,有人指出Anthropic此舉本質上是在保護自家Claude Code的護城河,也有人對MiMo Token Plan本身的Credit換算機制提出質疑。
![]()
現實的挑戰
100美元的定價有一定的合理性。MiMo-V2-Pro的API價格(輸入1美元/百萬Token,輸出3美元)約為Claude同級模型的五分之一,在性價比上確實有競爭力。兩周免費推廣期間,MiMo-V2-Pro在OpenRouter上單周Token消耗量突破4萬億,日榜、周榜、月榜均排名第一,編程領域市占率一度超過30%。
但挑戰來得很快。
免費期結束后,MiMo-V2-Pro在OpenRouter上的周調用量從高峰下滑。OpenRouter上的規律比較直接,在達到一定性能閾值后,誰便宜或免費,誰就有可能沖到榜一。它的排名證明了模型能力和可用性,但是同時,調用量受是否免費的影響巨大。
MiMo Token Plan四檔方案從39元/月到659元/月,Max檔國際定價100美元/月。按Credit換算,MiMo-V2-Pro消耗1 Token等于2 Credits,Max檔1600M Credits約等于800M Token的Pro模型調用量。
這個價格對標的是Anthropic Claude Max 5x套餐(100美元/月),后者提供Pro版5倍的使用額度。MiMo Token Plan沒有行業普遍存在的5小時使用限額,支持集中消耗Token。
開發者社區的爭議也不少。有用戶在社交網絡上拆解了小米Token Plan的實際消耗:由于Credit倍率機制(Pro模型1 Token消耗2 Credits,超過256K上下文則消耗4 Credits),加上Agent框架大量使用緩存Token,入門套餐的實際可用量遠低于字面數字。
也有開發者反饋MiMo-V2-Pro在復雜推理上偶爾出現“無限循環”,以及內容審核系統誤攔截正常API調用的問題。
騰訊科技向小米官方求證, Credits到底如何折算為不同模型、不同上下文長度下的真實 token使用量,是否有完整公開的計算邏輯?但截至發稿,未得到官方的回應。
但是從羅福莉的公開發聲來看,對“大模型訂閱制”算不清賬的問題已經提出了質疑,不“賤賣Token”,希望用健康的現金流來換取模型能力的穩定迭代、用戶的持續使用,是基本態度。
![]()
圖:免費期結束后,MiMo-V2-Pro在OpenRouter上的周調用量從高峰下滑
理想很豐滿。但是,從免費到付費的轉換率,是所有大模型公司面臨的共同難題。從免費到付費切換的過程,也往往會面臨最大的爭議,MiMo能否在付費的前提下保持用戶黏性,是接下來幾周最值得觀察的數據點。
唯一還在做基座大模型的手機廠商?
在小米高調推自己的大模型的同時,也引出了一個疑問,大模型業務之于小米,到底意味著什么?
回到更早的時間線。2023年,雷軍推動成立大模型Core團隊。同年5月,根據媒體的公開報道,小米曾公開表示“小米不會做ChatGPT,不搞AI的軍備競賽”。
但小米的態度在悄悄發生轉變。
2025年4月,MiMo-7B開源;11月,前DeepSeek研究員羅福莉加入,出任大模型負責人;12月發布MiMo-V2-Flash。2026年3月19日凌晨,三款模型同步發布:萬億參數的MiMo-V2-Pro、全模態的Omni和語音合成TTS。發布前,Pro的早期版本以“Hunter Alpha”代號匿名上線OpenRouter,七天突破1萬億Token調用量,一度被社區猜測為“DeepSeek V4”。不到一年,小米的大模型從7B參數走到了萬億參數。
據接近小米的人士透露,小米內部開始認為“大模型是未來科技公司必須要有的能力。小米未來所有產品端的能力,需要有一個主模型去控制、去培養、去指導。這個主模型必須是自己的。因為只有自己擁有,才能決定你的用戶習慣、你的輸入數據不交給第三方。”
手機、汽車、IoT設備產生的海量用戶數據是最核心的資產,如果基座模型依賴第三方,數據主權和產品迭代節奏都將受制于人。
從組織架構看,大模型Core團隊歸屬小米集團技術委員會,不隸屬于手機部或汽車部。據了解,小米副總裁曲恒負責管理這條線,但羅福莉擁有很高的獨立性,她加入后按照自己的想法組建了團隊,核心成員平均年齡25歲,清北畢業生占比超六成。團隊運作有較高的自主性。
從財報及管理層對外發聲也可以看出,研發投入規模也在快速攀升。小米2025年全年研發開支331億元,同比增長37.8%,接近全年經調整凈利潤392億元。據小米總裁盧偉冰在業績會上的表述,AI投入約占研發總額的四分之一。
雷軍在MiMo-V2-Pro發布當天宣布,2026年小米在AI領域的研發和資本投入將超過160億元,未來三年至少600億元。資本開支方面,2025年前三季度累計約130億元,同比增長86.7%,盧偉冰明確表示增量主要來自汽車和AI。算力上,小米采取自建萬卡GPU集群加金山云合作的混合模式。
從行業橫向對比來看,小米的選擇是孤獨的。華為盤古大模型主要通過鴻蒙系統實現端云協同,vivo藍心大模型服務于OriginOS的AI助手,OPPO安第斯大模型升級了小布助手,榮耀走AI終端生態路線。這些廠商的大模型都是“AI服務于手機”,沒有一家獨立運營API平臺或對外售賣模型訂閱。包括蘋果、三星在內的全球手機巨頭,也沒有對外直接提供服務的基座大模型。
vivo副總裁周圍的公開表態也許可以代表了多數廠商的態度:未來手機可能進化為“智能體”,但實現路徑不一定需要自研基座模型,接入第三方大模型同樣可以。
大模型成為又一個主線業務?
從種種公開信息來看,大模型之于小米集團,正在發生一些微妙但關鍵的變化:它不只是一個服務于手機和IoT的底層能力,開始具備向一條獨立業務線演進的結構性條件。最直觀的信號,是產品形態的變化。
小米已經推出了面向開發者的API平臺,并配套提供分層的Token訂閱方案。無論規模大小,這一步本身,就已經越過了傳統“技術中臺”的邊界。
雷軍曾在公開場合明確提出,小米計劃在2026年實現一次關鍵性的技術整合:在一款終端產品中,讓自研芯片、操作系統與AI大模型完成協同落地。
至今為止,能同時覆蓋這三層能力的公司并不多。華為通過麒麟芯片、鴻蒙系統與盤古模型,已經形成過相對完整的技術閉環;蘋果公司則長期在芯片與操作系統上建立深度一體化,并正在強化其端側AI能力。
小米如果完成這一組合,也許能進入一個截然不同的競爭維度。
但如果把視角拉回財報,情況又顯得克制得多。
根據披露,小米將AI相關業務與智能電動汽車一同歸入“創新業務”板塊。2025年,該板塊收入為1061億元,其中汽車貢獻了約1033億元,AI相關收入尚未被單獨披露。產品和形態已經在向獨立業務靠攏,但公開財務信息上還未完成驗證。
當小米將高階訂閱方案定在與Claude相近的區間,并開始質疑行業普遍推行的訂閱制的時候,目的可能未必在于“價格競爭”。通過錨定頭部模型,主動進入同一層級的市場敘事,證明“上桌的能力”可能更為重要。
本文來自公眾號:騰訊科技 作者:曉靜 編輯:徐青陽
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.