網易首頁 > 網易號 > 正文申請入駐

小米不想“賤賣”token

2026-04-12 10:10:21　來源: 人人都是產品經理社區

廣東舉報

分享至

小米MiMo大模型推出最高659元/月的訂閱套餐，直接對標Anthropic Claude，并宣布日調用量破萬億。不同于行業通用的“無限制訂閱”，MiMo采用“Token配額制”以解決Agent濫用導致的成本倒掛，明確拒絕“賤賣Token”。這標志著小米正試圖打破手機廠商僅將AI作為生態附庸的慣例，走上一條更為激進的獨立基座模型運營之路。

———— / BEGIN / ————

最近，小米宣布MiMo大模型面向全球開發者推出Token Plan訂閱套餐，雷軍親自發微博官宣：Max檔659元/月，面向國際開發者定價100美元/月，與Anthropic Claude Max 5x相同。同一天，雷軍發文稱MiMo大模型前一日調用量突破1萬億Token。

作為一家從手機做到汽車，制造業基因極強的公司，如今把大模型訂閱套餐價格直接錨定全球AI第一梯隊，這在行業里還是唯一一家，也引起了不少的爭議。仔細看，Mimo Token Plan的訂閱制，和大模型行業慣用的訂閱制還有一些根本上的不同。

羅福莉的發聲，不踩Anthropic踩過的坑？

MiMo Token Plan發布三天后，Anthropic宣布禁止Claude Pro和Max訂閱用戶通過OpenClaw等第三方Agent框架調用。

MiMo大模型負責人羅福莉隨即在社交平臺發布長文，詳細分析了這件事。

她首先解釋了Anthropic的困境。Claude的訂閱制（Pro 20美元/月，Max 100-200美元/月）原本是為個人用戶的正常使用強度設計的，但OpenClaw等Agent框架的調用模式完全不同：在單個用戶查詢中，框架會以獨立API請求的形式發出多輪低價值的工具調用，每個請求都包含超過10萬Token的上下文窗口，即使命中緩存，這也是一種浪費，在極端情況下還會拉低其他查詢的緩存命中率。

她表示：“實際每次查詢的請求數比Claude Code自身的框架高出數倍。換算成API定價，實際成本可能是訂閱價格的幾十倍。這可不是小差距，而是天壤之別。”

換句話說，Claude訂閱制的本質問題是：固定月費無法覆蓋Agent場景下的實際算力消耗。用戶付200美元，卻用掉了幾千美元的計算資源。

羅福莉由此引出MiMo Token Plan的設計邏輯。她說，Token Plan支持第三方框架接入，但按Token配額計費，“與Claude新推出的額外使用套餐的邏輯相同”。這意味著用戶用多少付多少，不會出現訂閱制下“薅羊毛式”的成本倒掛。“我們的目標是長期穩定地交付高質量的模型和服務，而不是讓你沖動付費后就棄用。”

她也扮演了一次行業定價的“吹哨人”角色：“我建議LLM公司在弄清楚如何在不造成資金流失的情況下為Coding方案定價之前，不要盲目地競相壓低價格。以極低的價格出售Token，同時對第三方敞開大門，這看起來對用戶很有吸引力，但這卻是一個陷阱——Anthropic剛剛擺脫的那個陷阱。”

這篇帖子瀏覽量超過71萬，引發了大量討論。有開發者認同她對OpenClaw上下文管理低效的判斷，有人指出Anthropic此舉本質上是在保護自家Claude Code的護城河，也有人對MiMo Token Plan本身的Credit換算機制提出質疑。

現實的挑戰

100美元的定價有一定的合理性。MiMo-V2-Pro的API價格（輸入1美元/百萬Token，輸出3美元）約為Claude同級模型的五分之一，在性價比上確實有競爭力。兩周免費推廣期間，MiMo-V2-Pro在OpenRouter上單周Token消耗量突破4萬億，日榜、周榜、月榜均排名第一，編程領域市占率一度超過30%。

但挑戰來得很快。

免費期結束后，MiMo-V2-Pro在OpenRouter上的周調用量從高峰下滑。OpenRouter上的規律比較直接，在達到一定性能閾值后，誰便宜或免費，誰就有可能沖到榜一。它的排名證明了模型能力和可用性，但是同時，調用量受是否免費的影響巨大。

MiMo Token Plan四檔方案從39元/月到659元/月，Max檔國際定價100美元/月。按Credit換算，MiMo-V2-Pro消耗1 Token等于2 Credits，Max檔1600M Credits約等于800M Token的Pro模型調用量。

這個價格對標的是Anthropic Claude Max 5x套餐（100美元/月），后者提供Pro版5倍的使用額度。MiMo Token Plan沒有行業普遍存在的5小時使用限額，支持集中消耗Token。

開發者社區的爭議也不少。有用戶在社交網絡上拆解了小米Token Plan的實際消耗：由于Credit倍率機制（Pro模型1 Token消耗2 Credits，超過256K上下文則消耗4 Credits），加上Agent框架大量使用緩存Token，入門套餐的實際可用量遠低于字面數字。

也有開發者反饋MiMo-V2-Pro在復雜推理上偶爾出現“無限循環”，以及內容審核系統誤攔截正常API調用的問題。

騰訊科技向小米官方求證， Credits到底如何折算為不同模型、不同上下文長度下的真實 token使用量，是否有完整公開的計算邏輯？但截至發稿，未得到官方的回應。

但是從羅福莉的公開發聲來看，對“大模型訂閱制”算不清賬的問題已經提出了質疑，不“賤賣Token”，希望用健康的現金流來換取模型能力的穩定迭代、用戶的持續使用，是基本態度。

圖：免費期結束后，MiMo-V2-Pro在OpenRouter上的周調用量從高峰下滑

理想很豐滿。但是，從免費到付費的轉換率，是所有大模型公司面臨的共同難題。從免費到付費切換的過程，也往往會面臨最大的爭議，MiMo能否在付費的前提下保持用戶黏性，是接下來幾周最值得觀察的數據點。

唯一還在做基座大模型的手機廠商？

在小米高調推自己的大模型的同時，也引出了一個疑問，大模型業務之于小米，到底意味著什么？

回到更早的時間線。2023年，雷軍推動成立大模型Core團隊。同年5月，根據媒體的公開報道，小米曾公開表示“小米不會做ChatGPT，不搞AI的軍備競賽”。

但小米的態度在悄悄發生轉變。

2025年4月，MiMo-7B開源；11月，前DeepSeek研究員羅福莉加入，出任大模型負責人；12月發布MiMo-V2-Flash。2026年3月19日凌晨，三款模型同步發布：萬億參數的MiMo-V2-Pro、全模態的Omni和語音合成TTS。發布前，Pro的早期版本以“Hunter Alpha”代號匿名上線OpenRouter，七天突破1萬億Token調用量，一度被社區猜測為“DeepSeek V4”。不到一年，小米的大模型從7B參數走到了萬億參數。

據接近小米的人士透露，小米內部開始認為“大模型是未來科技公司必須要有的能力。小米未來所有產品端的能力，需要有一個主模型去控制、去培養、去指導。這個主模型必須是自己的。因為只有自己擁有，才能決定你的用戶習慣、你的輸入數據不交給第三方。”

手機、汽車、IoT設備產生的海量用戶數據是最核心的資產，如果基座模型依賴第三方，數據主權和產品迭代節奏都將受制于人。

從組織架構看，大模型Core團隊歸屬小米集團技術委員會，不隸屬于手機部或汽車部。據了解，小米副總裁曲恒負責管理這條線，但羅福莉擁有很高的獨立性，她加入后按照自己的想法組建了團隊，核心成員平均年齡25歲，清北畢業生占比超六成。團隊運作有較高的自主性。

從財報及管理層對外發聲也可以看出，研發投入規模也在快速攀升。小米2025年全年研發開支331億元，同比增長37.8%，接近全年經調整凈利潤392億元。據小米總裁盧偉冰在業績會上的表述，AI投入約占研發總額的四分之一。

雷軍在MiMo-V2-Pro發布當天宣布，2026年小米在AI領域的研發和資本投入將超過160億元，未來三年至少600億元。資本開支方面，2025年前三季度累計約130億元，同比增長86.7%，盧偉冰明確表示增量主要來自汽車和AI。算力上，小米采取自建萬卡GPU集群加金山云合作的混合模式。

從行業橫向對比來看，小米的選擇是孤獨的。華為盤古大模型主要通過鴻蒙系統實現端云協同，vivo藍心大模型服務于OriginOS的AI助手，OPPO安第斯大模型升級了小布助手，榮耀走AI終端生態路線。這些廠商的大模型都是“AI服務于手機”，沒有一家獨立運營API平臺或對外售賣模型訂閱。包括蘋果、三星在內的全球手機巨頭，也沒有對外直接提供服務的基座大模型。

vivo副總裁周圍的公開表態也許可以代表了多數廠商的態度：未來手機可能進化為“智能體”，但實現路徑不一定需要自研基座模型，接入第三方大模型同樣可以。

大模型成為又一個主線業務？

從種種公開信息來看，大模型之于小米集團，正在發生一些微妙但關鍵的變化：它不只是一個服務于手機和IoT的底層能力，開始具備向一條獨立業務線演進的結構性條件。最直觀的信號，是產品形態的變化。

小米已經推出了面向開發者的API平臺，并配套提供分層的Token訂閱方案。無論規模大小，這一步本身，就已經越過了傳統“技術中臺”的邊界。

雷軍曾在公開場合明確提出，小米計劃在2026年實現一次關鍵性的技術整合：在一款終端產品中，讓自研芯片、操作系統與AI大模型完成協同落地。

至今為止，能同時覆蓋這三層能力的公司并不多。華為通過麒麟芯片、鴻蒙系統與盤古模型，已經形成過相對完整的技術閉環；蘋果公司則長期在芯片與操作系統上建立深度一體化，并正在強化其端側AI能力。

小米如果完成這一組合，也許能進入一個截然不同的競爭維度。

但如果把視角拉回財報，情況又顯得克制得多。

根據披露，小米將AI相關業務與智能電動汽車一同歸入“創新業務”板塊。2025年，該板塊收入為1061億元，其中汽車貢獻了約1033億元，AI相關收入尚未被單獨披露。產品和形態已經在向獨立業務靠攏，但公開財務信息上還未完成驗證。

當小米將高階訂閱方案定在與Claude相近的區間，并開始質疑行業普遍推行的訂閱制的時候，目的可能未必在于“價格競爭”。通過錨定頭部模型，主動進入同一層級的市場敘事，證明“上桌的能力”可能更為重要。

本文來自公眾號：騰訊科技作者：曉靜編輯：徐青陽

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.