![]()
經濟觀察報記者 鄭晨燁
2025年底,全球最大的AI模型聚合平臺OpenRouter發(fā)布的年度使用報告顯示,在其用戶構成中,47%來自美國,中國開發(fā)者占6%。此外,平臺調用內容中,英語占比83%,中文不足5%。
截至2026年4月3日當周,該平臺調用量排名前十的模型中,有6個來自中國。按調用量從高到低依次為:小米MiMo-V2-Pro、階躍星辰Step3.5Flash、MiniMaxM2.7、DeepSeekV3.2、智譜GLM5Turbo和MiniMaxM2.5。其中,小米MiMo-V2-Pro以4.82萬億Token(詞元)位居全平臺第一。
事實上,自2026年2月9日至15日,當周中國模型調用量首次超過美國以來,中國模型的領先已持續(xù)近兩個月。
OpenRouter平臺匯聚了超過400個AI模型,覆蓋60多家供應商,其調用量的數(shù)據(jù)被視為觀察全球開發(fā)者模型選擇偏好的窗口之一。開發(fā)者可通過同一APIKey(一種用于驗證身份和調用服務的密鑰)在不同模型間隨時切換。
OpenRouter聯(lián)合創(chuàng)始人兼 COOChrisClark在2026年2月公開表示,中國開源模型在美國企業(yè)運行的Agent(智能體)工作流中占比“不成比例的高”。同時,開發(fā)者社區(qū)中圍繞模型間任務分配與成本優(yōu)化的討論也日益增多。
有觀點將這一現(xiàn)象與30年前的中國制造業(yè)類比:當時中國憑借成本優(yōu)勢切入全球電子產業(yè)鏈的組裝環(huán)節(jié),產生了富士康、立訊精密等代工企業(yè);如今,中國大模型也正以價格優(yōu)勢切入全球AI產業(yè)鏈的執(zhí)行環(huán)節(jié)。也有觀點將國產大模型視為“AI時代的富士康”。
國產大模型在AI產業(yè)鏈中扮演何種角色?該角色的含金量究竟有多高?
價格優(yōu)勢
經濟觀察報記者梳理各廠商截至2026年3月底的官方API定價發(fā)現(xiàn),中美主流大模型的價格存在巨大差距。
以輸入價格為例,中國模型中,DeepSeekV3.2為每百萬Token0.28美元,MiniMaxM2.5為0.3美元,月之暗面KimiK2.5為0.42美元。美國模型中,An-thropicClaudeOpus4.6為5美元,OpenAIGPT-5.4為2.50美元。美國主流模型的輸入價格約為中國主流模型的10至20倍。
輸出價格差距更為明顯。中國模型方面,DeepSeekV3.2為每百萬Token0.42美元,MiniMaxM2.5為1.1美元,月之暗面KimiK2.5為2.2美元。美國模型方面,OpenAIGPT-5.4為15美元,ClaudeOpus4.6為25美元。中美主流模型輸出價格差距約為7倍至60倍。
上述價差一直存在,此前未引發(fā)大規(guī)模用戶遷移,原因很簡單,大多數(shù)人用AI的主要場景就是聊天,Token消耗量較低,價差影響甚微。
但2026年初,一只“龍蝦”的出現(xiàn)改變了這一切。
開源工具OpenClaw(開發(fā)者社區(qū)稱為“龍蝦”)于2026年2月前后迅速走紅,上線后很快登頂OpenRouter應用排行榜第一,單周消耗超6000億To-ken。“龍蝦”屬于智能體應用,和過去“你問我答”的聊天模式不同,它可使AI在電腦上自主執(zhí)行編程、測試、文件管理等任務,無需逐步人工干預。
在這種工作模式下,Token消耗量與聊天場景不在一個量級。
比如,一個編程任務可能需要經歷幾十輪“寫代碼—運行—報錯—修改—再運行”的循環(huán),每一輪都是一次完整的模型調用。為了讓智能體記住此前的操作,每次調用還需要調用對話歷史。
有開發(fā)者在社交平臺上表示,一個活躍的OpenClaw會話上下文很容易膨脹到23萬Token以上。若全程使用ClaudeAPI,月費用可能在800至1500美元之間。也有用戶稱,一個配置不當?shù)淖詣踊蝿眨惶炀蜔袅?00美元。
以OpenClaw為代表的智能體應用推高了整個平臺Token消耗量。比如,2025年3月3日至9日當周,OpenRouter前十大模型周調用量總計1.24萬億Token。至2026年2月16日至22日當周,僅前十大模型周調用量就超過了8.7萬億Token,增長近7倍。編程任務在平臺Token消耗中的占比也從2025年初的11%升至2025年底的50%以上。
當單次任務Token消耗從幾千增至幾十萬,中美模型間的價格差距從可忽略的成本轉變?yōu)槊吭聰?shù)百甚至上千美元的顯著差異。
2026年2月19日前后,美國大模型公司Anthropic更新服務條款,禁止用戶將Claude訂閱賬號憑證接入OpenClaw等第三方工具,要求通過API按量計費。隨后Google也推出類似限制。對于每天需頻繁調用API的智能體應用,模型選擇中的價格因素成為繞不過去的問題,開發(fā)者被推上了按量付費的賽道。
在智能體核心的編程場景上,中美模型能力已較為接近。
SWE-BenchVerified是由普林斯頓大學研究團隊維護的一項編程能力公開評測,做法是讓AI模型去修復GitHub(全球最大的開源代碼托管平臺)上真實的代碼問題。根據(jù)該評測公開排行榜的數(shù)據(jù),2026年2月13日發(fā)布的中國模型MiniMaxM2.5拿到了80.2%,2月5日發(fā)布的美國模型 ClaudeOpus4.6為80.8%,兩者差距只有0.6個百分點。
在能力相近而價格懸殊的情況下,開發(fā)者的選擇迅速反映在了數(shù)據(jù)上。
2026年2月9日至15日當周,中國模型Token調用量達4.12萬億,首次超過美國模型的2.94萬億。隨后一周,中國模型調用量升至5.16萬億,三周時間增長127%。同期美國模型調用量降至2.7萬億。
中國大模型為什么能比美國大模型便宜這么多?
工信部信息通信經濟專家委員會委員盤和林向經濟觀察報表示,原因主要有兩點:一是中國算力基礎設施規(guī)模大、復用率高,報價較低;二是中國算力集群中存在大量自建算力,獲取成本低于海外。
此外,技術路線也影響成本。有業(yè)內人士告訴記者,目前主流中國大模型普遍采用MoE架構,也稱為“混合專家模型”。通俗地說,一個MoE模型雖然參數(shù)總量很大,但每次運行時只激活其中一小部分參數(shù)來處理任務,而不是全體參數(shù),這大幅降低了每次推理所需的計算量。
不同路徑
硅谷風投機構 a16z合伙人MartinCasado在2025年底表示,在使用開源技術棧的AI初創(chuàng)公司中,約80%的公司使用中國模型。他隨后在社交平臺上補充說明,這并非指80%的美國AI初創(chuàng)公司都在使用中國模型,而是那些選擇開源技術路線的公司中(約占全部美國AI初創(chuàng)公司的20%至30%),約80%使用了中國模型。
記者注意到,GitHub上已出現(xiàn)多個幫助開發(fā)者在不同模型間優(yōu)化成本的開源工具。其思路多為將任務按難度分級,簡單任務交由免費或低價的中國模型處理,復雜任務再調用高價美國模型。
其中一個名為ClawRouter的項目在文檔中給出了對比數(shù)據(jù),顯示采用這種搭配方式后,平均成本從每百萬Token25美元降到了約為2美元。Anthropic的產品ClaudeCode,在官方文檔中也采用了類似的分層設計,默認用最便宜的模型處理日常任務。
這種模式能夠成立的前提是中國模型在執(zhí)行類任務上能力足夠。在編程方面,前面提到的SWE-Bench數(shù)據(jù)已經說明了這一點。而在編程之外,中美大模型整體能力差距有多大呢?
LMSYSChatbotArena是目前全球公認度最高的AI模型評測平臺之一,其做法是讓真人用戶在不知道模型名字的情況下同時試用兩個模型,然后投票選出更好的那個,相當于一場AI之間的盲品測試。
在其截至2026年3月25日的綜合排名中,前五名均為美國公司模型,中國模型中排名最高的DeepSeekV3.2Speciale位列第六。在專門測試復雜推理能力的HardPrompts(高難度提示詞,專門用于測試模型處理復雜推理和多步邏輯任務的能力)類別中,中美模型的差距更為明顯,第一梯隊仍主要為美國模型。
編程能力接近、復雜推理尚有差距,這是當下中美大模型之間差異化能力的體現(xiàn),也是“分層調用”這套做法成立的基礎。
不過,和30年前被鎖在低利潤率的代工廠商不同,中國大模型廠商在價格上并沒有一直往下走。
事實上,從2024年開始,中國大模型行業(yè)曾發(fā)生過一輪價格戰(zhàn):2024年5月,字節(jié)跳動旗下火山引擎豆包大模型以0.0008元/千Token的價格引發(fā)“價格戰(zhàn)”,阿里云、百度智能云相繼跟進。此后近一年,行業(yè)經歷Token價格下降超過90%的階段,部分廠商推理算力毛利率一度為負。
廠商當時的策略是以虧損換取規(guī)模,培養(yǎng)用戶調用習慣。然而,2026年2月OpenClaw走紅后,Token消耗量增速遠超預期,算力供給趨緊。
智譜最先做出反應,2026年2月12日發(fā)布新模型GLM-5時上調API定價,3月16日發(fā)布GLM-5-Turbo時再次提價,兩輪累計漲幅83%。
智譜CEO張鵬在2025年度業(yè)績說明會上表示,2026年一季度API調用定價提升83%,調用量增長400%。根據(jù)年報,智譜2025年全年收入 7.243億元,同比增長132%,MaaS(模型即服務)平臺年度經常性收入約為17億元,12個月增長60倍。
選擇漲價的不只智譜一家。2026年3月13日,騰訊云調整了混元系列大模型定價,部分模型漲幅超460%。3月18日,阿里云與百度智能云同日發(fā)布調價公告,AI算力相關產品漲幅在5%至34%之間,新價格于4月18日生效。
中科曙光高級副總裁李斌在接受經濟觀察報采訪時稱,算力系統(tǒng)評價指標正在發(fā)生改變,過去衡量一個系統(tǒng)的標準是看它有多少算力,現(xiàn)在則要看它能夠多么經濟地產出Token。
從集體降價到集體漲價,轉變只用了不到兩年。
2026年3月,國家數(shù)據(jù)局局長劉烈宏在中國發(fā)展高層論壇上公布了一組數(shù)字:中國日均Token調用量已突破140萬億,較兩年前增長超過1000倍。
在同月的GTC大會上,英偉達創(chuàng)始人黃仁勛稱,Token將是未來數(shù)字世界最核心的大宗商品。
在盤和林看來,中國大模型的競爭力很強,不是在補全,而是在引領,尤其在AI應用端。但他同時表示,中國在原創(chuàng)性創(chuàng)新上還有提升空間,當前AI體系中的核心架構,從人工神經網絡到注意力機制,都是海外率先提出、國內跟進迭代。中國大模型下一步需要在應用端繼續(xù)發(fā)力的同時,在基礎算法上展開原創(chuàng)性創(chuàng)新。
30年前的消費電子代工產業(yè)有一個特點,組裝環(huán)節(jié)的利潤率被上游品牌商牢牢壓住,不少頭部的代工廠發(fā)展至今的毛利率都沒有超過10%。成本優(yōu)勢帶來了訂單,但未能帶來定價權。
當前,中國大模型的處境看起來與當年的消費電子代工產業(yè)有幾分相似,但在定價權方面似乎又頗有不同。例如,智譜漲價83%之后,調用量增長了400%。阿里云、百度智能云、騰訊云在2026年3月集體上調了AI算力和模型服務的價格,需求并沒有萎縮,調用量在持續(xù)增長。
在SWE-Bench編程評測上,頭部中國模型和頭部美國模型的差距已經縮小到不足1個百分點。兩者在復雜推理上的差距還在,但這個差距也在快速收窄。
此次,中國大模型廠商的發(fā)展路徑似乎有所不同。
(作者 鄭晨燁)
免責聲明:本文觀點僅代表作者本人,供參考、交流,不構成任何建議。
![]()
鄭晨燁
資深記者。關注新能源、半導體、智能汽車等新產業(yè)領域,有線索歡迎聯(lián)系:zhengchenye@eeo.com.cn,微信:zcy096x。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.