網易首頁 > 網易號 > 正文申請入駐

國產大模型：這次劇本不一樣

2026-04-04 13:16:04　來源: 經濟觀察報

北京舉報

分享至

經濟觀察報記者鄭晨燁

2025年底，全球最大的AI模型聚合平臺OpenRouter發(fā)布的年度使用報告顯示，在其用戶構成中，47%來自美國，中國開發(fā)者占6%。此外，平臺調用內容中，英語占比83%，中文不足5%。

截至2026年4月3日當周，該平臺調用量排名前十的模型中，有6個來自中國。按調用量從高到低依次為：小米MiMo-V2-Pro、階躍星辰Step3.5Flash、MiniMaxM2.7、DeepSeekV3.2、智譜GLM5Turbo和MiniMaxM2.5。其中，小米MiMo-V2-Pro以4.82萬億Token（詞元）位居全平臺第一。

事實上，自2026年2月9日至15日，當周中國模型調用量首次超過美國以來，中國模型的領先已持續(xù)近兩個月。

OpenRouter平臺匯聚了超過400個AI模型，覆蓋60多家供應商，其調用量的數(shù)據(jù)被視為觀察全球開發(fā)者模型選擇偏好的窗口之一。開發(fā)者可通過同一APIKey（一種用于驗證身份和調用服務的密鑰）在不同模型間隨時切換。

OpenRouter聯(lián)合創(chuàng)始人兼 COOChrisClark在2026年2月公開表示，中國開源模型在美國企業(yè)運行的Agent（智能體）工作流中占比“不成比例的高”。同時，開發(fā)者社區(qū)中圍繞模型間任務分配與成本優(yōu)化的討論也日益增多。

有觀點將這一現(xiàn)象與30年前的中國制造業(yè)類比：當時中國憑借成本優(yōu)勢切入全球電子產業(yè)鏈的組裝環(huán)節(jié)，產生了富士康、立訊精密等代工企業(yè)；如今，中國大模型也正以價格優(yōu)勢切入全球AI產業(yè)鏈的執(zhí)行環(huán)節(jié)。也有觀點將國產大模型視為“AI時代的富士康”。

國產大模型在AI產業(yè)鏈中扮演何種角色？該角色的含金量究竟有多高？

價格優(yōu)勢

經濟觀察報記者梳理各廠商截至2026年3月底的官方API定價發(fā)現(xiàn)，中美主流大模型的價格存在巨大差距。

以輸入價格為例，中國模型中，DeepSeekV3.2為每百萬Token0.28美元，MiniMaxM2.5為0.3美元，月之暗面KimiK2.5為0.42美元。美國模型中，An－thropicClaudeOpus4.6為5美元，OpenAIGPT-5.4為2.50美元。美國主流模型的輸入價格約為中國主流模型的10至20倍。

輸出價格差距更為明顯。中國模型方面，DeepSeekV3.2為每百萬Token0.42美元，MiniMaxM2.5為1.1美元，月之暗面KimiK2.5為2.2美元。美國模型方面，OpenAIGPT-5.4為15美元，ClaudeOpus4.6為25美元。中美主流模型輸出價格差距約為7倍至60倍。

上述價差一直存在，此前未引發(fā)大規(guī)模用戶遷移，原因很簡單，大多數(shù)人用AI的主要場景就是聊天，Token消耗量較低，價差影響甚微。

但2026年初，一只“龍蝦”的出現(xiàn)改變了這一切。

開源工具OpenClaw（開發(fā)者社區(qū)稱為“龍蝦”）于2026年2月前后迅速走紅，上線后很快登頂OpenRouter應用排行榜第一，單周消耗超6000億To－ken。“龍蝦”屬于智能體應用，和過去“你問我答”的聊天模式不同，它可使AI在電腦上自主執(zhí)行編程、測試、文件管理等任務，無需逐步人工干預。

在這種工作模式下，Token消耗量與聊天場景不在一個量級。

比如，一個編程任務可能需要經歷幾十輪“寫代碼—運行—報錯—修改—再運行”的循環(huán)，每一輪都是一次完整的模型調用。為了讓智能體記住此前的操作，每次調用還需要調用對話歷史。

有開發(fā)者在社交平臺上表示，一個活躍的OpenClaw會話上下文很容易膨脹到23萬Token以上。若全程使用ClaudeAPI，月費用可能在800至1500美元之間。也有用戶稱，一個配置不當?shù)淖詣踊蝿眨惶炀蜔袅?00美元。

以OpenClaw為代表的智能體應用推高了整個平臺Token消耗量。比如，2025年3月3日至9日當周，OpenRouter前十大模型周調用量總計1.24萬億Token。至2026年2月16日至22日當周，僅前十大模型周調用量就超過了8.7萬億Token，增長近7倍。編程任務在平臺Token消耗中的占比也從2025年初的11%升至2025年底的50%以上。

當單次任務Token消耗從幾千增至幾十萬，中美模型間的價格差距從可忽略的成本轉變?yōu)槊吭聰?shù)百甚至上千美元的顯著差異。

2026年2月19日前后，美國大模型公司Anthropic更新服務條款，禁止用戶將Claude訂閱賬號憑證接入OpenClaw等第三方工具，要求通過API按量計費。隨后Google也推出類似限制。對于每天需頻繁調用API的智能體應用，模型選擇中的價格因素成為繞不過去的問題，開發(fā)者被推上了按量付費的賽道。

在智能體核心的編程場景上，中美模型能力已較為接近。

SWE-BenchVerified是由普林斯頓大學研究團隊維護的一項編程能力公開評測，做法是讓AI模型去修復GitHub（全球最大的開源代碼托管平臺）上真實的代碼問題。根據(jù)該評測公開排行榜的數(shù)據(jù)，2026年2月13日發(fā)布的中國模型MiniMaxM2.5拿到了80.2%，2月5日發(fā)布的美國模型 ClaudeOpus4.6為80.8%，兩者差距只有0.6個百分點。

在能力相近而價格懸殊的情況下，開發(fā)者的選擇迅速反映在了數(shù)據(jù)上。

2026年2月9日至15日當周，中國模型Token調用量達4.12萬億，首次超過美國模型的2.94萬億。隨后一周，中國模型調用量升至5.16萬億，三周時間增長127%。同期美國模型調用量降至2.7萬億。

中國大模型為什么能比美國大模型便宜這么多？

工信部信息通信經濟專家委員會委員盤和林向經濟觀察報表示，原因主要有兩點：一是中國算力基礎設施規(guī)模大、復用率高，報價較低；二是中國算力集群中存在大量自建算力，獲取成本低于海外。

此外，技術路線也影響成本。有業(yè)內人士告訴記者，目前主流中國大模型普遍采用MoE架構，也稱為“混合專家模型”。通俗地說，一個MoE模型雖然參數(shù)總量很大，但每次運行時只激活其中一小部分參數(shù)來處理任務，而不是全體參數(shù)，這大幅降低了每次推理所需的計算量。

不同路徑

硅谷風投機構 a16z合伙人MartinCasado在2025年底表示，在使用開源技術棧的AI初創(chuàng)公司中，約80%的公司使用中國模型。他隨后在社交平臺上補充說明，這并非指80%的美國AI初創(chuàng)公司都在使用中國模型，而是那些選擇開源技術路線的公司中（約占全部美國AI初創(chuàng)公司的20%至30%），約80%使用了中國模型。

記者注意到，GitHub上已出現(xiàn)多個幫助開發(fā)者在不同模型間優(yōu)化成本的開源工具。其思路多為將任務按難度分級，簡單任務交由免費或低價的中國模型處理，復雜任務再調用高價美國模型。

其中一個名為ClawRouter的項目在文檔中給出了對比數(shù)據(jù)，顯示采用這種搭配方式后，平均成本從每百萬Token25美元降到了約為2美元。Anthropic的產品ClaudeCode，在官方文檔中也采用了類似的分層設計，默認用最便宜的模型處理日常任務。

這種模式能夠成立的前提是中國模型在執(zhí)行類任務上能力足夠。在編程方面，前面提到的SWE-Bench數(shù)據(jù)已經說明了這一點。而在編程之外，中美大模型整體能力差距有多大呢？

LMSYSChatbotArena是目前全球公認度最高的AI模型評測平臺之一，其做法是讓真人用戶在不知道模型名字的情況下同時試用兩個模型，然后投票選出更好的那個，相當于一場AI之間的盲品測試。

在其截至2026年3月25日的綜合排名中，前五名均為美國公司模型，中國模型中排名最高的DeepSeekV3.2Speciale位列第六。在專門測試復雜推理能力的HardPrompts（高難度提示詞，專門用于測試模型處理復雜推理和多步邏輯任務的能力）類別中，中美模型的差距更為明顯，第一梯隊仍主要為美國模型。

編程能力接近、復雜推理尚有差距，這是當下中美大模型之間差異化能力的體現(xiàn)，也是“分層調用”這套做法成立的基礎。

不過，和30年前被鎖在低利潤率的代工廠商不同，中國大模型廠商在價格上并沒有一直往下走。

事實上，從2024年開始，中國大模型行業(yè)曾發(fā)生過一輪價格戰(zhàn)：2024年5月，字節(jié)跳動旗下火山引擎豆包大模型以0.0008元/千Token的價格引發(fā)“價格戰(zhàn)”，阿里云、百度智能云相繼跟進。此后近一年，行業(yè)經歷Token價格下降超過90%的階段，部分廠商推理算力毛利率一度為負。

廠商當時的策略是以虧損換取規(guī)模，培養(yǎng)用戶調用習慣。然而，2026年2月OpenClaw走紅后，Token消耗量增速遠超預期，算力供給趨緊。

智譜最先做出反應，2026年2月12日發(fā)布新模型GLM-5時上調API定價，3月16日發(fā)布GLM-5-Turbo時再次提價，兩輪累計漲幅83%。

智譜CEO張鵬在2025年度業(yè)績說明會上表示，2026年一季度API調用定價提升83%，調用量增長400%。根據(jù)年報，智譜2025年全年收入 7.243億元，同比增長132%，MaaS（模型即服務）平臺年度經常性收入約為17億元，12個月增長60倍。

選擇漲價的不只智譜一家。2026年3月13日，騰訊云調整了混元系列大模型定價，部分模型漲幅超460%。3月18日，阿里云與百度智能云同日發(fā)布調價公告，AI算力相關產品漲幅在5%至34%之間，新價格于4月18日生效。

中科曙光高級副總裁李斌在接受經濟觀察報采訪時稱，算力系統(tǒng)評價指標正在發(fā)生改變，過去衡量一個系統(tǒng)的標準是看它有多少算力，現(xiàn)在則要看它能夠多么經濟地產出Token。

從集體降價到集體漲價，轉變只用了不到兩年。

2026年3月，國家數(shù)據(jù)局局長劉烈宏在中國發(fā)展高層論壇上公布了一組數(shù)字：中國日均Token調用量已突破140萬億，較兩年前增長超過1000倍。

在同月的GTC大會上，英偉達創(chuàng)始人黃仁勛稱，Token將是未來數(shù)字世界最核心的大宗商品。

在盤和林看來，中國大模型的競爭力很強，不是在補全，而是在引領，尤其在AI應用端。但他同時表示，中國在原創(chuàng)性創(chuàng)新上還有提升空間，當前AI體系中的核心架構，從人工神經網絡到注意力機制，都是海外率先提出、國內跟進迭代。中國大模型下一步需要在應用端繼續(xù)發(fā)力的同時，在基礎算法上展開原創(chuàng)性創(chuàng)新。

30年前的消費電子代工產業(yè)有一個特點，組裝環(huán)節(jié)的利潤率被上游品牌商牢牢壓住，不少頭部的代工廠發(fā)展至今的毛利率都沒有超過10%。成本優(yōu)勢帶來了訂單，但未能帶來定價權。

當前，中國大模型的處境看起來與當年的消費電子代工產業(yè)有幾分相似，但在定價權方面似乎又頗有不同。例如，智譜漲價83%之后，調用量增長了400%。阿里云、百度智能云、騰訊云在2026年3月集體上調了AI算力和模型服務的價格，需求并沒有萎縮，調用量在持續(xù)增長。

在SWE-Bench編程評測上，頭部中國模型和頭部美國模型的差距已經縮小到不足1個百分點。兩者在復雜推理上的差距還在，但這個差距也在快速收窄。

此次，中國大模型廠商的發(fā)展路徑似乎有所不同。

（作者鄭晨燁）

免責聲明：本文觀點僅代表作者本人，供參考、交流，不構成任何建議。

鄭晨燁

資深記者。關注新能源、半導體、智能汽車等新產業(yè)領域，有線索歡迎聯(lián)系：zhengchenye@eeo.com.cn，微信：zcy096x。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.