REPORT
3 月 31 日,智譜(02513.HK)發布上市后首份年度業績。2025 年全年收入 7.24 億人民幣,同比增長 132%,是國內收入規模最大的大模型公司
同時,MaaS API 平臺 ARR 約 17 億人民幣(約 2.5 億美金),過去 12 個月增長 60 倍
一季度 API 漲價 83%,調用量反增 400%
![]()
智譜上市后首份成績單
全行業打價格戰,智譜在漲價
先說背景。從 2024 年年中開始,國內大模型行業集體打價格戰。1 分錢百萬 Token、免費調用成了常規操作。據調研數據,2024 年國內大模型行業平均毛利率 -80%,2025 年行業平均毛利率仍為 -30%,絕大多數廠商還在虧錢換規模
在這個環境里,智譜做了一個跟所有人方向相反的動作:2026 年一季度,API 定價上調 83%
結果是調用量不降反升,增長 400%。據財報披露,智譜已成為國內付費 Token 消耗量最高的廠商之一
行業毛利率 -30%,智譜綜合毛利率 41%
漲價 83%,調用量反增 400%
量價齊升在全球 AI 行業都很少見。對于生產級客戶來說,價格從來不是第一考量,模型效果才是。一個能穩定完成復雜任務的模型,即使貴一些,也比便宜但不穩定的模型更值錢
據智譜官方表述,GLM 系列持續保持全球開源模型第一、中國模型第一,在全球模型中僅次于 GPT、Claude 和 Gemini。GLM-5 在 Artificial Analysis Intelligence Index 榜單達到 50 分,據稱是開放權重模型首次達到這一分數
收入 7.24 億,ARR 17 億
2025 年全年收入 7.24 億人民幣,同比增長 132%。對比招股書數據,2024 年全年收入 3.124 億,2025 上半年 1.91 億。下半年收入約 5.33 億,是上半年的 2.8 倍
全年綜合毛利率 41%,MaaS 平臺毛利率從約 3.8% 提升至 18.9%,提升近 5 倍
MaaS API 平臺 ARR 約 17 億人民幣(約 2.5 億美金),過去 12 個月提升 60 倍。400 萬企業用戶及開發者在真實生產環境中持續調用,覆蓋全球 218 個國家和地區
MaaS 飛輪轉起來了
招股書階段,市場對智譜的印象是「做大模型服務的AI公司」,本地化部署收入占比約七成。這份年報里,API 調用業務的 ARR 已經遠超全年確認收入,MaaS 成了增長的主引擎
MaaS(Model as a Service),把大模型能力封裝成標準化 API,企業和開發者按調用量付費。這正是 Anthropic 跑通的商業路徑:80% 以上的收入來自企業和開發者的 API 調用
這個模式的核心是一個正向循環:模型效果越好 → 吸引高價值客戶 → 客戶深度調用帶來收入 → 收入投入技術研發 → 模型效果進一步提升
收入結構從「模型服務」切換到了「API 調用」
中國前十大互聯網公司中有 9 家 每天深度調用 GLM。GLM-5 發布后 24 小時內,字節跳動 TRAE、阿里 Qoder、騰訊 CodeBuddy、美團 CatPaw、快手萬擎、百度智能云、WPS Office 等頭部產品官方接入
全球化維度上,GLM 已部署在 Google Vertex AI、AWS Bedrock、Fireworks、Cerebras 等云服務商,入駐 OpenRouter、Vercel 等聚合平臺。據智譜稱,GLM 是 OpenRouter 付費模型排名第一,也是 Windsurf、OpenCode 等 Coding 平臺的默認模型
Coding 和 Agent 兩條線都在放量。Coding Plan 全球付費開發者 24.2 萬,Token 調用量 6 個月漲 15 倍。2026 年 3 月推出的 Claw Plan(基于 AutoClaw),上線兩天訂閱用戶破 10 萬,20 天突破 40 萬
跟 Anthropic 對標
張鵬在業績發布會上把智譜的商業路徑定義為「中國的 Anthropic」。Anthropic 的 ARR 從 2024 年底約 10 億美金,到 2025 年底約 90 億美金,到 2026 年 3 月已經接近 190 億美金。Claude Code 單產品 ARR 超過 25 億美金。約 70-80% 的收入來自企業級 API 調用
智譜的 MaaS ARR 約 2.5 億美金,增長曲線的形態跟 Anthropic 同構:模型能力夠強之后,API 調用量指數級爆發
幾個同構點:
· 收入來源都以 API 調用為主。Anthropic 約 70-80% 來自企業 API,智譜的 MaaS 平臺是核心增長極
· 都以 Coding 為切入點。Anthropic 的 Claude Code 9 個月 ARR 破 25 億美金,智譜的 Coding Plan 付費開發者 24.2 萬,Token 調用量 6 個月漲 15 倍
· 都能漲價。Anthropic 在規模擴張中保持定價能力,智譜一季度漲價 83% 后調用量反增 400%
Anthropic 估值 3800 億美金,約 27 倍 ARR。智譜港股市值約 800 多億港幣。Anthropic 的 Fortune 100 客戶覆蓋率 70%,開發者和企業客戶生態更成熟
![]()
Anthropic 和智譜核心指標對比,數據來源為公開報道和財報
技術底層:為什么推理成本在下降
MaaS 平臺毛利率從約 3.8% 跳到 18.9%,背后有幾個技術因素
智譜通過 MLA-256 改進在保持與 GQA-8 相同性能的情況下,減少了 KVCache 占用。動態稀疏注意力機制 讓長序列推理的部署成本降低 50%,性能無損。這些是推理側的工程優化,直接壓低了每個 Token 的成本
訓練側,Slime 框架 實現異步強化學習,解決了生成與訓練的解耦問題。通過 PD 分離和心跳容錯機制最大化 GPU 利用率。配合直接雙面重要性采樣算法,模型可以從超 1 萬個真實軟件工程環境中高效學習。這套體系支撐了 GLM-5-Turbo 作為 OpenClaw 基座模型
國產芯片適配方面,GLM-5 已進入軟硬協同設計階段。通過 Lightning Indexer 等定制化融合內核和 FlashComm 通信優化,據智譜稱在國產芯片上跑出了接近國際頂級芯片的推理效率
MaaS 是一個邊際成本持續下降的模式。模型訓練和優化一次,可以服務數百萬客戶,調用量越大,單 Token 成本越低,毛利率越高。推理成本的持續優化直接推動了毛利率 5 倍的提升
兩個新概念:TAC 和 LLM-OS
張鵬在業績會上提出了兩個概念
TAC(Token Architecture Capability,Token 架構力):TAC = 智能調用量 × 智能質量 × 經濟轉化效率。按張鵬的說法,未來衡量組織和個人價值的標準,會越來越取決于其構建和驅動復雜 Agent 系統的能力。智譜的定位是成為提升全社會 TAC 的基礎設施
LLM-OS(大模型操作系統):把大模型定義為智能的調度者。張鵬說智譜在與生態伙伴和操作系統廠商探討,把基座模型能力與操作系統深度融合。AutoGLM 和 AutoClaw 是這一方向的落地
在業績會 Q&A 中,有記者直接問這兩個概念是愿景還是產品計劃。張鵬的回答是 TAC 已經在發生(「有些企業已經把 Token 作為工資的一部分發放」),LLM-OS 也在與合作伙伴推進中
TAC 和 LLM-OS 目前還是概念框架,落地產品有限。但 TAC 的公式(調用量 × 質量 × 轉化效率)跟智譜當前的商業邏輯是自洽的
需要回答的問題
盈利時間表。招股書顯示 2024 年凈虧損 29.58 億,2025 上半年凈虧損 23.58 億。研發投入(主要是算力)的體量決定了短期內盈利仍需時間。Anthropic 預計 2027 年停止現金消耗,可以作為參考
大廠自研。9/10 的頭部互聯網公司在用 GLM,但字節、阿里、騰訊都有自研模型。張鵬在 Q&A 中的回應是:大廠在所有場景中都做到競爭力最強,受資源限制很難實現,生態本身也需要接入外部供應商
定價權的持續性。漲價 83% 后調用量增 400%,這組數據很硬。張鵬也提到當前確實存在算力供給的約束。后續算力供給充裕之后,需求側的表現需要持續觀察
Anthropic 的商業路徑已經跑通了:做最強的基座模型,通過 API 賣推理,讓開發者和企業在生產環節消耗 Token。ARR 15 個月從 10 億美金到接近 190 億美金
智譜這份財報里的數據跟 Anthropic 的早期增長曲線同構。MaaS ARR 12 個月增 60 倍,API 漲價 83% 后調用量增 400%,400 萬開發者和企業在用 GLM,全年綜合毛利率 41%
智譜開始用 Anthropic 的方式賺錢了
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.