![]()
作者 | 木子、高允毅
正在沖刺大模型第一股的智譜,今天又拿出了誠意滿滿的新一代大模型GLM-4.7,還給開源了。
![]()
GLM-4.7主打編程與代理式任務(coding + agentic tasks)的提升,同時在推理能力等方面也有所增強。
眾所周知,今年的大模型,已經從卷“會答題”發(fā)展成了卷“能干活”。對應的變化,也體現(xiàn)在評測體系上,這些測試覆蓋了真實代碼修改、終端操作、多工具調用以及長鏈路任務執(zhí)行等場景。
智譜也是把 GLM-4.7 一口氣送進了 17 項基準測試,和 GPT-5、Claude Sonnet 4.5、Gemini 3.0 Pro、DeepSeek-V3.2、Kimi K2 Thinking 等同臺競技。
然后在一眾強勁對手中,GLM-4.7 還在兩項 BenchMark 中刷新了公開 SOTA:在AIME 2025(測試高級數(shù)學推理能力)中正確率已達 95.7%;在BrowseComp-ZH中分數(shù)達 66.6%。
![]()
另外,它在SWE-bench-Verified得分 73.8%,在LiveCodeBench V6得分 84.9%,超過 Claude Sonnet 4.5,刷新了兩項開源 SOTA。
![]()
UI 質量飛躍,來看看具體 Case
僅憑 BenchMark 的高分或許還不夠有說服力,智譜官方也放出了一系列 Case,來直觀展示 GLM-4.7 的實用效果如何。
首先,是前端開發(fā)。
要生成一個普通 HTML 網(wǎng)頁,在 GLM-4.7 中基本能一句話搞定,大大減少后期微調時間。
而且比起上一代生成的布局結構更清晰,配色不容易沖突,組件風格也更統(tǒng)一;而且還能覆蓋多種風格,從簡約、復古到時尚等應有
除了普通 HTML,做一個基于 Web 的交互式體驗頁面(Interactive Web Experience)也是不在話下。
比如用同一段 Prompt:
![]()
給前一代 GLM-4.6,生成效果是這樣的:

而給 GLM-4.7 生成的 UI 質量就提升了一大截,比如其動態(tài)效果和 3D 交互感都明顯增強了。

GLM-4.7 體現(xiàn)出的高級審美能力,還在“藝術作品”的 3D 展示中帶來質的飛躍。
它在空間層次、透視關系上處理得很清楚,同時在配色、材質對比、景深和構圖上也下了功夫;該亮的地方亮,該收的地方收。
比如要生成一個花園空間,中間是一座裝飾華麗的寶塔,周圍被盛開的櫻花樹包圍,GLM-4.7 的作品既有體積像素的 3D 感,又美觀和諧。
![]()
另外,在幻燈片制作上,GLM-4.7 也明顯“好看了”。
PPT16:9 的適配率從 52% 提升至 91%,生成的頁面布局更準確、元素比例更舒服,整體觀感更接近一份可以直接拿去用的成品。
這樣的審美同樣體現(xiàn)在海報設計上,排版與配色更加靈活,具備設計感。
同樣設計以“巴黎”為主題的海報,GLM-4.7 明顯從配色和排版上更勝一籌,懂得突出主題,注意文字比例和位置,圖片的鑲嵌和配色,而不是死板的羅列排布。
不少網(wǎng)友也對使用效果給出好評,稱體驗的效果很不錯。
![]()
![]()
也有網(wǎng)友提出,還想看看 GLM-4.7 與最牛編碼模型 Opus4.5 之間的比拼。
![]()
GLM-4.7 的三種“思考模式”
那么,GLM-4.7 為什么能有這樣的進步?
在推理機制上,GLM-4.7 圍繞“如何在復雜任務中更穩(wěn)定地思考與行動”這一核心問題,對模型的思維流程進行了系統(tǒng)性重構。
形成了由“交織式思考(Interleaved Thinking)+ 保留式思考(Preserved Thinking)+ 輪級思考(Turn-level Thinking)”組成的一整套推理機制。
具體而言,交錯式思考,指的是 GLM-4.7 在每次響應和工具調用之前都會進行思考。
這其實是自 GLM-4.5 起就引入的基礎能力,GLM-4.7 對其進行了強化,使模型在每一次生成回復或調用工具之前,都會先進行內部推理,再決定下一步行動,從而提升指令遵循的準確性和生成質量。
保留式思考,指的是在編碼代理場景中,GLM-4.7 能夠自動保留多輪對話中的所有思維模塊,重用現(xiàn)有推理過程,而不是從頭開始重新推導。
這主要用于多回合、長鏈路任務中,減少了信息丟失和不一致的情況。
最后,輪級思考就是 GLM-4.7 支持對會話內的推理進行逐回合控制,允許在同一會話內按回合決定是否啟用推理。
對于簡單、低復雜度的請求可以關閉思考以降低延遲和計算成本,而在需要精確決策和穩(wěn)定執(zhí)行的任務中再開啟完整推理流程。
![]()
通過這套“推理組合拳”,GLM-4.7 在復雜任務中的行為表現(xiàn)更加穩(wěn)定連貫,也更容易控制;這為其在代理式編程和長周期任務執(zhí)行中提供了關鍵的技術基礎。
智譜沖刺“大模型第一股”
在沖刺“大模型第一股”的前夕,智譜用一次技術密度極高的模型更新,主動把自己推到聚光燈下。
這里再來簡單回顧一下智譜的上市細節(jié)。
12 月 19 日,港交所官網(wǎng)披露,北京大模型公司智譜已通過聆訊,IPO 招股書同步公開。這意味著,智譜正式邁入上市沖刺的最后階段。
按招股書口徑,公司最新估值為243.77 億元,中國大模型公司第一次以如此完整的姿態(tài),走到公開市場面前。
從經營數(shù)據(jù)看,智譜仍處在典型的高速放量階段。
2022—2024 年,公司收入從 0.6 億元增長至 3.1 億元;而真正的拐點出現(xiàn)在 2025 年上半年:2024H1 收入僅 0.4 億元,2025H1 已躍升至 1.9 億元,同比增幅超過 300%。
其中,近85% 的收入來自本地化部署,客戶覆蓋互聯(lián)網(wǎng)、公共服務、電信和傳統(tǒng)企業(yè);MaaS 平臺則通過持續(xù)降價放大調用規(guī)模,2025H1 云端機構客戶增至 3061 家,并對本地化部署形成明顯引流。
但另一條曲線同樣陡峭。招股書顯示,智譜的虧損擴張速度遠快于收入增長。
2022—2024 年及 2025H1,經調整凈虧損分別為 0.97 億元、6.21 億元、24.66 億元和 17.52 億元,幾乎全部指向研發(fā)投入。
同一時期,研發(fā)費用從 0.8 億元升至 22.0 億元,算力相關支出占比超過 70%。毛利率仍維持在 50% 以上,但在 MaaS 價格戰(zhàn)中持續(xù)承壓。
把時間軸往前拉,這其實是一家成立不到 6 年的公司。智譜成立于 2019 年、脫胎于清華大學知識工程實驗室(KEG),是國內最早一批獨立大模型公司之一。
從GLM 架構起步,它就選擇了一條清晰卻昂貴的路徑:持續(xù)把資源押注在模型能力本身。截至 2025 年,其模型已支持約 8000 萬臺設備、服務超過 1.2 萬家機構客戶。
開源鏈接:
GitHub:https://github.com/zai-org/GLM-4.5
Hugging Face:huggingface.co/zai-org/GLM-4.7
魔搭社區(qū):https://modelscope.cn/models/ZhipuAI/GLM-4.7
https://z.ai/blog/glm-4.7
https://x.com/Zai_org/status/2003156119087382683
技術人的年度儀式感! 年度盤點與趨勢洞察 啟動!
《2025 年度盤點與趨勢洞察》由 InfoQ 技術編輯組策劃。覆蓋大模型、Agent、具身智能、AI Native 開發(fā)范式、AI 工具鏈與開發(fā)、AI+ 傳統(tǒng)行業(yè)等方向,通過長期跟蹤、與業(yè)內專家深度訪談等方式,對重點領域進行關鍵技術進展、核心事件和產業(yè)趨勢的洞察盤點。
力求以體系化視角幫助讀者理解年度技術演化的底層邏輯、創(chuàng)新方向與落地價值,并為新一年決策提供參考。內容將在 InfoQ 媒體矩陣陸續(xù)放出,歡迎大家持續(xù)關注。
![]()
今日薦文
你也「在看」嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.