在推進IPO的關鍵節點,智譜AI正式上線并開源其最新旗艦模型GLM-4.7,新版本針對Coding場景著重強化了編碼能力、長程任務規劃與工具協同,標志著該公司技術產品線的又一次重要迭代。
12月23日,智譜正式上線并開源其最新旗艦模型GLM-4.7,在多項主流公開基準測試中,GLM-4.7展現了具有競爭力的性能,部分指標超越了目前市場的領先模型。數據顯示,在全球百萬用戶參與盲測的專業編碼評估系統Code Arena中,GLM-4.7位列開源第一、國產第一,并超越了GPT-5.2。同時,該模型在SWE-bench-Verified和LiveCodeBench V6等測試中均取得了開源SOTA(當前最佳)分數,對齊Claude Sonnet 4.5。
在架構上,GLM-4.7引入了“保留式思考”與“輪級思考”機制,顯著提升了復雜任務的穩定性與可控性。在前端生成質量方面,模型對UI設計規范的理解得以增強,能夠生成審美更佳的網頁與PPT。目前,該模型已通過BigModel.cn提供API服務,并在z.ai全棧開發模式中上線Skills模塊,支持多模態任務的統一規劃。
此次更新標志著國產大模型在“思考”與“行動”協同能力上的進一步突破。隨著Coding能力的增強,開發者能夠更自然地以“任務交付”為核心組織開發流程,這一進展也被視為智譜在資本市場動作前夕展示技術肌肉的重要舉措。
編碼與推理能力刷新基準
根據公布的測試數據,GLM-4.7在編程和推理能力上實現了顯著提升。在HLE(“人類最后的考試”)基準測試中,該模型獲得42.8%的成績,較上一代GLM-4.6提升41%,并超越了GPT-5.1。
在代碼生成領域,GLM-4.7展現了在多語言編碼方面的優勢。具體評測數據包括:
- SWE-bench-Verified:獲得73.8%的開源SOTA分數。
- LiveCodeBench V6:達到84.9%的開源SOTA分數,超過Claude Sonnet 4.5。
- Terminal Bench 2.0:達到41%,提升幅度達16.5%。
此外,在工具調用能力方面,GLM-4.7在τ2-Bench交互式工具調用評測中得分87.4分,刷新開源記錄。
引入可控“思考”模型
為解決復雜任務中的穩定性問題,GLM-4.7強化了思考能力的可控進化,具體體現在三個維度:
- 交錯式思考:模型在每次回答或工具調用前進行預先思考,以提升對復雜指令的遵循能力及代碼生成質量。
- 保留式思考:支持在多輪對話中自動保留思考塊,提升緩存命中率,從而降低長程任務的推理成本。
- 輪級思考:允許在該會話內按“輪”控制推理開銷,簡單任務關閉思考以降低時延,復雜任務開啟思考以確保準確性。
這種機制使得GLM-4.7能夠在Claude Code、TRAE、Kilo Code、Cline和Roo Code等主流編程框架中實現“先思考、再行動”的邏輯,在實際編程任務的穩定性和可交付性上優于前代版本。
前端審美與全棧交付
針對前端開發場景,GLM-4.7提升了對視覺代碼的理解力。在實際應用中,模型能夠更好地遵循UI設計規范,在布局結構、配色和諧度及組件樣式上提供具備美感的默認方案,減少人工微調時間。
據官方演示,該模型在辦公創作中的版式審美顯著升級,PPT 16:9的適配率從52%躍升至91%,生成結果基本達到“即開即用”標準。
![]()
在實際案例演示中,GLM-4.7已能獨立完成如“植物大戰僵尸”、“水果忍者”等高交互小游戲的開發,顯示出較強的任務拆解與技術棧整合能力。
![]()
市場反饋:性價比與實戰表現
GLM-4.7上線后迅速引起了全球開發者社區的關注,用戶反饋主要集中在其實際解決問題的能力與極高的性價比上。
在社交媒體上,網友Diego分享了使用GLM-4.7編寫Python代碼來可視化單行道紅綠燈的案例,評價稱結果“整體運行良好”,僅指出車輛顏色隨紅綠燈變化的細微瑕疵。
![]()
網友Alex Fazio則表示在WebDev Arena上的表現令其震驚,直言“GLM-4.7超越了GPT-5.2”。
價格策略也成為市場討論的焦點。網友Bessi指出,訂閱一年GLM-4.7的費用僅相當于Codex或Claude Code最高級計劃一個月的價格,并認為這種極具競爭力的定價模式將對西方AI公司構成挑戰,直言“無論你是否喜歡,這就是未來”。
![]()
針對模型進化速度,網友Chubby評論稱,HLE基準測試原本被設計為極其復雜、難以在短期內擬合的最終測試,但業界在短短12個月內通過各類工具將成績從8%(o1)提升至45.8%,GLM-4.7此次取得的突破表明技術迭代速度正“超出預期”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.