![]()
智東西
作者 陳駿達
編輯 李水青
破案了,前兩天在開發者社區爆火的“Pony Alpha”,就是智譜的GLM-5!
智東西2月12日報道,今天,智譜發布了其最新一代基礎模型GLM-5,這是一個擁有744B參數(40B激活)的模型,為GLM-4.5的兩倍多。在Artificial Analysis榜單中,GLM-5位居全球第四、開源第一。
GLM-5的預訓練數據從23T提升至28.5T。智譜在技術報告中寫道:“Scaling(規模化)仍然是提高AGI智能效率的最重要方式之一。”
![]()
智譜稱,GLM-5在編程能力上實現了對Claude Opus 4.5的對齊,在主流基準測試中取得開源模型SOTA分數。在SWE-bench-Verified和Terminal Bench 2.0中,GLM-5分別獲得77.8和56.2的開源模型SOTA分數,性能超過Gemini 3 Pro。
![]()
架構方面,GLM-5集成了DeepSeek的DSA稀疏注意力架構,能降低部署成本,同時保證了上下文容量。
在新模型發布后,智譜的股價今天已經上漲了26%。本周,智譜股價累計上漲約70%,市值目前已經達到1756.62億港幣(約合人民幣1551.62億元)。
![]()
GLM-5上線后,我們第一時間給它出了幾道帶有邏輯陷阱的的網紅測試題。第一道題目是這樣的:我要去洗車,洗車的地方離家就100米,我是開車去呢,還是走著去呢?
不少主流大模型其實都會在這道題目上“翻車”,不過GLM-5一眼就看穿了里頭的陷阱。它分析道,肯定得開車去,因為洗的是車而不是人。最后,它還提出一個天才方案,可以先開車去,然后走回家休息,洗完了再去取車,這樣就不用在旁邊干等著吸尾氣了。
![]()
緊接著我們嘗試了另一個問題:父親和母親可以結婚嗎?在這道題目上,由于我們的問題中給的限定不多,GLM-5拆解出了更為具體的兩種情況,分析內容合理,還知道這題目里也藏著邏輯誤區——父母通常情況下就是夫妻關系,所以他們不僅是可以結婚,而是已經結婚的狀態。
![]()
我們最后又試著問了它這個問題:“今年才知道,親生父母結婚時候沒有叫我,我很難過怎么辦?”收到消息后,GLM-5就好像馬上切換到了心理咨詢模式,貼心地安慰起用戶,徹底繞進了題目里的陷阱——親生父母結婚的時候,孩子大概率還沒出生呢。
![]()
也有不少網友上手體驗了GLM-5。比如,這位網友就讓自己的OpenClaw Agent用不同模型進行了一次SwiftUI編程測試,GLM-5的表現要優于Minimax M2.1。
![]()
還有一位網友讓GLM-5、GLM4.7和Opus 4.6進行了3D網頁的開發,這位網友認為GLM-5的升級很大,與Opus 4.6有一些品味方面的差異。
![]()
在博客中,智譜稱,GLM-5的上線得到眾多國產芯片保障,GLM-5已完成與華為昇騰、摩爾線程、寒武紀、昆侖芯、沐曦、燧原、海光等國產算力平臺的深度推理適配。通過底層算子優化與硬件加速,GLM-5在國產芯片集群上已經實現高吞吐、低延遲的穩定運行。
![]()
面向開發者群體,智譜的模型一般以GLM Coding Plan的方式對外提供服務。不過由于使用量快速提升,為保障服務質量,智譜決定調整套餐價格,整體漲幅自30%起。
GLM-5已在Hugging Face和魔搭社區上開源,模型權重以MIT許可證發布。GLM-5也支持開發者平臺api.z.ai和BigModel.cn,兼容Claude Code和OpenClaw。普通用戶也可以在Z.ai免費試用。
開源鏈接:
https://huggingface.co/zai-org/GLM-5
API調用:
https://bigmodel.cn/
一、性能較GLM-4.7平均增幅超過20%,Z Code智能體開發環境發布
在博客中,智譜提到,大模型正從寫代碼、寫前端,進化到寫工程、完成大任務,即從“Vibe Coding”變革為“Agentic Engineering”。
智譜內部的內部Claude Code評估結果顯示,GLM-5在前端、后端、長程任務等編程開發任務上超越GLM-4.7(平均增幅超過20%),能自主完成Agentic長程規劃與執行、后端重構和深度調試等系統工程任務,使用體感逼近Opus 4.5。
此前,我們已在OpenRouter上測試了以“Pony Alpha”這一馬甲現身的GLM-5。這一模型在復雜編程領域的表現確實有明顯可感的提升。
比如,我們曾試著讓GLM-5復刻知名游戲《星露谷物語》。拿到提示詞后,模型會像項目經理一樣,分析了我們提示詞中的核心需求,梳理出需要設計的八大系統與配色方案,以指導后期的開發。
之后,模型還會像架構師一樣規劃項目的整體架構,并打造出一個初步可玩的游戲界面。

當我們提出“進一步豐富游戲”這樣的模糊需求時,GLM可以自行規劃,并打造出完成度更高的游戲。
也有開發者用GLM-5打造了橫版解謎游戲、Agent交互世界、論文版“抖音”等應用。這些應用有些已經開放下載,有些則提交應用商店審核。
面向編程場景,智譜還推出了Z Code智能體開發環境。用戶只需把需求說清楚,模型會自動拆解任務,多智能體并發完成代碼、跑命令、調試、預覽和提交等開發全流程。在Z Code上,用戶甚至可以用手機遠程指揮桌面端Agent。
值得一提的是,Z Code也是全程由GLM模型參與開發的。
二、可一鍵接入OpenClaw,還能直出Word文檔、PDF
除了編程之外,GLM-5也可作為通用Agent助手的基座模型。
在OpenClaw中接入GLM-5后,用戶可以讓GLM-5幫你搜索網站、定時整理資訊、發布推文、編程等。
智譜已經推出了AutoGLM版本的OpenClaw,支持官網一鍵完成OpenClaw與飛書機器人的一體化配置。
GLM-5還擁有更強的復雜系統工程和長程智能體能力,可將文本或素材直接轉換為docx、pdf和xlsx文件。
在Z.ai和智譜清言上,用戶可以讓GLM-5直接輸出產品需求文檔、教案、試卷、電子表格、財務報告、流程表、菜單等文檔。
GLM-5在Agent能力上實現開源SOTA,在BrowseComp(聯網檢索與信息理解)、MCP-Atlas(工具調用和多步驟任務執行)和τ2-Bench(復雜多工具場景下的規劃和執行)中,均取得開源SOTA。
![]()
在衡量模型經營能力的Vending Bench 2中,GLM-5也獲得開源SOTA。Vending Bench 2要求模型在一年期內經營一個模擬的自動售貨機業務,GLM-5最終賬戶余額達到4432美元,經營表現接近Claude Opus 4.5,展現了不錯的長期規劃和資源管理能力。
![]()
強化學習是提升智能體能力的重要方式。智譜在GLM-5中采用了全新的“Slime”框架,支持更大模型規模及更復雜的強化學習任務,提升強化學習后訓練流程效率。
此外,智譜還提出了異步智能體強化學習算法,使模型能夠持續從長程交互中學習,充分激發預訓練模型的潛力。
結語:編程模型押注工程級能力
從“寫代碼”到“做工程”,大模型的能力邊界正在被不斷推遠。越來越多的大模型已經不滿足于僅僅出個簡易的Demo,而是想要在長序列任務、復雜系統規劃與多步驟執行上實現突破。
這種能力的進化,或許會使模型不再只是開發流程中的輔助工具,而開始具備承擔完整工程環節的潛力。圍繞長程規劃、復雜推理與多智能體協作的能力提升,或將成為未來一段時間內編程模型升級的重點方向。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.