![]()
新智元報道
編輯:好困 定慧
【新智元導讀】Vibe Coding時代宣告終結!2026年伊始,智譜GLM-5震撼空降,以「智能體工程」重塑游戲規則。用Claude七分之一的地板價,國產模型正面硬剛Opus 4.5!
2月7日深夜,一個代號「Pony Alpha」的神秘模型悄悄上線。
隨后,外網炸了。
扔進去一段改了一天都沒搞定的「屎山代碼」,它順手重構了架構;輸入一段簡單的提示,它吐出一個包含35個電臺、UI絲滑的完整Web App。
這種極致的工程能力,直接印證了 Andrej Karpathy 幾天前的斷言:
Vibe Coding已經成為過去,新的游戲規則只有一個名字——
Agentic Engineering(智能體工程)。
![]()
緊接著,Opus 4.6與GPT-5.3-Codex 次日深夜「撞車」上線,全篇只談「長程任務、系統工程」。
就在所有人以為這又是閉源巨頭的獨角戲時,Pony Alpha的謎底揭曉——
它是GLM-5。
全球第一個站上這條賽道,和硅谷巨頭在系統級工程能力上正面硬剛的開源模型。
謎底揭曉后,智譜股價直接暴漲32%!
![]()
全球開源第一!
國產模型的「Opus時刻」
在真正上手之后,我們只有一個感受:真的太強了!
如果說Claude Opus代表了閉源模型的巔峰,那么GLM-5的發布,無疑標志著國產開源模型迎來了屬于自己的「Opus時刻」。
![]()
在權威榜單Artificial Analysis中,GLM-5位居全球第四、開源第一
就在發布當日,10余款由開發者基于GLM-5「手搓」的游戲和工具已同步展出并提供體驗,后續這些應用也將陸續登陸各大應用商店。
這意味著,GLM-5正將「AI編程」轉化為「AI交付」,真正實現了生產力工具向商業產品的無縫跨越。
![]()
體驗地址:showcase.z.ai
比如這個名為「Pookie World」的項目。
就是由GLM-5驅動的數字平行世界,通過多層生物-心理框架賦予自主智能體真實的敘事完整性與生命動機。

還有復刻版「我的世界」,這個效果和玩法簡直和Minecraft一模一樣。
![]()
我們也使用Claude Code作為外殼,直接接入GLM-5的API進行了多維度的實測。
無論是Next.js全棧項目,還是MacOS/iOS原生應用,它都能實現從需求分析、架構設計到代碼編寫、端到端調試的全流程閉環。
做了N個項目,冥冥之中有一種感受:
某種程度上,GLM-5或許是一個能改變行業格局的模型。
![]()
· 復雜邏輯挑戰:「無限知識宇宙」
如果你覺得寫個網頁很簡單,那試著讓AI搞定一個對JSON格式要求極嚴、且涉及動態渲染的「無限流」項目。
就拿我們最先測試的「無限知識宇宙」來說。
這是一個典型的復雜前后端分離項目,涉及React Flow動態渲染、Next.js API路由設計,以及極其嚴格的JSON格式輸出要求。
對此,GLM-5的表現堪稱驚艷。

它不僅一次性完成了整個項目文件結構,更讓人驚喜的是它的debug邏輯。
![]()
![]()
![]()
![]()
在遇到一個渲染bug時,我們只說了一句「頁面還是一片黑,初始化時沒有出現第一個內容……」
GLM-5立刻定位到是加載時機的問題,并迅速給出了修正方案。
![]()
![]()
完整的提示詞如下:
- 難點攻克:讓模型輸出穩定的JSON格式(這是測試模型指令遵循能力的絕佳場景)。· 更復雜的中臺項目,11分鐘搭建完畢
接下來加大難度,讓它開發一個名為「Soul Mirror」的心理分析應用。
需求分為兩步:
邏輯設計:扮演榮格心理學專家,輸出包含分析文本和視覺參數的JSON。
Step 2
前端實現:根據參數動態渲染SVG,生成塔羅牌風格的卡片。
4.增加一個“保存為圖片”的按鈕(使用html-to-image庫)。整個過程,它展現出的理解力,時常會讓人懷疑是不是在用Opus 4.5。
但是看了一眼,確實就是GLM-5。
![]()
· 25分鐘一鏡到底,真正的Agentic Coding
為了更進一步測試GLM-5的能力,我們要求它不使用API,完全模擬真實用戶,來制作一個X平臺的監控系統。
結果:25分鐘,一鏡到底。
![]()
完整錄屏如下:
可以看到,GLM-5會在運行中自主調用各種工具Agent,規劃任務、拆解步驟、遇到報錯自己查文檔修正。
這種長時間維持邏輯連貫性的能力,是以前開源模型不敢想象的。
![]()
完成后,一句話即可讓GLM-5自動運行項目
· 看圖寫APP,這還原度真的服了
最后,我們又把一張OpenClaw之父開源項目的截圖(一個AI額度統計工具),直接丟給GLM-5:
照這個給我做一個MacOS App。
![]()
沒一會,它真的「復刻」了一個同款產品出來。
雖然數據是Mock的,但UI布局、交互邏輯幾乎完美復刻。
這不僅是視覺理解能力,更是將視覺轉化為SwiftUI代碼的工程落地能力。
![]()
![]()
大神手搓:1天復刻「丐版Cursor」
為了驗證GLM-5的工程極限,一位資深開發者決定玩把大的:
從零手搓一個帶桌面UI的AI編程助手——GLMLIFE。
這相當于要做一個簡易版的Cursor。
![]()
任務扔給GLM-5后,它沒有上來就狂寫代碼,而是先甩出了一份專業的架構設計文檔(PLAN.md),并做出了極其成熟的技術選型:
直接采用了Monorepo架構,將項目精準拆解為三個核心包。
Core:負責Agent核心引擎與LLM適配;
CLI:處理命令行交互;
Desktop:基于Electron + React 18的桌面主程序。
![]()
從Zustand狀態管理到Tailwind樣式方案,再到復雜的IPC進程通信,GLM-5像個帶了十年團隊的技術總監,把技術選型安排得明明白白。
開發者原本以為要花三天配置環境,結果僅用一天就跑通了從環境搭建、核心邏輯實現到Electron打包的全流程。
打開GLMLIFE的那一刻,你很難相信這是AI在一天內「架構」出來的產物。


GLMLIFE制作迷你鋼琴實現過程
為什么它能成為「開源界的Opus」?
放眼全球,Claude Opus 4.6和GPT-5.3-Codex之所以備受追捧,是因為它們具備極強的「架構」能力。
Opus 4.6的暴力美學:16個AI分身自主分工,耗時兩周,從零構建了一個包含10萬行代碼的Rust編譯器,通過了99%的GCC壓力測試。
GPT-5.3的自我創造:它是OpenAI第一個「參與自身創造」的模型,在「出生」前就已介入訓練流程和集群部署。
然而,這一切都有一個致命的前提:它們不僅閉源,而且昂貴。
此時此刻,GLM-5的發布,便是中國開源大模型對Agentic時代的一次暴力破局。
它直接盯著閉源巨頭最不想放手的領域——系統級工程能力,做了一次「平替式」的進攻。
1. 新晉「后端架構師」
智譜團隊非常清楚,開源界不缺能寫Python腳本的模型,缺的是能處理臟活、累活、大活的模型。
GLM-5在訓練中大幅強化了后端架構設計、復雜算法實現和頑固Bug修復的權重,并且還實現了極強的自我反思機制。
在編譯失敗時,它會像一個成熟的工程師一樣,自主分析日志、定位根因、修改代碼、重新編譯,直到系統跑通。
2. 既然是干活,就要算賬
比肩Opus的性能,和開源的權重,讓GLM-5從某種程度上撼動了Anthropic和OpenAI構建起的圍墻花園。
本地部署:它不僅可以在完全隔離的內網中運行,并且還能針對公司的私有框架進行微調,成為最懂自家代碼的專員。
成本可控:用戶可以用消費級顯卡集群跑起一個強力的Coding Agent,不必每運行一次測試都要心疼錢。
屠榜SOTA
GLM-5的這次進化,只能用兩個字形容:暴力。
既然是面向復雜系統工程設計的基座模型,那規模肯定要拉滿。
參數量從355B(激活32B)一口氣干到了744B(激活40B),預訓練數據也從23T堆到了28.5T。
除了「大」,還得「省」。
眾所周知,Agent跑起來最燒錢的就是Token。
為了解決這個痛點,GLM-5首次集成了DeepSeek Sparse Attention(稀疏注意力)機制。
這讓它在處理超長上下文時,不僅能保持「無損」的記憶力,還能大幅降低部署成本。
還有個更狠的「黑科技」——全新的異步強化學習框架Slime。
配合大規模強化學習,讓模型不再是「一次性工具」,而是能在長跑中越跑越聰明的「長程選手」。
至于跑分,更是硬核:
代碼能力
SWE-bench Verified直接沖到77.8分,Terminal Bench 2.0一舉拿下56.2分,都是開源第一。這個成績不僅超了Gemini 3.0 Pro,更是直接貼臉Claude Opus 4.5。
![]()
Agent能力
BrowseComp(聯網檢索)、MCP-Atlas(工具調用)和τ2-Bench(復雜規劃),全線霸榜開源第一。
![]()
最有趣的是Vending Bench 2(自動售貨機經營測試)。
在這個測試中,模型得完全靠自己經營一年售貨機。
您猜怎么著,GLM-5到年底居然賺了4432美元,這水平都快趕上Opus 4.5了。
![]()
在開發者最關心的內部Claude Code評估集合中,GLM-5在前端、后端、長程任務等編程開發任務上顯著超越上一代的GLM-4.7(平均增幅超過20%)。
真實使用體感已經逼近Opus 4.5。
![]()
用AI造AI
當然,GLM-5的野心不止于模型,更在于重構我們手里的編程工具。
全球爆火的OpenClaw讓大家看到了AI操作電腦的潛能。
這次,智譜也推出了AutoGLM版本的OpenClaw。
在用原版時,光環境配置就需要折騰半天,現在官網一鍵部署。
想要個7x24小時幫你盯著推特、整理資訊、甚至寫腳本的「數字實習生」?點一下就有了。
同時發布的還有Z Code——
完全基于GLM-5能力誕生的新一代開發工具。
在Z Code里,你只管提需求,模型會自動拆解任務,甚至拉起一堆Agent并發干活:寫代碼、跑命令、Debug、預覽,最后連Git提交都幫你搞定。
甚至,你還可以用手機遠程指揮桌面端的Agent干活。
值得一提的是,就像OpenAI用Codex寫出了Codex,Z Code本身,也是GLM模型全程參與開發出來的。
國產算力的勝利
在GLM引爆全球流量、Agent需求激增的背后,一群「無名英雄」正默默支撐著海量的計算負荷。
為了確保每一行代碼、每一次 Agent 規劃都能穩定輸出,GLM-5已經深入國產算力的「腹地」,完成了與華為昇騰、摩爾線程、寒武紀、昆侖芯、沐曦、燧原、海光等主流平臺的深度適配。
通過底層算子級的精細化優化,讓GLM-5在國產芯片集群上也能跑出「高吞吐、低延遲」的滿血表現。
這意味著,我們不僅有了頂級的模型,還不被卡脖子。
結語
2026年的春天,編程大模型終于脫去了稚氣。
Karpathy所謂的「Agentic Engineering」,本質上是對AI提出了一種更嚴苛的「面試要求」:
以前(Vibe Coding):只要你會寫漂亮的HTML,我就錄用你。
現在(Agentic Coding):你需要懂Linux內核,懂500個微服務之間的調用關系,懂如何在不炸掉線上的前提下重構代碼,還要能自己規劃任務、自己修Bug。
GLM-5并不完美。
但在「構建復雜系統」這一核心命題上,它是目前開源界唯一能接住這波「Agentic浪潮」的選手。
Vibe Coding已經結束了。
別再問AI「能不能幫我寫個網頁」了。那是2025年的事情。
現在,試試問它:「能不能幫我重構這個高并發系統的核心模塊?」
GLM-5,Ready to Build!
彩蛋
GLM-5已經納入Max用戶套餐,Pro將盡快在5天內支持!
并且剛剛智譜宣布漲價,今年的Token注定是要漲價的!
![]()
趕快去體驗吧!
官方API接入
·BigModel開放平臺:
https://docs.bigmodel.cn/cn/guide/models/text/glm-5
·Z.ai:
https://docs.z.ai/guides/llm/glm-5
·OpenClaw接入文檔:
https://docs.bigmodel.cn/cn/coding-plan/tool/openclaw
開源鏈接
·GitHub:
https://github.com/zai-org/GLM-5
·Hugging Face:
https://huggingface.co/zai-org/GLM-5
·ModelScope:
https://modelscope.cn/models/ZhipuAI/GLM-5
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.