![]()
關于那個神秘的「Pony Alpha」模型的傳言,已經在互聯網發酵了一周。
有人說它是 Claude 5 的馬甲,有人說它是某大廠的秘密武器。就在剛剛,靴子落地,謎底揭曉:這個代號「Pony Alpha」的新模型,正是智譜 AI 的春節大招——GLM-5。
![]()
▲智譜公眾號截圖
而且,它直接開源了。
如果說 2025 年是 AI 學會寫代碼的一年,那么 2026 年開年,正如特斯拉前 AI 總監 Andrej Karpathy 所預言,我們或許即將進入「智能體工程」(Agentic Engineering)時代。
只不過,比起 GPT-5.3-Codex、Claude Opus 4.6,頭一個把這件事做成開源基礎設施的,是國產模型 GLM-5。
附體驗地址:
- Z.ai:https://chat.z.ai
- 智譜清言APP/網頁版:https://chatglm.cn
現在的 AI 寫個貪吃蛇或者俄羅斯方塊,早就不是什么新鮮事了。要測,就得測點刁鉆的。
我們給 GLM-5 拋出了一個極其具體的物理模擬需求:
「創建一個交互式的 HTML、CSS 和 JavaScript 衛星系統模擬程序,該程序應模擬衛星向地面接收器發送信號的過程。模擬程序應顯示一顆衛星繞地球運行,并周期性地發送信號,這些信號會被多個地面接收器接收。

它沒有立刻給出代碼,而是稍微「停頓」了一下(模擬思考過程),最終按照我的需求生成了一個 HTML 網頁。屏幕上,衛星不僅僅在轉圈,信號傳輸甚至帶有符合多普勒效應視覺隱喻的波紋擴散動畫。
它理解了「模擬」二字背后的物理規律,而不僅僅是理解了「畫圖」這個動作。
接著,我們加大了難度。
X 上有個叫 @scaling01 的用戶,給出了一個極高的評價:「Pony-Alpha 要么是 AGI,要么就是把我的 SVG 題目庫給背下來了。」
![]()
為了驗證這一點,我們測試了一個極其抽象的 Python 任務:「可視化展示單行道中交通信號燈的工作原理,車輛以隨機速率進入。」
不到 3 分鐘,一個動態的交通流模擬圖出現了。

邏輯可以說是嚴絲合縫:綠燈放行、紅燈排隊,車輛加速減速的隨機性也模擬得很到位。不過,這個界面的審美……怎么說呢,確實有點「簡陋」。
甚至有網友 @anurudhsharmaa 用它一行提示詞生成了一個有審美的網站。

而網友 @zakarinoo7 生成了一個全功能的媒體播放器——支持 MP4/MP3 解碼、播放列表管理,甚至連深色模式的 UI 都寫好了,編譯完只有 15MB。

這一幕看得我心癢難耐。于是,我也再次通過 Claude Code ,讓 GLM-5 給我打造打一個火柴人開放世界游戲。
它沒有急著寫代碼,它做了一個非常「人類」的動作,那就從技術棧、核心玩法、再到世界風格方面入手,逐步對接我的需求。
![]()
并且在它「施工」的過程中,我還能像個挑剔的甲方一樣,開始在原來的需求上得寸進尺,隨時插入新的想法:
![]()
- 光跑圖太無聊了,得有經濟系統,地上隨機刷金幣
- 加點動作元素吧,按 J 鍵射箭,按 K 鍵近戰攻擊
- 撿到的東西放哪?再給我加個背包 UI,按 I 鍵喚出
- 路邊的火柴人不能是擺設,我要能和 NPC 對話
等到最終運行的時候,效果簡直可以用「盡善盡美」來形容:

既然號稱是系統架構師,在 GLM-5 上架官網后,我也順手讓其打造了一個 Mac 系統。

雖然整體有些粗糙,但經典的屏幕背景,頂部狀態欄的時間同步顯示,底部 Dock 欄的圖標排列都給「畫」出來了。而且這上面的每一個應用,竟然真的都能打開。
適配半個芯片圈,這才是 GLM-5 的「大殺招」
基準測試結果顯示,GLM-5 在 Coding 與 Agent 能力上,取得開源 SOTA 表現。
數據不會撒謊,在 SWE-bench-Verified 和 Terminal Bench 2.0 這兩個公認最難的編程榜單中,GLM-5 分別拿下了 77.8 和 56.2 的高分,在真實編程場景的體感上,已經無限逼近 Claude Opus 4.5。
![]()
GLM-5 憑什么能做到這一點?翻看官方報告,在一堆參數背后,我們找到了幾個關鍵點:MoE 架構和異步強化學習(Asynchronous RL)。
744B 的總參數量,激活參數只有 40B,這讓它足夠聰明又足夠輕量。但真正的殺手锏是智譜構建的全新「Slime」框架。
簡單打個比方: 以前的模型訓練像是在「考試」,做對一道題給一個分,模型為了拿高分拼命背題; GLM-5 的訓練則像是「實習」,它在一個名為 Slime 的環境里,通過完成一個個完整的長程項目,在不斷的反饋和交互中學習。
此外,它還首次集成了 DeepSeek Sparse Attention(稀疏注意力機制)。這意味著在處理動輒幾十萬行代碼的上下文時,它不僅不會「迷路」,還能大幅降低部署成本。
但最讓我感慨的,是官方公告底部那串長長的致謝名單。國產大模型已經可以在國產芯片集群上,實現高吞吐、低延遲的穩定運行了。
華為昇騰、摩爾線程、寒武紀、昆侖芯、沐曦、燧原、海光……
![]()
▲ 有種可汗大點兵的即視感
這幾乎是中國半導體行業的「半壁江山」,這意味著,GLM-5 的開源不僅僅是軟件層面的勝利,它標志著國產 AI 生態——從底層的芯片算力,到中間的框架,再到上層的模型逐漸跑通了一個完整的閉環。
而隨著 GLM-5 的開源,以及它與 Claude Code、OpenCode 等主流工具的打通,我們或許正站在軟件工程 2.0 的門檻上。
特斯拉前 AI 總監 Andrej Karpathy 預言的「智能體工程」時代,比想象中來得更快。在未來,你可能不需要再逐行砌磚。你只需要定義系統,定義審美,定義什么是「好玩」和「有用」。
然后,看著 GLM-5 這樣的大模型像包工頭一樣,指揮著底層的算力把高樓大廈蓋起來。
傳統的「碼農」時代,可能真的要結束了。
但別慌,這不代表人類沒用了。相反,當 AI 包辦了實現的繁瑣,你的審美、你的判斷力、以及你提出一個好問題的能力,將成為人類最后的、也是最堅固的護城河。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.