網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

智譜GLM-4.7：Coding和Agentic能力直逼Gemini 3和Claude 4.5｜后端大幅提升

2025-12-23 11:53:03　來(lái)源: AI進(jìn)化論花生

北京舉報(bào)

分享至

之前給大家寫過(guò)很多文章介紹GLM-4.5和GLM-4.6了，對(duì)我來(lái)說(shuō)，智譜最近幾代模型都是Claude模型的最佳開源平替之一，是性價(jià)比極高的選擇，他們也是國(guó)內(nèi)最關(guān)注Coding領(lǐng)域的大模型公司之一，持續(xù)在Coding領(lǐng)域發(fā)力，你可以從最近幾個(gè)模型版本的迭代看出他們的進(jìn)步。

昨晚，智譜又開源了GLM-4.7，先看官方數(shù)據(jù)，這次智譜交的答卷確實(shí)亮眼。

幾個(gè)關(guān)鍵數(shù)字：

AIME25考了95.7分，這是數(shù)學(xué)推理榜單，開源SOTA。

SWE-bench Verified達(dá)到73.8%，比GLM-4.6提升了5.8個(gè)百分點(diǎn)（這個(gè)數(shù)據(jù)還挺猛）。這個(gè)榜單測(cè)的是解決GitHub真實(shí)issue的能力，開源第一。

HLE（人類終極測(cè)驗(yàn)）在使用工具的模式下考了42.8分，甚至超過(guò)了GPT-5.1 High模式，說(shuō)明推理能力和工具調(diào)用結(jié)合的能力都相當(dāng)強(qiáng)

還有τ2-Bench（工具調(diào)用）87.4分，甚至超過(guò)了Claude Sonnet 4.5。

除了官方公布的數(shù)據(jù)，我還特意去LMArena看了下真實(shí)用戶的評(píng)測(cè)對(duì)比，發(fā)現(xiàn)GLM-4.7不只是妥妥的開源第一，也是超過(guò)了GPT-5.2（常規(guī)和Medium版本）和Claude Sonnet 4.5，這是上千個(gè)用戶在盲測(cè)情況下給出的評(píng)價(jià)，我覺(jué)得挺值得信任的，說(shuō)明GLM-4.7在應(yīng)對(duì)不同的編程任務(wù)時(shí)，都有相當(dāng)穩(wěn)定的好表現(xiàn)。

智譜這次針對(duì)Claude Code、Kilo Code、TRAE、Cline、Roo Code做了專項(xiàng)優(yōu)化，支持"先思考、再行動(dòng)"的工作模式。說(shuō)人話就是：它知道自己在干什么，不是無(wú)腦輸出。

我從昨晚開始就一直在測(cè)試，分別用智譜的ChatBot https://chat.z.ai/ 和用API接入Claude Code跑了5個(gè)真實(shí)案例，我用完的感受是審美、Coding和Agentic能力都達(dá)到了Claude Sonnet 4.5無(wú)差的水平。

五大案例實(shí)測(cè)

我之前在介紹GLM系列模型的時(shí)候，都是把他們接入Claude Code使用的，但這次我發(fā)現(xiàn)他們的chatbot https://chat.z.ai/ 也升級(jí)了不少，尤其是主頁(yè)上列出的「AI PPT」「全棧開發(fā)」「靈感畫布」都明顯是針對(duì)特定場(chǎng)景優(yōu)化過(guò)的。官方提到他們是增加了Skills工具模塊。說(shuō)白了就是能調(diào)用更多工具，處理更復(fù)雜的任務(wù)。

所以在這次測(cè)試?yán)铮揖桶亚皟蓚€(gè)任務(wù)交給z.ai完成，后面三個(gè)任務(wù)再用Claude Code + GLM-4.7去做，尤其是最后一個(gè)任務(wù)，我會(huì)去讓GLM-4.7去完成我那包含上千字prompt，以及10個(gè)以上流程要求的自動(dòng)化寫作工作流，看看他到底能不能完美遵循指令完成。

任務(wù)一：制作阿凡達(dá) PPT

我給了個(gè)很簡(jiǎn)單的Prompt：

幫我查找信息深入介紹下《阿凡達(dá)》系列，以及他的導(dǎo)演，我要思考下要不要去看這個(gè)電影

GLM-4.7的執(zhí)行流程讓我印象深刻，整個(gè)過(guò)程像是一個(gè)"專項(xiàng)優(yōu)化過(guò)的Claude Code"。

它先理解需求，知道我要"深入介紹"，不是淺嘗輒止。然后開始搜索：《阿凡達(dá)》系列電影信息、導(dǎo)演詹姆斯·卡梅隆資料、影評(píng)和觀眾評(píng)價(jià)。搜完之后會(huì)思考，判斷哪些信息重要，怎么組織。接著查找高質(zhì)量的電影海報(bào)和導(dǎo)演照片。最后生成PPT：封面、導(dǎo)演介紹、阿凡達(dá)1、2、3的介紹、系列特點(diǎn)、觀影建議。

整個(gè)過(guò)程中，GLM-4.7不停地思考、搜索、驗(yàn)證。每一條信息都被用到了實(shí)際的PPT中，沒(méi)有浪費(fèi)。

生成的PPT質(zhì)量超出預(yù)期。

版式是16:9寬屏完美適配，沒(méi)有溢出。這是GLM-4.7的重點(diǎn)優(yōu)化，以前這是最頭疼的問(wèn)題。配色是深藍(lán)+金色方案，符合電影的科幻氛圍，不是那種一眼就看出是AI生成的配色。圖片也很贊，自動(dòng)搜索到高質(zhì)量的電影海報(bào)、導(dǎo)演照片、拍攝花絮，每張圖都貼合主題。

內(nèi)容也不是簡(jiǎn)單的資料堆砌，而是有邏輯的介紹。信息準(zhǔn)確、結(jié)構(gòu)清晰、有深度。

更關(guān)鍵的是，這個(gè)PPT可以在網(wǎng)頁(yè)上直接編輯內(nèi)容，也可以導(dǎo)出為可編輯的pptx文檔。

我的感受：Agentic能力確實(shí)強(qiáng)，給一個(gè)模糊的需求，它能自己分解、執(zhí)行、驗(yàn)證。審美也在線，版式、配色、圖片選擇都很專業(yè)，不需要手動(dòng)調(diào)整。從需求到成品，5分鐘搞定。

案例鏈接：https://chat.z.ai/space/h0hugaszyqv0-ppt

任務(wù)二：制作澳大利亞鳥類海報(bào)

有加我微信或者關(guān)注我即刻的朋友，大概能知道我最近在澳洲有多愛(ài)看鳥，澳洲實(shí)在有太多有趣又獨(dú)特的小動(dòng)物里。

所以第二個(gè)案例，我想讓GLM-4.7幫我制作一個(gè)關(guān)于澳洲鳥類的介紹海報(bào)。

這個(gè)任務(wù)還是在z.ai上執(zhí)行，這次用"靈感畫板"功能。

Prompt：

幫我制作一個(gè)吸引鳥類愛(ài)好者來(lái)澳大利亞旅行的宣傳海報(bào)

這個(gè)任務(wù)比PPT更抽象，需要GLM-4.7理解目標(biāo)受眾、設(shè)計(jì)風(fēng)格、視覺(jué)元素。

GLM-4.7的執(zhí)行過(guò)程和做PPT時(shí)一樣，像是專項(xiàng)優(yōu)化過(guò)的Claude Code。我知道現(xiàn)在很多人喜歡用Nano Banana Pro去生成海報(bào)或者信息卡片的，那確實(shí)會(huì)是更省事的方式。不過(guò)如果要考慮復(fù)雜內(nèi)容中圖片的真實(shí)和文字的穩(wěn)定性的話，帶Agentic和Coding能力的模型會(huì)把這個(gè)任務(wù)完成得更好。

它先理解需求：目標(biāo)受眾是鳥類愛(ài)好者，目的是吸引來(lái)澳大利亞旅行，風(fēng)格要有吸引力、專業(yè)感。然后思考設(shè)計(jì)方案：視覺(jué)元素用澳大利亞特色鳥類（葵花鸚鵡、琴鳥、笑翠鳥），配色方案用自然、明亮的色系，排版要重點(diǎn)突出。接著搜索澳大利亞鳥類高清圖片、自然風(fēng)光，驗(yàn)證鳥類品種名稱和地理位置。最后生成海報(bào)：主視覺(jué)、標(biāo)題、明星鳥種、推薦目的地等。

不停思考、搜索、驗(yàn)證，確保信息準(zhǔn)確。

生成的海報(bào)質(zhì)量也很贊。

主視覺(jué)是高質(zhì)量的澳大利亞鳥類圖片，色彩鮮艷、細(xì)節(jié)清晰。排版的信息層級(jí)清晰，視覺(jué)動(dòng)線流暢：標(biāo)題→主視覺(jué)→推薦觀鳥地→聯(lián)系方式，一氣呵成。配色是明亮的自然色系，符合"觀鳥旅行"的主題，不會(huì)太花哨，也不會(huì)太單調(diào)。文案也不是干巴巴的介紹，而是有感染力的文字。

鳥類品種名稱、地理位置都準(zhǔn)確，這是Agentic能力的體現(xiàn)。

和PPT一樣，海報(bào)也可以在網(wǎng)頁(yè)上直接編輯，或?qū)С龈咔鍒D片。

我的感受：創(chuàng)意能力很強(qiáng)，從抽象需求到具體設(shè)計(jì)方案，轉(zhuǎn)化很流暢。審美在線，排版、配色、圖片選擇都很專業(yè)。信息準(zhǔn)確性也很高，沒(méi)有亂編。

案例鏈接：https://chat.z.ai/space/b0yuzae7svj0-ppt

任務(wù)三：制作設(shè)計(jì)師個(gè)人主頁(yè)

我們?cè)倩氐紺laude Code來(lái)測(cè)測(cè)GLM-4.7 Agentic能力和Coding審美。

下面是我最常用的一段網(wǎng)頁(yè)設(shè)計(jì)提示詞，包含產(chǎn)品經(jīng)理→設(shè)計(jì)師→前端工程師的完整流程，很考驗(yàn)?zāi)Ｐ蛯?duì)復(fù)雜的、結(jié)構(gòu)化的Prompt的遵循能力。

Prompt簡(jiǎn)化版本如下：

# 1. 你的任務(wù)
## 1.1 目標(biāo)描述
- 根據(jù)我的描述,幫我創(chuàng)建一個(gè)設(shè)計(jì)出色,內(nèi)容豐富,用戶體驗(yàn)友好的網(wǎng)站。
- 網(wǎng)站主題：AI工具導(dǎo)航站

 # 2. 工作流程

 ## 作為產(chǎn)品經(jīng)理執(zhí)行工作
### 2.1.1 采用逆向工作法,先撰寫1000字深入思考過(guò)產(chǎn)品的PRFAQ
### 2.1.2 需求洞察,穿透用戶表述,補(bǔ)齊顯性與隱性需求
### 2.1.3 結(jié)構(gòu)輸出PRD文檔,明確目標(biāo)用戶、功能、優(yōu)先級(jí)

 ## 作為設(shè)計(jì)師執(zhí)行工作
### 2.2.1 執(zhí)行設(shè)計(jì)靈感采樣
- 從靈感池中隨機(jī)采樣2位藝術(shù)家/設(shè)計(jì)師
- 給出"靈感 → 網(wǎng)頁(yè)實(shí)現(xiàn)"的轉(zhuǎn)譯說(shuō)明
- 靈感池包含：Josef Müller-Brockmann、John Maeda、Dieter Rams等60+位

 ### 2.2.2 交互與視覺(jué)方案
### 2.2.3 設(shè)計(jì)系統(tǒng)（色彩、字體、柵格）

 ## 作為前端工程師完成代碼
### 2.3.1 交付完整的 HTML/CSS/JS 代碼
### 2.3.2 三斷點(diǎn)響應(yīng)式
### 2.3.3 必須引入真實(shí)圖片（Picsum等）

完整Prompt大約200行，包含詳細(xì)的設(shè)計(jì)原則、代碼要求、靈感來(lái)源池等。

模型對(duì)提示詞的遵從性確實(shí)非常的好，每一步都是按照我的要求來(lái)執(zhí)行，先完成的產(chǎn)品經(jīng)理部分的工作，然后又繼續(xù)設(shè)計(jì)師的工作，并且按照我的要求對(duì)設(shè)計(jì)風(fēng)格進(jìn)行了采用。

最后實(shí)現(xiàn)的結(jié)果也非常符合我的預(yù)期，在保持簡(jiǎn)潔的設(shè)計(jì)師風(fēng)格的前提下，維持了相當(dāng)?shù)囊曈X(jué)克制和審美要求，完全不是一眼AI的那種網(wǎng)頁(yè)。

任務(wù)四：播客App原型設(shè)計(jì)

長(zhǎng)期關(guān)注花叔的同學(xué)應(yīng)該都了解，我去做iOS app開發(fā)時(shí)，最喜歡的一個(gè)步驟就是先用AI來(lái)幫我生成幾套原型。原型一方面是能讓自己的想法獲得更視覺(jué)化地呈現(xiàn)，幫助自己思考想要獲得一個(gè)什么樣的產(chǎn)品。

另一方面也是通過(guò)這個(gè)步驟，你可以讓AI做出好得多的設(shè)計(jì)，如果你一上來(lái)就讓AI Coding工具直接寫swift代碼的話，那做出的產(chǎn)品常常是沒(méi)法看的。

這個(gè)任務(wù)我用的Prompt是：

# App 原型設(shè)計(jì)提示詞

 ## 目標(biāo)
我想開發(fā)一個(gè) {類似小宇宙的播客app},現(xiàn)在需要輸出高保真的原型圖,請(qǐng)通過(guò)以下方式幫我完成所有界面的原型設(shè)計(jì),并確保這些原型界面可以直接用于開發(fā)：

 ## 1、用戶體驗(yàn)分析
- 先分析這個(gè) App 的主要功能和用戶需求,確定核心交互邏輯。

 ## 2、產(chǎn)品界面規(guī)劃
- 作為產(chǎn)品經(jīng)理,定義關(guān)鍵界面,確保信息架構(gòu)合理。

 ## 3、高保真 UI 設(shè)計(jì)
- 作為 UI 設(shè)計(jì)師,設(shè)計(jì)貼近真實(shí) iOS/Android 設(shè)計(jì)規(guī)范的界面,使用現(xiàn)代化的 UI 元素,使其具有良好的視覺(jué)體驗(yàn)。

 ## 4、HTML 原型實(shí)現(xiàn)
- 使用 HTML + Tailwind CSS（或 Bootstrap）生成所有原型界面,并使用 FontAwesome（或其他開源 UI 組件）讓界面更加精美、接近真實(shí)的 App 設(shè)計(jì)。
- 拆分代碼文件,保持結(jié)構(gòu)清晰：

 ### 4.1 頁(yè)面文件要求
- 每個(gè)界面應(yīng)作為獨(dú)立的 HTML 文件存放,例如 home.html、profile.html、settings.html 等。
- index.html 作為主入口,不直接寫入所有界面的 HTML 代碼,而是使用 iframe 的方式嵌入這些 HTML 片段,并將所有頁(yè)面直接平鋪展示在 index 頁(yè)面中,而不是跳轉(zhuǎn)鏈接。

 ### 4.2 真實(shí)感增強(qiáng)
- 界面尺寸應(yīng)模擬 iPhone 15 Pro,并讓界面圓角化,使其更像真實(shí)的手機(jī)界面。
- 使用真實(shí)的 UI 圖片,而非占位符圖片（可從 Unsplash、Pexels、Apple 官方 UI 資源中選擇）。
- 添加頂部狀態(tài)欄（模擬 iOS 狀態(tài)欄）,并包含 App 導(dǎo)航欄（類似 iOS 底部 Tab Bar）。

 ## 5、交付要求
- 請(qǐng)按照以上要求生成完整的 HTML 代碼,并確保其可用于實(shí)際開發(fā)。

這是一次性得到的效果圖：

設(shè)計(jì)的原型中包含了首頁(yè)、播放器、訂閱、個(gè)人中心、播客詳情、搜索等頁(yè)面，非常完整。這套提示詞最早是從Claude 3.7發(fā)布的時(shí)候開發(fā)的。一直到Claude 4時(shí)代，模型返回的結(jié)果一般都會(huì)出些問(wèn)題，比如部分圖片會(huì)是裂開的，圓角矩形或者劉海屏效果不好，又或者很多網(wǎng)頁(yè)根本不會(huì)在手機(jī)樣式的容器內(nèi)等等。

現(xiàn)在GLM-4.7和Claude Sonnet 4.5提供的感受可以說(shuō)是完全一致了，一次性完美成功。

任務(wù)五：自動(dòng)化寫作

這是最重要的案例。

首先說(shuō)下這個(gè)任務(wù)的測(cè)試前提是，我在10月份搭建完成了這套Claude Code自動(dòng)化寫作系統(tǒng)，既能寫文章，也能幫我寫視頻腳本、自動(dòng)整理信息等，詳情可以看這篇文章的介紹：

而在文章寫作部分，你可以理解為這套agent是搭建在兩個(gè)嵌套的Claude.md文檔基礎(chǔ)上的，因?yàn)槲移谕@套現(xiàn)在系統(tǒng)適配的能力越來(lái)越多，所以現(xiàn)在這兩個(gè)claude.md文件分別膨脹到了570行和1212行，非常恐怖。

但所實(shí)現(xiàn)的效果也確實(shí)很強(qiáng)，現(xiàn)在已經(jīng)至少能幫我節(jié)省80%以上的寫作時(shí)間了。

我要交給GLM-4.7的是這么個(gè)任務(wù)，我早上看到了YouTube上YC做了期關(guān)于AI泡沫的視頻播客，我希望寫篇文章介紹這期視頻播客的內(nèi)容。

我提供的提示詞要求無(wú)比簡(jiǎn)單

我想寫一篇介紹這個(gè)視頻所討論的內(nèi)容的公眾號(hào)文章：https://www.youtube.com/watch?v=cqrJzG03ENE

然后GLM-4.7就開始吭呲吭呲干活了

Phase 1: 視頻處理（自動(dòng)化）

GLM-4.7自動(dòng)識(shí)別出輸入的是YouTube視頻鏈接，隨后完整執(zhí)行了視頻處理標(biāo)準(zhǔn)流程：下載字幕、提取純文本、抓取視頻信息、內(nèi)容分析等步驟，準(zhǔn)確識(shí)別了視頻主題、核心議題與主要信息。

Phase 2: 選題討論

緊接著，GLM-4.7沒(méi)有直接開寫，而是先基于內(nèi)容提出了兩種不同的選題方案，并給出各自的大綱結(jié)構(gòu)及優(yōu)劣分析，等待用戶選擇（我選擇了“AI泡沫真相”視角的方案A）。

Phase 3: 知識(shí)管理

確定選題后，GLM-4.7整理提煉出視頻關(guān)鍵信息和議題，形成知識(shí)條目，方便后續(xù)引用和內(nèi)容生成。

Phase 4: 風(fēng)格學(xué)習(xí)

自動(dòng)讀取參考文檔與過(guò)往范文，分析吸收目標(biāo)寫作風(fēng)格和審校要點(diǎn)。

Phase 5: 創(chuàng)作初稿

根據(jù)上述整理與風(fēng)格學(xué)習(xí)，生成了結(jié)構(gòu)和風(fēng)格都接近目標(biāo)的高質(zhì)量初稿。

Phase 6: 三遍審校

內(nèi)容審校：確保文章事實(shí)準(zhǔn)確、結(jié)構(gòu)合理、邏輯清晰、關(guān)鍵信息完整，不添加無(wú)來(lái)源內(nèi)容。
風(fēng)格審校：對(duì)AI腔、流水線表達(dá)等問(wèn)題逐段優(yōu)化，讓整體語(yǔ)言更自然、更具“人味”。
細(xì)節(jié)打磨：修正錯(cuò)別字、句式、節(jié)奏等小問(wèn)題，進(jìn)一步提升可讀性。

整體來(lái)看，GLM-4.7完整還原了復(fù)雜工作流，分步驟自動(dòng)完成了視頻處理、知識(shí)提煉、選題、風(fēng)格學(xué)習(xí)、創(chuàng)作與三輪審校，每一步均有對(duì)應(yīng)落地動(dòng)作和流程細(xì)節(jié)，除了必要的選題之外，不需要我的額外指令或干預(yù)。

可以說(shuō)，你用GLM-4.7+Claude Code就能搭建出和我相同質(zhì)量的，屬于你自己的自動(dòng)化寫作agent了。

測(cè)完這5個(gè)案例，有個(gè)很明確的感受：GLM-4.7是開源模型的新標(biāo)桿。

Coding和Agentic能力確實(shí)直逼Gemini 3和Claude 4.5。特別是審美提升，讓AI生成的內(nèi)容真的"能用"了，國(guó)產(chǎn)開源模型真的起來(lái)了。

還有個(gè)我想單獨(dú)提一下的：后端。

這次測(cè)試能這么順利，很大程度上是因?yàn)镚LM-4.7的后端確實(shí)很穩(wěn)。五個(gè)案例里，有四個(gè)都是復(fù)雜的多步驟任務(wù)（特別是最后一個(gè)自動(dòng)化寫作，涉及上百次工具調(diào)用），整個(gè)過(guò)程沒(méi)有任何卡頓或失敗。

想給產(chǎn)品加AI功能或者注冊(cè)/登錄能力，只需要把后端接入文檔提供給他，基本上也是一次性完成。和之前用過(guò)的幾個(gè)主流模型相比，GLM-4.7在后端穩(wěn)定性上確實(shí)有明顯優(yōu)勢(shì)。

這點(diǎn)可能不太容易被注意到，但實(shí)際用的時(shí)候差別很大。

我的建議是：

如果你想做內(nèi)容創(chuàng)作，比如PPT、海報(bào)等，可以試試z.ai。

想做開發(fā)，試試Claude Code + GLM-4.7。

對(duì)了，我發(fā)現(xiàn)智譜主頁(yè)還在做一個(gè)GLM Coding Plan體驗(yàn)卡的活動(dòng)，我是Pro用戶，可以給5個(gè)同學(xué)送7天體驗(yàn)卡，告訴我你想做什么項(xiàng)目，我會(huì)把我的體驗(yàn)卡邀請(qǐng)鏈接送給前五個(gè)回復(fù)自己想做的項(xiàng)目?jī)?nèi)容的同學(xué)。

以及，我發(fā)現(xiàn)他們還有個(gè)“拼好模”，通過(guò)我的二維碼注冊(cè)購(gòu)買，可以享受額外10%的優(yōu)惠，以及，我也能回回血，獲得一些贈(zèng)金，用來(lái)維持我的Pro訂閱，給大家多做做測(cè)試的。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.