之前給大家寫(xiě)過(guò)很多文章介紹GLM-4.5和GLM-4.6了,對(duì)我來(lái)說(shuō),智譜最近幾代模型都是Claude模型的最佳開(kāi)源平替之一,是性?xún)r(jià)比極高的選擇,他們也是國(guó)內(nèi)最關(guān)注Coding領(lǐng)域的大模型公司之一,持續(xù)在Coding領(lǐng)域發(fā)力,你可以從最近幾個(gè)模型版本的迭代看出他們的進(jìn)步。
昨晚,智譜又開(kāi)源了GLM-4.7,先看官方數(shù)據(jù),這次智譜交的答卷確實(shí)亮眼。
![]()
幾個(gè)關(guān)鍵數(shù)字:
AIME25考了95.7分,這是數(shù)學(xué)推理榜單,開(kāi)源SOTA。
SWE-bench Verified達(dá)到73.8%,比GLM-4.6提升了5.8個(gè)百分點(diǎn)(這個(gè)數(shù)據(jù)還挺猛)。這個(gè)榜單測(cè)的是解決GitHub真實(shí)issue的能力,開(kāi)源第一。
HLE(人類(lèi)終極測(cè)驗(yàn))在使用工具的模式下考了42.8分,甚至超過(guò)了GPT-5.1 High模式,說(shuō)明推理能力和工具調(diào)用結(jié)合的能力都相當(dāng)強(qiáng)
還有τ2-Bench(工具調(diào)用)87.4分,甚至超過(guò)了Claude Sonnet 4.5。
除了官方公布的數(shù)據(jù),我還特意去LMArena看了下真實(shí)用戶(hù)的評(píng)測(cè)對(duì)比,發(fā)現(xiàn)GLM-4.7不只是妥妥的開(kāi)源第一,也是超過(guò)了GPT-5.2(常規(guī)和Medium版本)和Claude Sonnet 4.5,這是上千個(gè)用戶(hù)在盲測(cè)情況下給出的評(píng)價(jià),我覺(jué)得挺值得信任的,說(shuō)明GLM-4.7在應(yīng)對(duì)不同的編程任務(wù)時(shí),都有相當(dāng)穩(wěn)定的好表現(xiàn)。
![]()
智譜這次針對(duì)Claude Code、Kilo Code、TRAE、Cline、Roo Code做了專(zhuān)項(xiàng)優(yōu)化,支持"先思考、再行動(dòng)"的工作模式。說(shuō)人話(huà)就是:它知道自己在干什么,不是無(wú)腦輸出。
我從昨晚開(kāi)始就一直在測(cè)試,分別用智譜的ChatBot https://chat.z.ai/ 和用API接入Claude Code跑了5個(gè)真實(shí)案例,我用完的感受是審美、Coding和Agentic能力都達(dá)到了Claude Sonnet 4.5無(wú)差的水平。
五大案例實(shí)測(cè)
我之前在介紹GLM系列模型的時(shí)候,都是把他們接入Claude Code使用的,但這次我發(fā)現(xiàn)他們的chatbot https://chat.z.ai/ 也升級(jí)了不少,尤其是主頁(yè)上列出的「AI PPT」「全棧開(kāi)發(fā)」「靈感畫(huà)布」都明顯是針對(duì)特定場(chǎng)景優(yōu)化過(guò)的。官方提到他們是增加了Skills工具模塊。說(shuō)白了就是能調(diào)用更多工具,處理更復(fù)雜的任務(wù)。
![]()
所以在這次測(cè)試?yán)铮揖桶亚皟蓚€(gè)任務(wù)交給z.ai完成,后面三個(gè)任務(wù)再用Claude Code + GLM-4.7去做,尤其是最后一個(gè)任務(wù),我會(huì)去讓GLM-4.7去完成我那包含上千字prompt,以及10個(gè)以上流程要求的自動(dòng)化寫(xiě)作工作流,看看他到底能不能完美遵循指令完成。
任務(wù)一:制作阿凡達(dá) PPT
我給了個(gè)很簡(jiǎn)單的Prompt:
幫我查找信息深入介紹下《阿凡達(dá)》系列,以及他的導(dǎo)演,我要思考下要不要去看這個(gè)電影
GLM-4.7的執(zhí)行流程讓我印象深刻,整個(gè)過(guò)程像是一個(gè)"專(zhuān)項(xiàng)優(yōu)化過(guò)的Claude Code"。
它先理解需求,知道我要"深入介紹",不是淺嘗輒止。然后開(kāi)始搜索:《阿凡達(dá)》系列電影信息、導(dǎo)演詹姆斯·卡梅隆資料、影評(píng)和觀(guān)眾評(píng)價(jià)。搜完之后會(huì)思考,判斷哪些信息重要,怎么組織。接著查找高質(zhì)量的電影海報(bào)和導(dǎo)演照片。最后生成PPT:封面、導(dǎo)演介紹、阿凡達(dá)1、2、3的介紹、系列特點(diǎn)、觀(guān)影建議。
整個(gè)過(guò)程中,GLM-4.7不停地思考、搜索、驗(yàn)證。每一條信息都被用到了實(shí)際的PPT中,沒(méi)有浪費(fèi)。
生成的PPT質(zhì)量超出預(yù)期。
![]()
![]()
版式是16:9寬屏完美適配,沒(méi)有溢出。這是GLM-4.7的重點(diǎn)優(yōu)化,以前這是最頭疼的問(wèn)題。配色是深藍(lán)+金色方案,符合電影的科幻氛圍,不是那種一眼就看出是AI生成的配色。圖片也很贊,自動(dòng)搜索到高質(zhì)量的電影海報(bào)、導(dǎo)演照片、拍攝花絮,每張圖都貼合主題。
內(nèi)容也不是簡(jiǎn)單的資料堆砌,而是有邏輯的介紹。信息準(zhǔn)確、結(jié)構(gòu)清晰、有深度。
更關(guān)鍵的是,這個(gè)PPT可以在網(wǎng)頁(yè)上直接編輯內(nèi)容,也可以導(dǎo)出為可編輯的pptx文檔。
![]()
我的感受:Agentic能力確實(shí)強(qiáng),給一個(gè)模糊的需求,它能自己分解、執(zhí)行、驗(yàn)證。審美也在線(xiàn),版式、配色、圖片選擇都很專(zhuān)業(yè),不需要手動(dòng)調(diào)整。從需求到成品,5分鐘搞定。
案例鏈接:https://chat.z.ai/space/h0hugaszyqv0-ppt
任務(wù)二:制作澳大利亞鳥(niǎo)類(lèi)海報(bào)
有加我微信或者關(guān)注我即刻的朋友,大概能知道我最近在澳洲有多愛(ài)看鳥(niǎo),澳洲實(shí)在有太多有趣又獨(dú)特的小動(dòng)物里。
![]()
所以第二個(gè)案例,我想讓GLM-4.7幫我制作一個(gè)關(guān)于澳洲鳥(niǎo)類(lèi)的介紹海報(bào)。
這個(gè)任務(wù)還是在z.ai上執(zhí)行,這次用"靈感畫(huà)板"功能。
Prompt:
幫我制作一個(gè)吸引鳥(niǎo)類(lèi)愛(ài)好者來(lái)澳大利亞旅行的宣傳海報(bào)
這個(gè)任務(wù)比PPT更抽象,需要GLM-4.7理解目標(biāo)受眾、設(shè)計(jì)風(fēng)格、視覺(jué)元素。
GLM-4.7的執(zhí)行過(guò)程和做PPT時(shí)一樣,像是專(zhuān)項(xiàng)優(yōu)化過(guò)的Claude Code。我知道現(xiàn)在很多人喜歡用Nano Banana Pro去生成海報(bào)或者信息卡片的,那確實(shí)會(huì)是更省事的方式。不過(guò)如果要考慮復(fù)雜內(nèi)容中圖片的真實(shí)和文字的穩(wěn)定性的話(huà),帶Agentic和Coding能力的模型會(huì)把這個(gè)任務(wù)完成得更好。
它先理解需求:目標(biāo)受眾是鳥(niǎo)類(lèi)愛(ài)好者,目的是吸引來(lái)澳大利亞旅行,風(fēng)格要有吸引力、專(zhuān)業(yè)感。然后思考設(shè)計(jì)方案:視覺(jué)元素用澳大利亞特色鳥(niǎo)類(lèi)(葵花鸚鵡、琴鳥(niǎo)、笑翠鳥(niǎo)),配色方案用自然、明亮的色系,排版要重點(diǎn)突出。接著搜索澳大利亞鳥(niǎo)類(lèi)高清圖片、自然風(fēng)光,驗(yàn)證鳥(niǎo)類(lèi)品種名稱(chēng)和地理位置。最后生成海報(bào):主視覺(jué)、標(biāo)題、明星鳥(niǎo)種、推薦目的地等。
不停思考、搜索、驗(yàn)證,確保信息準(zhǔn)確。
生成的海報(bào)質(zhì)量也很贊。
![]()
主視覺(jué)是高質(zhì)量的澳大利亞鳥(niǎo)類(lèi)圖片,色彩鮮艷、細(xì)節(jié)清晰。排版的信息層級(jí)清晰,視覺(jué)動(dòng)線(xiàn)流暢:標(biāo)題→主視覺(jué)→推薦觀(guān)鳥(niǎo)地→聯(lián)系方式,一氣呵成。配色是明亮的自然色系,符合"觀(guān)鳥(niǎo)旅行"的主題,不會(huì)太花哨,也不會(huì)太單調(diào)。文案也不是干巴巴的介紹,而是有感染力的文字。
鳥(niǎo)類(lèi)品種名稱(chēng)、地理位置都準(zhǔn)確,這是Agentic能力的體現(xiàn)。
和PPT一樣,海報(bào)也可以在網(wǎng)頁(yè)上直接編輯,或?qū)С龈咔鍒D片。
我的感受:創(chuàng)意能力很強(qiáng),從抽象需求到具體設(shè)計(jì)方案,轉(zhuǎn)化很流暢。審美在線(xiàn),排版、配色、圖片選擇都很專(zhuān)業(yè)。信息準(zhǔn)確性也很高,沒(méi)有亂編。
案例鏈接:https://chat.z.ai/space/b0yuzae7svj0-ppt
任務(wù)三:制作設(shè)計(jì)師個(gè)人主頁(yè)
我們?cè)倩氐紺laude Code來(lái)測(cè)測(cè)GLM-4.7 Agentic能力和Coding審美。
下面是我最常用的一段網(wǎng)頁(yè)設(shè)計(jì)提示詞,包含產(chǎn)品經(jīng)理→設(shè)計(jì)師→前端工程師的完整流程,很考驗(yàn)?zāi)P蛯?duì)復(fù)雜的、結(jié)構(gòu)化的Prompt的遵循能力。
Prompt簡(jiǎn)化版本如下:
# 1. 你的任務(wù)
## 1.1 目標(biāo)描述
- 根據(jù)我的描述,幫我創(chuàng)建一個(gè)設(shè)計(jì)出色,內(nèi)容豐富,用戶(hù)體驗(yàn)友好的網(wǎng)站。
- 網(wǎng)站主題:AI工具導(dǎo)航站
# 2. 工作流程
## 作為產(chǎn)品經(jīng)理執(zhí)行工作
### 2.1.1 采用逆向工作法,先撰寫(xiě)1000字深入思考過(guò)產(chǎn)品的PRFAQ
### 2.1.2 需求洞察,穿透用戶(hù)表述,補(bǔ)齊顯性與隱性需求
### 2.1.3 結(jié)構(gòu)輸出PRD文檔,明確目標(biāo)用戶(hù)、功能、優(yōu)先級(jí)
## 作為設(shè)計(jì)師執(zhí)行工作
### 2.2.1 執(zhí)行設(shè)計(jì)靈感采樣
- 從靈感池中隨機(jī)采樣2位藝術(shù)家/設(shè)計(jì)師
- 給出"靈感 → 網(wǎng)頁(yè)實(shí)現(xiàn)"的轉(zhuǎn)譯說(shuō)明
- 靈感池包含:Josef Müller-Brockmann、John Maeda、Dieter Rams等60+位
### 2.2.2 交互與視覺(jué)方案
### 2.2.3 設(shè)計(jì)系統(tǒng)(色彩、字體、柵格)
## 作為前端工程師完成代碼
### 2.3.1 交付完整的 HTML/CSS/JS 代碼
### 2.3.2 三斷點(diǎn)響應(yīng)式
### 2.3.3 必須引入真實(shí)圖片(Picsum等)
完整Prompt大約200行,包含詳細(xì)的設(shè)計(jì)原則、代碼要求、靈感來(lái)源池等。
模型對(duì)提示詞的遵從性確實(shí)非常的好,每一步都是按照我的要求來(lái)執(zhí)行,先完成的產(chǎn)品經(jīng)理部分的工作,然后又繼續(xù)設(shè)計(jì)師的工作,并且按照我的要求對(duì)設(shè)計(jì)風(fēng)格進(jìn)行了采用。
![]()
最后實(shí)現(xiàn)的結(jié)果也非常符合我的預(yù)期,在保持簡(jiǎn)潔的設(shè)計(jì)師風(fēng)格的前提下,維持了相當(dāng)?shù)囊曈X(jué)克制和審美要求,完全不是一眼AI的那種網(wǎng)頁(yè)。
![]()
任務(wù)四:播客App原型設(shè)計(jì)
長(zhǎng)期關(guān)注花叔的同學(xué)應(yīng)該都了解,我去做iOS app開(kāi)發(fā)時(shí),最喜歡的一個(gè)步驟就是先用AI來(lái)幫我生成幾套原型。原型一方面是能讓自己的想法獲得更視覺(jué)化地呈現(xiàn),幫助自己思考想要獲得一個(gè)什么樣的產(chǎn)品。
另一方面也是通過(guò)這個(gè)步驟,你可以讓AI做出好得多的設(shè)計(jì),如果你一上來(lái)就讓AI Coding工具直接寫(xiě)swift代碼的話(huà),那做出的產(chǎn)品常常是沒(méi)法看的。
這個(gè)任務(wù)我用的Prompt是:
# App 原型設(shè)計(jì)提示詞
## 目標(biāo)
我想開(kāi)發(fā)一個(gè) {類(lèi)似小宇宙的播客app},現(xiàn)在需要輸出高保真的原型圖,請(qǐng)通過(guò)以下方式幫我完成所有界面的原型設(shè)計(jì),并確保這些原型界面可以直接用于開(kāi)發(fā):
## 1、用戶(hù)體驗(yàn)分析
- 先分析這個(gè) App 的主要功能和用戶(hù)需求,確定核心交互邏輯。
## 2、產(chǎn)品界面規(guī)劃
- 作為產(chǎn)品經(jīng)理,定義關(guān)鍵界面,確保信息架構(gòu)合理。
## 3、高保真 UI 設(shè)計(jì)
- 作為 UI 設(shè)計(jì)師,設(shè)計(jì)貼近真實(shí) iOS/Android 設(shè)計(jì)規(guī)范的界面,使用現(xiàn)代化的 UI 元素,使其具有良好的視覺(jué)體驗(yàn)。
## 4、HTML 原型實(shí)現(xiàn)
- 使用 HTML + Tailwind CSS(或 Bootstrap)生成所有原型界面,并使用 FontAwesome(或其他開(kāi)源 UI 組件)讓界面更加精美、接近真實(shí)的 App 設(shè)計(jì)。
- 拆分代碼文件,保持結(jié)構(gòu)清晰:
### 4.1 頁(yè)面文件要求
- 每個(gè)界面應(yīng)作為獨(dú)立的 HTML 文件存放,例如 home.html、profile.html、settings.html 等。
- index.html 作為主入口,不直接寫(xiě)入所有界面的 HTML 代碼,而是使用 iframe 的方式嵌入這些 HTML 片段,并將所有頁(yè)面直接平鋪展示在 index 頁(yè)面中,而不是跳轉(zhuǎn)鏈接。
### 4.2 真實(shí)感增強(qiáng)
- 界面尺寸應(yīng)模擬 iPhone 15 Pro,并讓界面圓角化,使其更像真實(shí)的手機(jī)界面。
- 使用真實(shí)的 UI 圖片,而非占位符圖片(可從 Unsplash、Pexels、Apple 官方 UI 資源中選擇)。
- 添加頂部狀態(tài)欄(模擬 iOS 狀態(tài)欄),并包含 App 導(dǎo)航欄(類(lèi)似 iOS 底部 Tab Bar)。
## 5、交付要求
- 請(qǐng)按照以上要求生成完整的 HTML 代碼,并確保其可用于實(shí)際開(kāi)發(fā)。
這是一次性得到的效果圖:
![]()
設(shè)計(jì)的原型中包含了首頁(yè)、播放器、訂閱、個(gè)人中心、播客詳情、搜索等頁(yè)面,非常完整。這套提示詞最早是從Claude 3.7發(fā)布的時(shí)候開(kāi)發(fā)的。一直到Claude 4時(shí)代,模型返回的結(jié)果一般都會(huì)出些問(wèn)題,比如部分圖片會(huì)是裂開(kāi)的,圓角矩形或者劉海屏效果不好,又或者很多網(wǎng)頁(yè)根本不會(huì)在手機(jī)樣式的容器內(nèi)等等。
現(xiàn)在GLM-4.7和Claude Sonnet 4.5提供的感受可以說(shuō)是完全一致了,一次性完美成功。
任務(wù)五:自動(dòng)化寫(xiě)作
這是最重要的案例。
首先說(shuō)下這個(gè)任務(wù)的測(cè)試前提是,我在10月份搭建完成了這套Claude Code自動(dòng)化寫(xiě)作系統(tǒng),既能寫(xiě)文章,也能幫我寫(xiě)視頻腳本、自動(dòng)整理信息等,詳情可以看這篇文章的介紹:
而在文章寫(xiě)作部分,你可以理解為這套agent是搭建在兩個(gè)嵌套的Claude.md文檔基礎(chǔ)上的,因?yàn)槲移谕@套現(xiàn)在系統(tǒng)適配的能力越來(lái)越多,所以現(xiàn)在這兩個(gè)claude.md文件分別膨脹到了570行和1212行,非常恐怖。
![]()
![]()
但所實(shí)現(xiàn)的效果也確實(shí)很強(qiáng),現(xiàn)在已經(jīng)至少能幫我節(jié)省80%以上的寫(xiě)作時(shí)間了。
我要交給GLM-4.7的是這么個(gè)任務(wù),我早上看到了YouTube上YC做了期關(guān)于AI泡沫的視頻播客,我希望寫(xiě)篇文章介紹這期視頻播客的內(nèi)容。
![]()
我提供的提示詞要求無(wú)比簡(jiǎn)單
我想寫(xiě)一篇介紹這個(gè)視頻所討論的內(nèi)容的公眾號(hào)文章:https://www.youtube.com/watch?v=cqrJzG03ENE
然后GLM-4.7就開(kāi)始吭呲吭呲干活了
Phase 1: 視頻處理(自動(dòng)化)
GLM-4.7自動(dòng)識(shí)別出輸入的是YouTube視頻鏈接,隨后完整執(zhí)行了視頻處理標(biāo)準(zhǔn)流程:下載字幕、提取純文本、抓取視頻信息、內(nèi)容分析等步驟,準(zhǔn)確識(shí)別了視頻主題、核心議題與主要信息。
Phase 2: 選題討論
緊接著,GLM-4.7沒(méi)有直接開(kāi)寫(xiě),而是先基于內(nèi)容提出了兩種不同的選題方案,并給出各自的大綱結(jié)構(gòu)及優(yōu)劣分析,等待用戶(hù)選擇(我選擇了“AI泡沫真相”視角的方案A)。
Phase 3: 知識(shí)管理
確定選題后,GLM-4.7整理提煉出視頻關(guān)鍵信息和議題,形成知識(shí)條目,方便后續(xù)引用和內(nèi)容生成。
Phase 4: 風(fēng)格學(xué)習(xí)
自動(dòng)讀取參考文檔與過(guò)往范文,分析吸收目標(biāo)寫(xiě)作風(fēng)格和審校要點(diǎn)。
Phase 5: 創(chuàng)作初稿
根據(jù)上述整理與風(fēng)格學(xué)習(xí),生成了結(jié)構(gòu)和風(fēng)格都接近目標(biāo)的高質(zhì)量初稿。
Phase 6: 三遍審校
內(nèi)容審校:確保文章事實(shí)準(zhǔn)確、結(jié)構(gòu)合理、邏輯清晰、關(guān)鍵信息完整,不添加無(wú)來(lái)源內(nèi)容。
風(fēng)格審校:對(duì)AI腔、流水線(xiàn)表達(dá)等問(wèn)題逐段優(yōu)化,讓整體語(yǔ)言更自然、更具“人味”。
細(xì)節(jié)打磨:修正錯(cuò)別字、句式、節(jié)奏等小問(wèn)題,進(jìn)一步提升可讀性。
整體來(lái)看,GLM-4.7完整還原了復(fù)雜工作流,分步驟自動(dòng)完成了視頻處理、知識(shí)提煉、選題、風(fēng)格學(xué)習(xí)、創(chuàng)作與三輪審校,每一步均有對(duì)應(yīng)落地動(dòng)作和流程細(xì)節(jié),除了必要的選題之外,不需要我的額外指令或干預(yù)。
可以說(shuō),你用GLM-4.7+Claude Code就能搭建出和我相同質(zhì)量的,屬于你自己的自動(dòng)化寫(xiě)作agent了。
測(cè)完這5個(gè)案例,有個(gè)很明確的感受:GLM-4.7是開(kāi)源模型的新標(biāo)桿。
Coding和Agentic能力確實(shí)直逼Gemini 3和Claude 4.5。特別是審美提升,讓AI生成的內(nèi)容真的"能用"了,國(guó)產(chǎn)開(kāi)源模型真的起來(lái)了。
還有個(gè)我想單獨(dú)提一下的:后端。
這次測(cè)試能這么順利,很大程度上是因?yàn)镚LM-4.7的后端確實(shí)很穩(wěn)。五個(gè)案例里,有四個(gè)都是復(fù)雜的多步驟任務(wù)(特別是最后一個(gè)自動(dòng)化寫(xiě)作,涉及上百次工具調(diào)用),整個(gè)過(guò)程沒(méi)有任何卡頓或失敗。
想給產(chǎn)品加AI功能或者注冊(cè)/登錄能力,只需要把后端接入文檔提供給他,基本上也是一次性完成。和之前用過(guò)的幾個(gè)主流模型相比,GLM-4.7在后端穩(wěn)定性上確實(shí)有明顯優(yōu)勢(shì)。
這點(diǎn)可能不太容易被注意到,但實(shí)際用的時(shí)候差別很大。
我的建議是:
如果你想做內(nèi)容創(chuàng)作,比如PPT、海報(bào)等,可以試試z.ai。
想做開(kāi)發(fā),試試Claude Code + GLM-4.7。
對(duì)了,我發(fā)現(xiàn)智譜主頁(yè)還在做一個(gè)GLM Coding Plan體驗(yàn)卡的活動(dòng),我是Pro用戶(hù),可以給5個(gè)同學(xué)送7天體驗(yàn)卡,告訴我你想做什么項(xiàng)目,我會(huì)把我的體驗(yàn)卡邀請(qǐng)鏈接送給前五個(gè)回復(fù)自己想做的項(xiàng)目?jī)?nèi)容的同學(xué)。
![]()
以及,我發(fā)現(xiàn)他們還有個(gè)“拼好模”,通過(guò)我的二維碼注冊(cè)購(gòu)買(mǎi),可以享受額外10%的優(yōu)惠,以及,我也能回回血,獲得一些贈(zèng)金,用來(lái)維持我的Pro訂閱,給大家多做做測(cè)試的。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.