昨日,智譜發布了新一代旗艦模型GLM-4.5,引發了全球AI圈的關注。作為中國大模型領域的“國家隊”代表,他們之前還被OpenAI視為主要競爭對手。
![]()
本次發布的GLM-4.5模型,據說在推理、代碼、智能體綜合能力方面,達到開源模型SOTA水平;在真實場景Agentic Coding對比評測中,實測結果國內最佳。并且GLM-4.5在Hugging Face與ModelScope平臺同步開源,模型權重遵循MIT License。
01
綜合性能SOTA,殺入全球大模型第一梯隊
GLM-4.5融合更多復雜推理、代碼和智能體等多種通用能力并取得技術突破,首次在單個模型中實現將推理、編碼和智能體能力原生融合,以滿足智能體應用的復雜需求。
根據最具有代表性的12個評測,即MMLU Pro、AIME24、MATH 500、SciCode、GPQA、HLE、LiveCodeBench、SWE-Bench、Terminal-bench、TAU-Bench、BFCL v3和BrowseComp。綜合平均分,GLM-4.5取得了全球模型第三、國產模型第一,開源模型第一。
![]()
![]()
GLM-4.5參數量為DeepSeek-R1的1/2、Kimi-K2的1/3,但同樣在多項標準基準測試中表現得更加出色,這得益于GLM模型的更高參數效率。在衡量模型代碼能力的SWE-Bench Verified 榜單上,GLM-4.5系列位于性能/參數比帕累托前沿,這表明在相同規模下,GLM-4.5系列實現了最佳性能。
![]()
在性能優化之外,GLM-4.5系列也在成本和效率上實現突破,由此帶來遠低于主流模型定價:API調用價格低至輸入0.8元/百萬tokens,輸出2元/百萬tokens。
![]()
同時,高速版本實測生成速度超過100 tokens/秒,支持低延遲、高并發的實際部署需求,兼顧成本效益與交互體驗。
![]()
據官方介紹,GLM-4.5系列能夠勝任全棧開發任務,編寫較為復雜的應用、游戲、交互網頁。
在實際應用當中,GLM-4.5模型能力和體驗究竟如何呢?下面就跟隨K哥一起上手實測。
02
用GLM-4.5手搓一個智能體后,
我卸載了所有AI編程工具
正好這兩天在參加WAIC2025(世界人工智能大會),我想做個逛展智能體,來幫助我從100場論壇、800個展臺當中挑選出我最感興趣的,并且制定逛展計劃,這個任務就交給GLM-4.5了。我們使用模型的原生能力,來開發這個功能和交互都相對復雜的Agent。
先打開網站:Z.ai
完整注冊后,在左上角選擇模型GLM-4.5。
![]()
在輸入框下方看到:AI PPT、全棧開發、寫代碼、幫我寫、搜信息等,選擇「全棧開發」。
在讓AI幫你開發之前,需要整理好需求,我們要開發的智能體要能夠基于WAIC2025的信息,按照用戶的要求進行檢索、制定逛展計劃,界面交互簡潔友好。
還要解決數據來源的問題,我把“WAIC2025媒體指南”電子版上傳到Z.ai。
![]()
然后把梳理好的需求,整理成提示詞,如下:
開發一個“WAIC2025逛展智能體”,功能點如下:
1、根據用戶的要求檢索展會信息...
2、基于用戶輸入,調用大模型GLM-4.5能力,理解用戶需求,根據“WAIC2025的信息”制定規劃逛展計劃...
3、提醒功能:根據制定的計劃,在論壇或活動開始前1小時彈窗提醒...
4、界面設計...
將提示詞輸入后,開發工作就開始了。界面左側是編碼過程,右側是程序預覽界面。

整個編碼任務被拆分成4個部分:分析圖片數據和構建會展信息庫、設計界面布局組件、實現會展信息檢索、實現逛展計劃、優化界面與交互。

首先執行的是:分析圖片數據和構建會展信息庫,模型能夠根據圖片內容構建會展信息數據庫。

接下來,實現信息檢索、制定計劃的功能,這部分需求描述比較明確,所以實現起來比較快。

功能實現完畢,最后一步就是對界面布局交互的進一步優化,現在已經可以在右邊看到界面效果了。

最后是項目總結,到這一步項目就算是執行結束了,整個過程都是基于GLM-4.5模型的原生能力生成的,真正實現了張張嘴就能編程。

下面就來看看逛展智能體的運行效果吧,點擊左上方的小眼睛圖標,就可以打開程序鏈接。

界面是我喜歡的賽博朋克風格,檢索功能體驗也十分流暢。

再體驗下制定計劃功能,輸入關鍵字、選擇日期,就可以生成一份專屬逛展計劃。

Z.ai還支持代碼工程打包下載、代碼發布,發布后就可以在線使用。
貼上這個智能體的鏈接,歡迎大家體驗:
https://f0vbx6ngdgk1-deploy.space.z.ai
我之前嘗試過Cursor、Codex等AI編程工具,體驗完GLM-4.5的原生編程能力,我不會再考慮其它工具了,它能夠完成我的大部分智能體開發需求,而且不需要你懂編程,只要描述清楚需求,剩下的交給它就行了。
03
GLM-4.5為什么這么強?源自技術創新
你一定好奇,為什么GLM-4.5能力這么強,下面我們看下模型的架構與技術實現。
GLM-4.5采用混合專家(MoE)架構,包括GLM-4.5:總參數量3550億,激活參數為320億;GLM-4.5-Air:總參數量1060億,激活參數為120億。
GLM-4.5和GLM-4.5-Air均支持混合推理模式,提供兩種模式:用于復雜推理和工具使用的思考模式,以及用于即時響應的非思考模式。模型都是在15萬億token的通用數據上進行了預訓練,然后在代碼、推理、智能體等領域的8萬億token數據上進行了針對性訓練,最后通過強化學習進一步增強了模型的推理、代碼與智能體能力。
GLM-4.5真正實現了高速、低成本。不僅API調用價格便宜,還支持低延遲、高并發的實際部署需求,兼顧成本效益與交互體驗。
無論你是資深程序員還是編程小白,都能通過GLM-4.5快速構建應用,讓技術服務于創意,讓創意推動技術進步;“人人都是開發者”正在成為現實。
最后,給大家送個福利,智譜正推出“50塊就能包月爽用GLM-4.5,調用量無上限”的活動,名額有限,不妨試試。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.