“AI大牛股”公開技術細節。
今日下午,“全球大模型第一股”智譜正式發布了GLM-5技術報告。智譜表示,GLM-5能夠實現性能的大幅躍升,主要得益于四大技術創新。GLM-5在真實世界編程任務中展現出前所未有的能力,在處理端到端軟件工程挑戰方面超越了此前所有開源基線。
股價表現方面,周五(2月20日),智譜股價單日大漲42.72%,報725港元/股,股價再創新高,總市值達3232億港元,上市43天股價累計漲幅已超500%。消息面上,在發布GLM-5后,由于供不應求,智譜宣布上調GLM Coding Plan套餐價格,中國區漲價30%,海外版漲價超100%。
智譜最新發布
2月22日下午,據智譜官微消息,智譜推出了GLM-5,這是一款旨在推動編程范式從“VibeCoding”(氛圍編程)轉向“AgenticEngineering”(智能體工程)的下一代基礎模型。GLM-5在前代模型GLM-4.5的智能體、推理與編程(Agentic,ReasoningandCoding,ARC)能力基礎上,采用稀疏注意力(DeepSeekSparseAttention,DSA)以大幅降低推理成本,同時保持長上下文能力無損。
為了讓模型更好地與各類任務對齊,智譜構建了一套新型異步強化學習(RL)基礎設施,通過將生成過程與訓練過程解耦,從而大幅提升了后訓練的迭代效率。此外,智譜還提出了全新的異步Agent強化學習算法,進一步提升強化學習的效果,使模型能夠更有效地從復雜、長程交互中學習。
智譜稱,基于上述創新,GLM-5在主流的開放基準測試中實現了SOTA性能。最關鍵的是,GLM-5在真實世界編程任務中展現出前所未有的能力,在處理端到端軟件工程挑戰方面超越了此前所有開源基線。
智譜指出,GLM-5在性能與計算效率上實現了躍升,不僅在ArtificialAnalysis.ai、LMArena文本與代碼等主要榜單中均達到SOTA水平,更重塑了真實世界的編程標準。它突破了SWE-bench等傳統靜態測評的考察邊界,在處理復雜的端到端軟件開發任務時,展現出了前所未有的強大能力。
四大技術創新
據GLM-5技術報告,GLM-5能夠實現性能的大幅躍升,主要得益于以下四大技術創新:
第一,引入DSA稀疏注意力機制(DeepSeekSparseAttention,DSA)。這一全新架構極大降低了訓練與推理成本。此前的GLM-4.5依賴標準MoE架構提升效率,而DSA機制則使GLM-5能夠根據Token的重要性動態分配注意力資源。在不折損長上下文理解和推理深度的前提下,算力開銷得以大幅削減。得益于此,"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"para",{"tagName":"p","attributes":{},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"style":"font-size:15px;"},"namespaceURI":"http://www.w3.org/1999/xhtml"}]">智譜將模型參數規模成功擴展至744B(7440億),同時將訓練Token規模提升至28.5T(28.5萬億)。
第二,構建全新的異步RL基礎設施。基于GLM-4.5時期slime框架“訓練與推理解耦”的設計,"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"para",{"tagName":"p","attributes":{},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"style":"font-size:15px;"},"namespaceURI":"http://www.w3.org/1999/xhtml"}]">智譜的新基建進一步實現了“生成與訓練”的深度解耦,將GPU利用率推向極致。該系統支持模型開展大規模的智能體(Agent)軌跡探索,大幅減緩了以往拖慢迭代速度的同步瓶頸,讓RL后訓練流程的效率實現了質的飛躍。
第三,提出全新的異步AgentRL算法。該算法旨在全面提升模型的自主決策質量。GLM-4.5曾依靠迭代自蒸餾和結果監督來訓練Agent;而在GLM-5中,"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"para",{"tagName":"p","attributes":{},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"style":"font-size:15px;"},"namespaceURI":"http://www.w3.org/1999/xhtml"}]">智譜研發的異步算法使模型能夠從多樣化的長周期交互中持續學習。這一算法針對動態環境下的規劃與自我糾錯能力進行了深度優化,這也正是GLM-5能夠在真實編程場景中表現卓越的底層邏輯。
第四,全面擁抱國產算力生態。從模型發布伊始,GLM-5就原生適配了中國GPU生態。"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"para",{"tagName":"p","attributes":{},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"style":"font-size:15px;"},"namespaceURI":"http://www.w3.org/1999/xhtml"}]">智譜已完成從底層內核到上層推理框架的深度優化,全面兼容七大主流國產芯片平臺:華為昇騰、摩爾線程、海光、寒武紀、昆侖芯、天數智芯與燧原。
智譜表示,“憑借上述進步,GLM-5不僅是一個更強大的模型,更是下一代AI Agent 更高效、更實用的基礎模型。我們向社區開源GLM-5,以進一步推動高效的、面向 Agent 的通用人工智能的發展。”
智譜致歉
昨日(2月21日)晚間,智譜在“智譜開放平臺”微信公眾號發布GLM Coding Plan致歉信,并公布處理和補償方案。
智譜稱,這次改版主要犯了三個錯:規則透明度不夠、GLM-5灰度節奏太慢、老用戶升級機制設計粗糙。
GLM Coding Plan是智譜專門為AI編程場景推出的付費訂閱套餐服務,開發者訂閱后,可以使用智譜提供的大模型來輔助寫代碼。套餐等級通常分為Lite、Pro、Max三個等級,對應不同的使用額度和模型權限。
據了解,GLM Coding Plan上線即售罄,國產AI編程模型的付費套餐被搶空,在行業中頗為罕見。
需求火爆導致GLM Coding Plan的用戶體驗受到影響。在致歉信中,智譜解釋稱,其近期遭受灰產號池和黃牛黨沖擊,惡意占用了公司大量資源。同時,GLM-5發布后,流量超出預期,公司擴容節奏沒有跟上,不得已將GLM-5按照Max、Pro、Lite的順序逐步開放。
目前Max用戶已經全面開放,Pro用戶雖已開放,但高峰期可能會因集群負載較高遇到限流,Lite用戶將會在節后非高峰期逐步灰度開放。
針對受到影響的Lite和Pro用戶,智譜支持自主申請退款。
此前在2月12日,智譜發布新一代旗艦模型GLM-5,并在海外走紅。在Coding與Agent能力上,GLM-5取得開源SOTA表現,在真實編程場景的使用體感逼近Claude Opus4.5,擅長復雜系統工程與長程Agent任務。
在發布GLM-5后,由于供不應求,智譜宣布上調GLM Coding Plan套餐價格,中國區漲價30%,海外版漲價超100%,成為國內首家對大模型商業化服務進行提價的AI原生企業。
責編:楊喻程
排版:汪云鵬
校對:蘇煥文
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.