2月11日,智譜正式推出新一代旗艦?zāi)P虶LM-5,主攻編程與智能體能力,官方稱已實(shí)現(xiàn)開源領(lǐng)域最優(yōu)表現(xiàn)。這是繼DeepSeek后,國(guó)產(chǎn)AI大模型春節(jié)檔的又一重要發(fā)布。
GLM-5參數(shù)規(guī)模由上一代的355B擴(kuò)展至744B,激活參數(shù)從32B提升至40B。智譜方面證實(shí),此前在全球模型服務(wù)平臺(tái)OpenRouter登頂熱度榜首的神秘模型“Pony Alpha”即為GLM-5。
內(nèi)部評(píng)估顯示,GLM-5在前端、后端、長(zhǎng)程任務(wù)等編程開發(fā)場(chǎng)景中,平均性能較上一代提升超20%,真實(shí)編程體驗(yàn)逼近Claude Opus 4.5水平。該模型已上線chat.z.ai平臺(tái)。此次發(fā)布標(biāo)志著國(guó)產(chǎn)大模型在技術(shù)路徑與能力表現(xiàn)上持續(xù)縮小與國(guó)際領(lǐng)先水平的差距,為開發(fā)者群體提供了新的開源選擇。
參數(shù)規(guī)模翻倍 預(yù)訓(xùn)練數(shù)據(jù)大幅擴(kuò)容
智譜新一代旗艦?zāi)P虶LM-5在模型架構(gòu)層面實(shí)現(xiàn)關(guān)鍵升級(jí)。參數(shù)規(guī)模由上一代355B(激活32B)擴(kuò)展至744B(激活40B),預(yù)訓(xùn)練數(shù)據(jù)量從23T提升至28.5T,更大規(guī)模的算力投入驅(qū)動(dòng)通用智能能力顯著增強(qiáng)。
該模型首次引入DeepSeek稀疏注意力機(jī)制,在保持長(zhǎng)文本處理效果無損的前提下,有效降低部署成本并提升Token利用效率。該技術(shù)路線與DeepSeek-V3/V3.2保持一致。
架構(gòu)配置方面,GLM-5構(gòu)建78層隱藏層,集成256個(gè)專家模塊,每次激活8個(gè),激活參數(shù)約44B,稀疏度5.9%,上下文窗口最高支持202K token。
編程能力顯著提升
新一代旗艦?zāi)P虶LM-5在內(nèi)部Claude Code評(píng)估集中表現(xiàn)突出。前端、后端及長(zhǎng)程任務(wù)等編程開發(fā)場(chǎng)景下,該模型較上一代GLM-4.7實(shí)現(xiàn)全面超越,平均性能提升逾20%。
GLM-5能夠以極少人工干預(yù),自主完成Agentic長(zhǎng)程規(guī)劃與執(zhí)行、后端重構(gòu)、深度調(diào)試等復(fù)雜系統(tǒng)工程任務(wù)。官方稱,真實(shí)編程環(huán)境中的使用體感已逼近Claude Opus 4.5水平。
智譜將GLM-5定位為最新一代旗艦級(jí)對(duì)話、編程與智能體模型,重點(diǎn)強(qiáng)化其在復(fù)雜系統(tǒng)工程與長(zhǎng)程Agent任務(wù)中的處理能力。
智能體能力實(shí)現(xiàn)開源最優(yōu)表現(xiàn)
GLM-5在Agent能力上達(dá)成開源SOTA,多項(xiàng)評(píng)測(cè)基準(zhǔn)中位列開源第一。在BrowseComp(聯(lián)網(wǎng)檢索與信息理解)、MCP-Atlas(大規(guī)模端到端工具調(diào)用)及τ2-Bench(復(fù)雜場(chǎng)景下自動(dòng)代理工具規(guī)劃與執(zhí)行)三項(xiàng)測(cè)試中,GLM-5均取得最優(yōu)表現(xiàn)。
為實(shí)現(xiàn)能力突破,該模型構(gòu)建了全新的“Slime”訓(xùn)練框架,支持更大規(guī)模模型架構(gòu)與更復(fù)雜的強(qiáng)化學(xué)習(xí)任務(wù),顯著提升強(qiáng)化學(xué)習(xí)后訓(xùn)練流程效率。
此外,智譜提出異步智能體強(qiáng)化學(xué)習(xí)算法,使模型具備從長(zhǎng)程交互中持續(xù)學(xué)習(xí)的能力,有效激發(fā)預(yù)訓(xùn)練模型的深層潛力。該機(jī)制已成為GLM-5的核心技術(shù)特色之一。
國(guó)產(chǎn)大模型春節(jié)檔密集發(fā)布
智譜清言GLM-5的發(fā)布,成為國(guó)產(chǎn)AI大模型春節(jié)檔密集競(jìng)逐的最新注腳。同日晚間,Minimax亦上線Minimax 2.5,距離上一版本2.2發(fā)布僅間隔一個(gè)多月。
此輪發(fā)布潮已持續(xù)升溫。DeepSeek此前已推出新模型,阿里千問的Qwen 3.5、字節(jié)跳動(dòng)的SeeDance 2.0等產(chǎn)品也于近期相繼亮相。多家廠商不約而同選擇在春節(jié)窗口期集中推新,折射出國(guó)產(chǎn)大模型賽道競(jìng)爭(zhēng)正進(jìn)入白熱化階段。
目前GLM-5與Minimax 2.5的詳細(xì)技術(shù)文檔尚未完全披露,其實(shí)際性能表現(xiàn)仍有待開發(fā)者社區(qū)與專業(yè)機(jī)構(gòu)的后續(xù)驗(yàn)證。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.