<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      智譜GLM-5強(qiáng)調(diào)的Agentic Engineering能力是什么?|甲子光年

      0
      分享至



      智譜GLM-5驗(yàn)證了Agentic Engineering的可行性,但成本正在變得更顯性。

      作者|周悅

      編輯|王博

      今天,智譜上線并開源GLM-5,其在Coding與Agent能力上,取得開源SOTA表現(xiàn),在真實(shí)編程場(chǎng)景的使用體感逼近 Claude Opus 4.5,擅長(zhǎng)復(fù)雜系統(tǒng)工程與長(zhǎng)程Agent任務(wù)。


      在全球權(quán)威的Artificial Analysis榜單中,GLM-5位居全球第四、開源第一,圖片來(lái)源:智譜

      這一發(fā)布直接刺激了資本市場(chǎng),智譜股價(jià)一度漲超41%。截至收盤,智譜股價(jià)報(bào)402港元/股,漲幅為28.68%,市值為1792.3億港元。

      值得注意的是,智譜稱GLM-5為“Agentic Engineering時(shí)代最好的開源模型”。

      什么是Agentic Engineering?為什么智譜要強(qiáng)調(diào)這個(gè)概念呢?

      1.從“氛圍”到“工程”

      如果說(shuō)AI行業(yè)需要尋找一位能精準(zhǔn)捕捉技術(shù)風(fēng)向的觀測(cè)者,特斯拉前AI總監(jiān)、OpenAI創(chuàng)始成員Andrej Karpathy無(wú)疑是最佳人選。

      2025年2月,他提出Vibe Coding(氛圍編碼)概念。開發(fā)者不再逐行寫代碼,而是用自然語(yǔ)言描述意圖,讓模型在一種更像即興創(chuàng)作的狀態(tài)里生成實(shí)現(xiàn)。這種體驗(yàn)帶來(lái)了一段明顯的“編程蜜月期”:生成更快、試錯(cuò)更便宜、上手更輕松。

      但一年后,Karpathy拋出了一個(gè)更現(xiàn)實(shí)的概念:Agentic Engineering(代理工程)。他的關(guān)注點(diǎn)不再是單純地追求生成代碼,而是試圖讓AI交付完整的工程閉環(huán)。

      從“氛圍”到“工程”的轉(zhuǎn)變,折射出一個(gè)更直觀的行業(yè)變化:寫代碼的門檻在降低,但讓模型跑完工程的門檻并沒(méi)有同步下降。

      在「甲子光年」看來(lái),要讓Agentic Engineering真的跑起來(lái),需要滿足兩個(gè)條件:模型能力強(qiáng),成本可接受。

      我們把它粗略概括為一個(gè)便于理解的表達(dá):Agentic Engineering的擴(kuò)散性 ≈ 能力閾值 × 成本閾值。

      前者決定可行性,后者決定普及率。沒(méi)有足夠的智能,循環(huán)會(huì)放大錯(cuò)誤;能力足夠時(shí),成本會(huì)變成新的瓶頸。這種范式往往會(huì)更早落在預(yù)算更充足、對(duì)收斂速度更敏感的團(tuán)隊(duì)里。

      今天,智譜GLM-5的發(fā)布與GLM Coding Plan價(jià)格體系調(diào)整,讓這兩個(gè)變量在同一個(gè)時(shí)間點(diǎn)上顯得更清晰。


      Andrej Karpathy發(fā)布博文,圖片來(lái)源:X平臺(tái)

      理解這次轉(zhuǎn)變,需要還原開發(fā)者的真實(shí)工作流。

      在Vibe Coding時(shí)代,一個(gè)后端開發(fā)者使用Cursor等編程工具時(shí),典型循環(huán)往往是:人類輸入—模型輸出—人類驗(yàn)證—模型修改——人類確認(rèn)。它提高了生成效率,但沒(méi)有消除人工介入的難題。

      Karpathy對(duì)此的總結(jié)很精準(zhǔn):“很好、很有趣,而且幾乎能行得通。(It was good and fun and it almost worked)”

      關(guān)鍵就在“幾乎”。

      當(dāng)任務(wù)開始變長(zhǎng)、上下文變復(fù)雜、回歸測(cè)試變多時(shí),人類介入的頻率并不會(huì)下降,開發(fā)者依然需要反復(fù)確認(rèn)。瓶頸逐漸從代碼生成速度轉(zhuǎn)向開發(fā)者的驗(yàn)證速度。

      Agentic Engineering試圖打破的,正是這種線性依賴,讓模型把“找—改—測(cè)—再改—再測(cè)”的閉環(huán)盡量跑完,人類更多在關(guān)鍵節(jié)點(diǎn)介入,最終對(duì)結(jié)果負(fù)責(zé)。開發(fā)者的角色也隨之變化,從寫代碼的人變成更像“監(jiān)督者”。

      在這樣的語(yǔ)境下,GLM-5之所以值得被討論,是因?yàn)?strong>它為開源模型能否更接近代碼代理工作流,提供了一個(gè)可觀察樣本也就是把公式左側(cè)的變量(能力閾值)推到了一個(gè)更高的位置。

      根據(jù)智譜披露的結(jié)果,在衡量AI解決真實(shí)GitHub問(wèn)題能力的權(quán)威榜單SWE-bench Verified上,GLM-5取得了77.8的成績(jī),這一數(shù)據(jù)逼近了閉源模型的第一梯隊(duì)。與此同時(shí),在部分第三方公開榜單下,GLM-5也處于開源模型的前列。

      這些分?jǐn)?shù)當(dāng)然不是全部意義,但它們至少指向一個(gè)變化:在給定代碼倉(cāng)庫(kù)、給定驗(yàn)證條件的任務(wù)設(shè)定下,開源模型完成更長(zhǎng)程的規(guī)劃、反思與自我修正,正在變得更可行。


      大模型評(píng)估結(jié)果,圖片來(lái)源:智譜

      從智譜披露的技術(shù)路徑來(lái)看,GLM-5在幾個(gè)關(guān)鍵維度上做了面向長(zhǎng)流程任務(wù)的強(qiáng)化:

      • 參數(shù)規(guī)模擴(kuò)展:參數(shù)規(guī)模擴(kuò)展至744B(激活40B),預(yù)訓(xùn)練數(shù)據(jù)量提升,增強(qiáng)了通用智能;

      • 異步強(qiáng)化學(xué)習(xí):引入“Slime”框架和異步智能體強(qiáng)化學(xué)習(xí)算法,使模型能夠從長(zhǎng)程交互中持續(xù)學(xué)習(xí);

      • 稀疏注意力機(jī)制:集成DeepSeek Sparse Attention,保證了在處理長(zhǎng)上下文時(shí)的效果無(wú)損,提升token效率。

      更值得注意的是,智譜表示,GLM-5已完成與華為昇騰、摩爾線程、寒武紀(jì)、昆侖芯、沐曦、燧原、海光等多家國(guó)產(chǎn)算力平臺(tái)的深度推理適配與優(yōu)化。這說(shuō)明,在部署路徑上,它正在探索一種更可落地的工程組合方式。

      這共同指向了一個(gè)結(jié)論:開源模型在“更接近工程閉環(huán)”這一維度上,正在跨過(guò)更高的能力門檻。

      2.現(xiàn)實(shí)的成本問(wèn)題

      當(dāng)能力門檻被抬上去之后,公式右側(cè)的變量“成本閾值”會(huì)更快變成現(xiàn)實(shí)問(wèn)題。

      Agentic Engineering的核心邏輯是“循環(huán)”。一次真實(shí)的修復(fù)任務(wù)往往并不是一問(wèn)一答,而是多輪定位、修改、測(cè)試與復(fù)盤。在這種模式下,Token消耗與推理時(shí)長(zhǎng)通常會(huì)顯著高于普通對(duì)話。

      換句話說(shuō),它不是“更省錢地寫代碼”,而是用更密集的算力去置換人類的時(shí)間。

      2月12日,智譜發(fā)布價(jià)格調(diào)整說(shuō)明,宣布 GLM Coding Plan取消首購(gòu)優(yōu)惠,整體價(jià)格上調(diào),漲幅自30%起,將原因歸于需求增長(zhǎng)與高負(fù)載下的穩(wěn)定性與服務(wù)質(zhì)量保障。

      這些信息共同指向一個(gè)更明確的現(xiàn)實(shí):當(dāng)模型開始被更頻繁地當(dāng)作生產(chǎn)力工具使用,成本會(huì)更早變成賬單。

      因此,“漲價(jià)”本身不必被簡(jiǎn)化為單一結(jié)論。更準(zhǔn)確的說(shuō)法是:能力閾值在上升,成本閾值也更顯性。

      GLM-5的案例一定程度說(shuō)明,未來(lái)的軟件工程可能會(huì)呈現(xiàn)出一種分層態(tài)勢(shì)

      • Vibe Coding層,對(duì)于日常、短程的輔助開發(fā),低成本、快響應(yīng)的模型依然是主流;

      • Agentic Engineering層,面向關(guān)鍵任務(wù)、復(fù)雜架構(gòu)調(diào)整或必須快速收斂的問(wèn)題,更強(qiáng)的代理工程能力,更像一種需要付費(fèi)的“加速券”——用更高的推理預(yù)算,換取更快的工程收斂。

      對(duì)大公司和追求極致效率的團(tuán)隊(duì)來(lái)說(shuō),這是一筆算得過(guò)來(lái)的投入;而對(duì)于更廣泛的個(gè)人開發(fā)者,這或許意味著需要更精細(xì)地計(jì)算 ROI(投資回報(bào)率)。

      我們或許已經(jīng)看到了一個(gè)更接近現(xiàn)實(shí)的結(jié)論:模型能力決定Agentic Engineering正在走向現(xiàn)實(shí);成本,決定它能擴(kuò)散到多遠(yuǎn)。

      (封面圖來(lái)源:AI生成)

      聲明:包含AI生成內(nèi)容

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      電商女裝AI模特“長(zhǎng)了三只手”?店鋪下架AI生成圖片,平臺(tái)稱將嚴(yán)厲處罰

      電商女裝AI模特“長(zhǎng)了三只手”?店鋪下架AI生成圖片,平臺(tái)稱將嚴(yán)厲處罰

      上游新聞
      2026-03-27 18:38:14
      警惕!公知正在悄悄換掉我們的價(jià)值觀:三件事正在瓦解社會(huì)根基

      警惕!公知正在悄悄換掉我們的價(jià)值觀:三件事正在瓦解社會(huì)根基

      云景侃記
      2026-03-26 14:56:36
      31省份中央育兒補(bǔ)貼補(bǔ)助資金揭曉

      31省份中央育兒補(bǔ)貼補(bǔ)助資金揭曉

      第一財(cái)經(jīng)資訊
      2026-03-28 13:12:16
      傅斯年怒斥蘇聯(lián)“集罪惡之大成”:那些敢向蘇聯(lián)開炮的中國(guó)硬骨頭

      傅斯年怒斥蘇聯(lián)“集罪惡之大成”:那些敢向蘇聯(lián)開炮的中國(guó)硬骨頭

      顧史
      2026-03-21 19:52:44
      和房東住一起是什么體驗(yàn)?網(wǎng)友:這不純欺負(fù)老實(shí)人嗎

      和房東住一起是什么體驗(yàn)?網(wǎng)友:這不純欺負(fù)老實(shí)人嗎

      帶你感受人間冷暖
      2026-03-27 00:05:14
      失控?伊朗科技大學(xué)被炸!以國(guó)防部大樓被擊中!局勢(shì)迎來(lái)三大走向

      失控?伊朗科技大學(xué)被炸!以國(guó)防部大樓被擊中!局勢(shì)迎來(lái)三大走向

      薛小榮
      2026-03-28 19:19:44
      廈門高崎機(jī)場(chǎng)關(guān)閉時(shí)間確定

      廈門高崎機(jī)場(chǎng)關(guān)閉時(shí)間確定

      新浪財(cái)經(jīng)
      2026-03-29 03:40:43
      西媒:皇馬現(xiàn)金流緊張僅剩340萬(wàn)歐元,總負(fù)債約為17.8億歐元

      西媒:皇馬現(xiàn)金流緊張僅剩340萬(wàn)歐元,總負(fù)債約為17.8億歐元

      懂球帝
      2026-03-28 21:40:23
      40歲確診腫瘤,4個(gè)月走到盡頭——?jiǎng)e用無(wú)知賭生命

      40歲確診腫瘤,4個(gè)月走到盡頭——?jiǎng)e用無(wú)知賭生命

      陪老公抗AI
      2026-03-28 16:29:18
      女司機(jī)踹車后續(xù):褲子被男車主扯下,怒扇對(duì)方耳光,關(guān)系不一般

      女司機(jī)踹車后續(xù):褲子被男車主扯下,怒扇對(duì)方耳光,關(guān)系不一般

      探源歷史
      2026-03-28 23:39:23
      他是CBA現(xiàn)役最老球員,打了20年拿5冠,身家過(guò)億,已為退役鋪路

      他是CBA現(xiàn)役最老球員,打了20年拿5冠,身家過(guò)億,已為退役鋪路

      大西體育
      2026-03-28 10:15:34
      古巴停電的真相,盧比奧這次說(shuō)得太直接了

      古巴停電的真相,盧比奧這次說(shuō)得太直接了

      老馬拉車莫少裝
      2026-03-29 08:16:40
      全國(guó)中小學(xué)嚴(yán)查開始!這些事一律不許做,發(fā)現(xiàn)就處理

      全國(guó)中小學(xué)嚴(yán)查開始!這些事一律不許做,發(fā)現(xiàn)就處理

      馬蹄燙嘴說(shuō)美食
      2026-03-28 03:55:27
      震驚!網(wǎng)傳山東驚現(xiàn)大量水泥墳引熱議,網(wǎng)友:這樣還怎么冒青煙?

      震驚!網(wǎng)傳山東驚現(xiàn)大量水泥墳引熱議,網(wǎng)友:這樣還怎么冒青煙?

      火山詩(shī)話
      2026-03-28 11:22:13
      中央電視臺(tái)對(duì)張雪峰的評(píng)價(jià)

      中央電視臺(tái)對(duì)張雪峰的評(píng)價(jià)

      冷桂零落
      2026-03-26 07:01:16
      好消息!麒麟芯片已不受制裁了,華為手機(jī)真正全面歸來(lái)

      好消息!麒麟芯片已不受制裁了,華為手機(jī)真正全面歸來(lái)

      互聯(lián)網(wǎng).亂侃秀
      2026-03-26 10:55:17
      合肥野生動(dòng)物園泉山新址“泡湯”?社區(qū):去年7月已暫停,暫無(wú)新消息

      合肥野生動(dòng)物園泉山新址“泡湯”?社區(qū):去年7月已暫停,暫無(wú)新消息

      極目新聞
      2026-03-28 17:17:59
      以色列掐斷中東電網(wǎng),意外帶火中國(guó)“神器”!深圳企業(yè)一戰(zhàn)成名

      以色列掐斷中東電網(wǎng),意外帶火中國(guó)“神器”!深圳企業(yè)一戰(zhàn)成名

      墨印齋
      2026-03-10 13:54:26
      無(wú)禮?美國(guó)觀眾全場(chǎng)噓聲+大喊薩巴擊球出界 后者怒懟+奪冠后致歉

      無(wú)禮?美國(guó)觀眾全場(chǎng)噓聲+大喊薩巴擊球出界 后者怒懟+奪冠后致歉

      風(fēng)過(guò)鄉(xiāng)
      2026-03-29 07:14:31
      車長(zhǎng)期不開,最多能停幾天?記住這個(gè)數(shù),不傷車、不毀電瓶

      車長(zhǎng)期不開,最多能停幾天?記住這個(gè)數(shù),不傷車、不毀電瓶

      沙雕小琳琳
      2026-03-27 08:29:51
      2026-03-29 09:19:00
      甲子光年
      甲子光年
      中國(guó)科技產(chǎn)業(yè)化前沿智庫(kù)
      3388文章數(shù) 9262關(guān)注度
      往期回顧 全部

      科技要聞

      華為盤古大模型負(fù)責(zé)人王云鶴確認(rèn)離職

      頭條要聞

      牛彈琴:特朗普親口對(duì)沙特說(shuō)出傲慢的話 全世界不敢相信

      頭條要聞

      牛彈琴:特朗普親口對(duì)沙特說(shuō)出傲慢的話 全世界不敢相信

      體育要聞

      全球第二大車企,也救不了這支德甲隊(duì)?

      娛樂(lè)要聞

      陳牧馳陳冰官宣得子 曬一家三口握拳照

      財(cái)經(jīng)要聞

      臥底"科技與狠活"培訓(xùn):化工調(diào)味劑泛濫

      汽車要聞

      置換補(bǔ)貼價(jià)4.28萬(wàn)起 第五代宏光MINIEV正式上市

      態(tài)度原創(chuàng)

      游戲
      教育
      數(shù)碼
      公開課
      軍事航空

      《異替》現(xiàn)已登陸Steam

      教育要聞

      喬會(huì)龍:請(qǐng)不要強(qiáng)迫他們做“大人”

      數(shù)碼要聞

      小心假冒偽劣硬盤:山寨版三星990 Pro SSD已能偽造讀寫速度

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美軍中東基地?fù)p失最新披露

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版