<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      斯坦福最新研究:AI 的上下文比參數(shù)重要,無(wú)需重訓(xùn)、不再微調(diào)

      0
      分享至


      大數(shù)據(jù)文摘出品

      近日,斯坦福大學(xué)與 SambaNova Systems 合作發(fā)表了論文《Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models》。

      該論文提出了一個(gè)名為ACE(Agentic Context Engineering)的框架,可以讓AI在不重新訓(xùn)練權(quán)重的前提下,實(shí)現(xiàn)自我改進(jìn)。


      論文鏈接: http://arxiv.org/abs/2510.04618v1

      論文的核心思想是,大模型的能力,并非僅由參數(shù)決定,更取決于“上下文的質(zhì)量”。換句話(huà)說(shuō),誰(shuí)能構(gòu)建出最優(yōu)的上下文,誰(shuí)就能讓模型更聰明。

      ACE的核心思想,是讓模型不再依賴(lài)“靜態(tài)提示(prompt)”,而轉(zhuǎn)向一種動(dòng)態(tài)、結(jié)構(gòu)化、可進(jìn)化的“知識(shí)劇本”(playbook)

      這些劇本記錄了模型在任務(wù)執(zhí)行中積累的策略、規(guī)則、模板和修正規(guī)則。每一次失敗或成功,都會(huì)被轉(zhuǎn)化為一條“增量更新”(delta)。

      與傳統(tǒng)的“重寫(xiě)提示”不同,ACE通過(guò)小步安全更新不斷改進(jìn)劇本,而不是一次性推倒重來(lái)。

      這種機(jī)制意味著,AI可以在運(yùn)行中學(xué)習(xí)、記憶、改進(jìn),而不需任何參數(shù)微調(diào)。


      ACE框架

      研究者指出,這一機(jī)制能避免兩種致命問(wèn)題:一是簡(jiǎn)化偏差(brevity bias),即在追求簡(jiǎn)潔的優(yōu)化中丟失關(guān)鍵細(xì)節(jié);二是上下文崩塌(context collapse),即重寫(xiě)導(dǎo)致的知識(shí)損毀。


      論文舉例稱(chēng),在實(shí)驗(yàn)中,一個(gè)AI代理積累了1.8萬(wàn)token的上下文,表現(xiàn)良好。但當(dāng)模型試圖“總結(jié)壓縮”它時(shí),劇本被削減至僅122個(gè)token,性能瞬間跌至57.1%

      研究者直言:“模型擅長(zhǎng)使用知識(shí),但不擅長(zhǎng)整理知識(shí)。一次錯(cuò)誤的重寫(xiě),就可能摧毀全部積累。”

      論文稱(chēng)ACE解決了這種“自毀式學(xué)習(xí)”的結(jié)構(gòu)性風(fēng)險(xiǎn)。


      圖注:ACE 框架在三類(lèi)任務(wù)(智能體操作、領(lǐng)域知識(shí)、數(shù)值推理)上都顯著優(yōu)于其他方法,準(zhǔn)確率提升最明顯。

      三角色協(xié)作:生成、反思、策展

      ACE體系建立在一個(gè)極簡(jiǎn)哲學(xué)上:不要重寫(xiě)知識(shí),要管理知識(shí)。

      整個(gè)系統(tǒng)被拆解為三個(gè)互補(bǔ)的角色。

      第一個(gè)是生成器(Generator)。它負(fù)責(zé)執(zhí)行任務(wù),與環(huán)境交互,生成推理過(guò)程、代碼或操作序列。

      第二個(gè)是反思器(Reflector)。它分析生成器的行動(dòng)軌跡,識(shí)別成功與失敗的原因,提取“可操作的教訓(xùn)”。這些反饋信號(hào)可能來(lái)自代碼錯(cuò)誤、執(zhí)行結(jié)果或外部標(biāo)簽。

      第三個(gè)是策展器(Curator)。它將這些經(jīng)驗(yàn)提煉為結(jié)構(gòu)化條目(delta context),并通過(guò)確定性規(guī)則(非語(yǔ)言模型決策)整合進(jìn)主劇本。

      這樣的三層循環(huán)——行動(dòng)、反思、整合構(gòu)成了ACE的學(xué)習(xí)閉環(huán)。

      每次更新都只影響局部條目,不觸碰整體文本。這種局部增量機(jī)制,讓知識(shí)庫(kù)既能不斷擴(kuò)展,又不會(huì)坍塌。

      劇本本身被設(shè)計(jì)為項(xiàng)目化結(jié)構(gòu):包含策略規(guī)則、API調(diào)用模板、調(diào)試經(jīng)驗(yàn)、常見(jiàn)錯(cuò)誤解決方案等。每條條目附帶使用計(jì)數(shù)與正負(fù)反饋元數(shù)據(jù)

      反思器會(huì)根據(jù)這些記錄判斷哪些規(guī)則有效、哪些無(wú)用。策展器再據(jù)此修改或刪除。

      論文稱(chēng),這種方式讓AI的知識(shí)“像Git倉(cāng)庫(kù)一樣演化”,能安全地生長(zhǎng)、細(xì)致地修剪、透明地追溯

      研究者強(qiáng)調(diào),ACE的復(fù)雜度并非負(fù)擔(dān),而是一種結(jié)構(gòu)化的安全機(jī)制,以微小的系統(tǒng)開(kāi)銷(xiāo)換取知識(shí)的穩(wěn)定積累。

      小模型“越級(jí)打怪”:DeepSeek擊敗GPT-4.1

      在復(fù)雜的AppWorld代理任務(wù)中,ACE框架帶來(lái)了+10.6%的平均性能提升,并將適應(yīng)延遲降低86.9%

      研究團(tuán)隊(duì)特別提到,這一提升并非依賴(lài)更大的模型,而是源于更好的上下文管理。

      一個(gè)典型例子是:DeepSeek V3.1,參數(shù)量低于GPT-4.1。但在ACE框架下,它在AppWorld基準(zhǔn)測(cè)試中,竟能與GPT-4.1代理(IBM CUGA)持平,甚至在更復(fù)雜的測(cè)試集上反超

      研究者指出,這一結(jié)果說(shuō)明,“上下文工程”已成為新的算力平權(quán)器

      更重要的是,ACE的效率優(yōu)勢(shì)驚人。在多輪任務(wù)學(xué)習(xí)中,它的更新延遲減少82%~91%token成本下降83.6%


      圖注:在金融分析任務(wù)中,ACE 框架顯著提升模型表現(xiàn)(平均提升約 8.6%),即使沒(méi)有真實(shí)標(biāo)簽也能保持穩(wěn)定表現(xiàn)。

      論文認(rèn)為,這讓“在線持續(xù)學(xué)習(xí)”從概念變?yōu)楝F(xiàn)實(shí)。AI不再需要頻繁微調(diào),而可以在運(yùn)行中自我優(yōu)化。

      同時(shí),ACE的結(jié)構(gòu)化劇本讓學(xué)習(xí)過(guò)程可解釋、可審計(jì)、可撤回

      如果某條規(guī)則被發(fā)現(xiàn)過(guò)時(shí)、偏頗或違規(guī),系統(tǒng)可以精準(zhǔn)刪除對(duì)應(yīng)條目,實(shí)現(xiàn)“選擇性遺忘”。

      注:頭圖AI生成

      作者長(zhǎng)期關(guān)注 AI 產(chǎn)業(yè)與學(xué)術(shù),歡迎對(duì)這些方向感興趣的朋友添加微信Q1yezi,共同交流行業(yè)動(dòng)態(tài)與技術(shù)趨勢(shì)!

      GPU 訓(xùn)練特惠!

      H100/H200 GPU算力按秒計(jì)費(fèi),平均節(jié)省開(kāi)支30%以上!

      掃碼了解詳情?

      點(diǎn)「贊」的人都變好看了哦!

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      伊朗國(guó)防部隊(duì): 進(jìn)入全面?zhèn)鋺?zhàn)狀態(tài)

      伊朗國(guó)防部隊(duì): 進(jìn)入全面?zhèn)鋺?zhàn)狀態(tài)

      每日經(jīng)濟(jì)新聞
      2026-02-19 16:07:49
      意大利知名地標(biāo)“愛(ài)情拱門(mén)”突然崩塌,永久消失,當(dāng)?shù)厥虚L(zhǎng):曾有成千上萬(wàn)的情侶來(lái)打卡,旅游業(yè)遭“毀滅性打擊”

      意大利知名地標(biāo)“愛(ài)情拱門(mén)”突然崩塌,永久消失,當(dāng)?shù)厥虚L(zhǎng):曾有成千上萬(wàn)的情侶來(lái)打卡,旅游業(yè)遭“毀滅性打擊”

      大風(fēng)新聞
      2026-02-17 19:26:03
      南京一商場(chǎng)晚上突發(fā)火災(zāi),看電影的觀眾緊急逃生,應(yīng)急部門(mén):火已撲滅,無(wú)人傷亡

      南京一商場(chǎng)晚上突發(fā)火災(zāi),看電影的觀眾緊急逃生,應(yīng)急部門(mén):火已撲滅,無(wú)人傷亡

      極目新聞
      2026-02-19 12:49:48
      浙江一地通知:即日起全域禁止銷(xiāo)售

      浙江一地通知:即日起全域禁止銷(xiāo)售

      都市快報(bào)橙柿互動(dòng)
      2026-02-19 17:58:37
      后續(xù),江蘇一家人吃飯父親酒后掀桌,兒子透露更多,以后不回家了

      后續(xù),江蘇一家人吃飯父親酒后掀桌,兒子透露更多,以后不回家了

      離離言幾許
      2026-02-18 23:24:35
      第3金還要耐心等待!天公不作美,中國(guó)隊(duì)冬奧熱門(mén)沖金項(xiàng)再次延期

      第3金還要耐心等待!天公不作美,中國(guó)隊(duì)冬奧熱門(mén)沖金項(xiàng)再次延期

      全景體育V
      2026-02-19 10:10:31
      南方大米產(chǎn)量第一,為啥超市里大部分還是東北米?南方米去哪了?

      南方大米產(chǎn)量第一,為啥超市里大部分還是東北米?南方米去哪了?

      天下十三洲獵奇
      2026-02-18 23:53:55
      突發(fā)!美國(guó)出手封殺多家中國(guó)機(jī)構(gòu)

      突發(fā)!美國(guó)出手封殺多家中國(guó)機(jī)構(gòu)

      芯火相承
      2026-02-19 10:02:18
      42歲王濛再破天花板!退役12年,再次讓李琰和整個(gè)冰壇“沉默”了

      42歲王濛再破天花板!退役12年,再次讓李琰和整個(gè)冰壇“沉默”了

      翰飛觀事
      2026-02-16 11:29:39
      林丹在西班牙過(guò)年,別墅內(nèi)景曝光,全家人與朋友除夕吃海鮮大餐

      林丹在西班牙過(guò)年,別墅內(nèi)景曝光,全家人與朋友除夕吃海鮮大餐

      手工制作阿殲
      2026-02-19 11:58:33
      再立新功!俄價(jià)值超1.2億美元的S-300VM與道爾防空系統(tǒng)遭摧毀

      再立新功!俄價(jià)值超1.2億美元的S-300VM與道爾防空系統(tǒng)遭摧毀

      軍迷戰(zhàn)情室
      2026-02-18 23:58:09
      2018年,張扣扣向王家復(fù)仇,唯獨(dú)不殺王自新妻子:她有不死的理由

      2018年,張扣扣向王家復(fù)仇,唯獨(dú)不殺王自新妻子:她有不死的理由

      米果說(shuō)識(shí)
      2026-02-19 09:32:34
      凌晨發(fā)送恐嚇信息?桔子酒店涉事門(mén)店:已報(bào)警,非員工發(fā)送

      凌晨發(fā)送恐嚇信息?桔子酒店涉事門(mén)店:已報(bào)警,非員工發(fā)送

      大風(fēng)新聞
      2026-02-19 09:46:23
      12死!湖北煙花店爆炸:店主身份被扒,大量?jī)?nèi)幕披露,知情者發(fā)聲

      12死!湖北煙花店爆炸:店主身份被扒,大量?jī)?nèi)幕披露,知情者發(fā)聲

      博士觀察
      2026-02-19 00:06:41
      2月17日俄烏最新: 2.5 年來(lái)的最大戰(zhàn)果

      2月17日俄烏最新: 2.5 年來(lái)的最大戰(zhàn)果

      西樓飲月
      2026-02-17 20:49:47
      湖北12死煙花爆燃:死者身份公布,大量?jī)?nèi)部照流出,責(zé)任人被控制

      湖北12死煙花爆燃:死者身份公布,大量?jī)?nèi)部照流出,責(zé)任人被控制

      博士觀察
      2026-02-19 11:41:09
      尹錫悅庭審細(xì)節(jié)曝光:被判無(wú)期只瞥了一眼法官,離庭時(shí)與律師相視一笑!法官闡述為何不判死刑

      尹錫悅庭審細(xì)節(jié)曝光:被判無(wú)期只瞥了一眼法官,離庭時(shí)與律師相視一笑!法官闡述為何不判死刑

      紅星新聞
      2026-02-19 17:28:30
      太尷尬了!大年初一,上海網(wǎng)友哭訴稱(chēng)大門(mén)被鄰居貼兩張“大字報(bào)”

      太尷尬了!大年初一,上海網(wǎng)友哭訴稱(chēng)大門(mén)被鄰居貼兩張“大字報(bào)”

      火山詩(shī)話(huà)
      2026-02-19 15:05:12
      襄陽(yáng)宜城煙花店才50多平米,要了12條人命!最害人的,或是防盜網(wǎng)

      襄陽(yáng)宜城煙花店才50多平米,要了12條人命!最害人的,或是防盜網(wǎng)

      火山詩(shī)話(huà)
      2026-02-19 13:50:13
      坐3.6億飛機(jī),戴1000萬(wàn)名表,拿5000萬(wàn)炒股的秦奮究竟什么背景

      坐3.6億飛機(jī),戴1000萬(wàn)名表,拿5000萬(wàn)炒股的秦奮究竟什么背景

      涵豆說(shuō)娛
      2026-01-19 17:21:55
      2026-02-19 18:43:00
      大數(shù)據(jù)文摘 incentive-icons
      大數(shù)據(jù)文摘
      專(zhuān)注大數(shù)據(jù),每日有分享!
      6825文章數(shù) 94529關(guān)注度
      往期回顧 全部

      科技要聞

      怒燒45億,騰訊字節(jié)阿里決戰(zhàn)春節(jié)

      頭條要聞

      媒體:高市2.0 日本政局發(fā)生了意料之中的變動(dòng)

      頭條要聞

      媒體:高市2.0 日本政局發(fā)生了意料之中的變動(dòng)

      體育要聞

      中國(guó)隊(duì)第二金!徐夢(mèng)桃贏女子空中技巧兩連冠 邵琪銅牌

      娛樂(lè)要聞

      明星過(guò)年百態(tài)!黃曉明等現(xiàn)身三亞

      財(cái)經(jīng)要聞

      面條火腿香菇醬!上市公司這些年請(qǐng)你吃

      汽車(chē)要聞

      量產(chǎn)甲醇插混 吉利銀河星耀6甲醇插混版申報(bào)圖

      態(tài)度原創(chuàng)

      本地
      手機(jī)
      親子
      家居
      數(shù)碼

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      手機(jī)要聞

      全球限14臺(tái):Caviar推“愛(ài)之翼”限量iPhone 17 Pro/Max

      親子要聞

      過(guò)年期間這幾樣?xùn)|西,一口都不要給孩子吃!

      家居要聞

      本真棲居 愛(ài)暖伴流年

      數(shù)碼要聞

      內(nèi)存價(jià)格崩了 國(guó)內(nèi)最高降價(jià)20%:去華強(qiáng)北市場(chǎng)揭秘實(shí)情!

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版