<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      斯坦福最新研究:AI 的上下文比參數(shù)重要,無需重訓(xùn)、不再微調(diào)

      0
      分享至


      大數(shù)據(jù)文摘出品

      近日,斯坦福大學(xué)與 SambaNova Systems 合作發(fā)表了論文《Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models》。

      該論文提出了一個(gè)名為ACE(Agentic Context Engineering)的框架,可以讓AI在不重新訓(xùn)練權(quán)重的前提下,實(shí)現(xiàn)自我改進(jìn)。


      論文鏈接: http://arxiv.org/abs/2510.04618v1

      論文的核心思想是,大模型的能力,并非僅由參數(shù)決定,更取決于“上下文的質(zhì)量”。換句話說,誰能構(gòu)建出最優(yōu)的上下文,誰就能讓模型更聰明。

      ACE的核心思想,是讓模型不再依賴“靜態(tài)提示(prompt)”,而轉(zhuǎn)向一種動(dòng)態(tài)、結(jié)構(gòu)化、可進(jìn)化的“知識劇本”(playbook)

      這些劇本記錄了模型在任務(wù)執(zhí)行中積累的策略、規(guī)則、模板和修正規(guī)則。每一次失敗或成功,都會(huì)被轉(zhuǎn)化為一條“增量更新”(delta)。

      與傳統(tǒng)的“重寫提示”不同,ACE通過小步安全更新不斷改進(jìn)劇本,而不是一次性推倒重來。

      這種機(jī)制意味著,AI可以在運(yùn)行中學(xué)習(xí)、記憶、改進(jìn),而不需任何參數(shù)微調(diào)。


      ACE框架

      研究者指出,這一機(jī)制能避免兩種致命問題:一是簡化偏差(brevity bias),即在追求簡潔的優(yōu)化中丟失關(guān)鍵細(xì)節(jié);二是上下文崩塌(context collapse),即重寫導(dǎo)致的知識損毀。


      論文舉例稱,在實(shí)驗(yàn)中,一個(gè)AI代理積累了1.8萬token的上下文,表現(xiàn)良好。但當(dāng)模型試圖“總結(jié)壓縮”它時(shí),劇本被削減至僅122個(gè)token,性能瞬間跌至57.1%

      研究者直言:“模型擅長使用知識,但不擅長整理知識。一次錯(cuò)誤的重寫,就可能摧毀全部積累。”

      論文稱ACE解決了這種“自毀式學(xué)習(xí)”的結(jié)構(gòu)性風(fēng)險(xiǎn)。


      圖注:ACE 框架在三類任務(wù)(智能體操作、領(lǐng)域知識、數(shù)值推理)上都顯著優(yōu)于其他方法,準(zhǔn)確率提升最明顯。

      三角色協(xié)作:生成、反思、策展

      ACE體系建立在一個(gè)極簡哲學(xué)上:不要重寫知識,要管理知識。

      整個(gè)系統(tǒng)被拆解為三個(gè)互補(bǔ)的角色。

      第一個(gè)是生成器(Generator)。它負(fù)責(zé)執(zhí)行任務(wù),與環(huán)境交互,生成推理過程、代碼或操作序列。

      第二個(gè)是反思器(Reflector)。它分析生成器的行動(dòng)軌跡,識別成功與失敗的原因,提取“可操作的教訓(xùn)”。這些反饋信號可能來自代碼錯(cuò)誤、執(zhí)行結(jié)果或外部標(biāo)簽。

      第三個(gè)是策展器(Curator)。它將這些經(jīng)驗(yàn)提煉為結(jié)構(gòu)化條目(delta context),并通過確定性規(guī)則(非語言模型決策)整合進(jìn)主劇本。

      這樣的三層循環(huán)——行動(dòng)、反思、整合構(gòu)成了ACE的學(xué)習(xí)閉環(huán)。

      每次更新都只影響局部條目,不觸碰整體文本。這種局部增量機(jī)制,讓知識庫既能不斷擴(kuò)展,又不會(huì)坍塌。

      劇本本身被設(shè)計(jì)為項(xiàng)目化結(jié)構(gòu):包含策略規(guī)則、API調(diào)用模板、調(diào)試經(jīng)驗(yàn)、常見錯(cuò)誤解決方案等。每條條目附帶使用計(jì)數(shù)與正負(fù)反饋元數(shù)據(jù)

      反思器會(huì)根據(jù)這些記錄判斷哪些規(guī)則有效、哪些無用。策展器再據(jù)此修改或刪除。

      論文稱,這種方式讓AI的知識“像Git倉庫一樣演化”,能安全地生長、細(xì)致地修剪、透明地追溯

      研究者強(qiáng)調(diào),ACE的復(fù)雜度并非負(fù)擔(dān),而是一種結(jié)構(gòu)化的安全機(jī)制,以微小的系統(tǒng)開銷換取知識的穩(wěn)定積累。

      小模型“越級打怪”:DeepSeek擊敗GPT-4.1

      在復(fù)雜的AppWorld代理任務(wù)中,ACE框架帶來了+10.6%的平均性能提升,并將適應(yīng)延遲降低86.9%

      研究團(tuán)隊(duì)特別提到,這一提升并非依賴更大的模型,而是源于更好的上下文管理。

      一個(gè)典型例子是:DeepSeek V3.1,參數(shù)量低于GPT-4.1。但在ACE框架下,它在AppWorld基準(zhǔn)測試中,竟能與GPT-4.1代理(IBM CUGA)持平,甚至在更復(fù)雜的測試集上反超

      研究者指出,這一結(jié)果說明,“上下文工程”已成為新的算力平權(quán)器

      更重要的是,ACE的效率優(yōu)勢驚人。在多輪任務(wù)學(xué)習(xí)中,它的更新延遲減少82%~91%token成本下降83.6%


      圖注:在金融分析任務(wù)中,ACE 框架顯著提升模型表現(xiàn)(平均提升約 8.6%),即使沒有真實(shí)標(biāo)簽也能保持穩(wěn)定表現(xiàn)。

      論文認(rèn)為,這讓“在線持續(xù)學(xué)習(xí)”從概念變?yōu)楝F(xiàn)實(shí)。AI不再需要頻繁微調(diào),而可以在運(yùn)行中自我優(yōu)化。

      同時(shí),ACE的結(jié)構(gòu)化劇本讓學(xué)習(xí)過程可解釋、可審計(jì)、可撤回

      如果某條規(guī)則被發(fā)現(xiàn)過時(shí)、偏頗或違規(guī),系統(tǒng)可以精準(zhǔn)刪除對應(yīng)條目,實(shí)現(xiàn)“選擇性遺忘”。

      注:頭圖AI生成

      作者長期關(guān)注 AI 產(chǎn)業(yè)與學(xué)術(shù),歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業(yè)動(dòng)態(tài)與技術(shù)趨勢!

      GPU 訓(xùn)練特惠!

      H100/H200 GPU算力按秒計(jì)費(fèi),平均節(jié)省開支30%以上!

      掃碼了解詳情?

      點(diǎn)「贊」的人都變好看了哦!

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      醫(yī)院養(yǎng)了15個(gè)院長!每月開支超100萬,一線醫(yī)護(hù)的血汗錢養(yǎng)了多少閑人?

      醫(yī)院養(yǎng)了15個(gè)院長!每月開支超100萬,一線醫(yī)護(hù)的血汗錢養(yǎng)了多少閑人?

      醫(yī)客
      2025-12-13 12:06:24
      大捷變大劫,烏方向庫皮揚(yáng)斯克殘余俄軍喊話:不投降全部殲滅

      大捷變大劫,烏方向庫皮揚(yáng)斯克殘余俄軍喊話:不投降全部殲滅

      史政先鋒
      2025-12-13 20:04:55
      49歲趙薇廣東飯局近照瘋傳!瘦脫相顯兇相,當(dāng)年小燕子徹底涼透了

      49歲趙薇廣東飯局近照瘋傳!瘦脫相顯兇相,當(dāng)年小燕子徹底涼透了

      阿纂看事
      2025-12-12 09:18:29
      你辦綱絲節(jié),我收徒弟!著名相聲演員楊議喜收愛徒 女人身份曝光

      你辦綱絲節(jié),我收徒弟!著名相聲演員楊議喜收愛徒 女人身份曝光

      社會(huì)日日鮮
      2025-12-13 06:36:53
      郭艾倫時(shí)隔11月復(fù)出16+5廣州大勝四川 徐昕6+13陳國豪4分

      郭艾倫時(shí)隔11月復(fù)出16+5廣州大勝四川 徐昕6+13陳國豪4分

      醉臥浮生
      2025-12-13 21:33:27
      4-0!4-3!男單4強(qiáng)誕生最后2席:林詩棟VS張本智和,央視公布賽程

      4-0!4-3!男單4強(qiáng)誕生最后2席:林詩棟VS張本智和,央視公布賽程

      小火箭愛體育
      2025-12-13 16:35:00
      塞弗爾斯克大捷!俄軍中將軍長、主力旅長、突擊連長介紹細(xì)節(jié)

      塞弗爾斯克大捷!俄軍中將軍長、主力旅長、突擊連長介紹細(xì)節(jié)

      戰(zhàn)風(fēng)
      2025-12-12 12:04:25
      突然,崩了!百年大廠,宣告破產(chǎn)!

      突然,崩了!百年大廠,宣告破產(chǎn)!

      證券時(shí)報(bào)
      2025-12-13 17:43:09
      我們最大的敵人不是美國日本,而是劉衛(wèi)東這些給炮彈摻沙子的蛀蟲

      我們最大的敵人不是美國日本,而是劉衛(wèi)東這些給炮彈摻沙子的蛀蟲

      我心縱橫天地間
      2025-12-13 13:37:20
      華子評論巨臀隊(duì)醫(yī):有她 我的進(jìn)攻才猛!KD:又一個(gè)單親媽媽要來

      華子評論巨臀隊(duì)醫(yī):有她 我的進(jìn)攻才猛!KD:又一個(gè)單親媽媽要來

      Emily說個(gè)球
      2025-12-13 17:53:30
      中山佳能都解散了!為啥還要這樣?安保、綠化、保潔舉動(dòng)讓人淚目

      中山佳能都解散了!為啥還要這樣?安保、綠化、保潔舉動(dòng)讓人淚目

      火山詩話
      2025-12-13 08:43:56
      6國宣布出兵!中方不低頭也得低?揚(yáng)言和中方斗到底!

      6國宣布出兵!中方不低頭也得低?揚(yáng)言和中方斗到底!

      趣生活
      2025-12-13 21:58:48
      英超賽季最快進(jìn)球!埃基蒂克46秒閃擊,2場轟3球,明特巨大失誤

      英超賽季最快進(jìn)球!埃基蒂克46秒閃擊,2場轟3球,明特巨大失誤

      奧拜爾
      2025-12-13 23:10:44
      袁世凱坐龍椅的真實(shí)老照片,接受群臣朝拜,“妃子們”也非常漂亮

      袁世凱坐龍椅的真實(shí)老照片,接受群臣朝拜,“妃子們”也非常漂亮

      文史微鑒
      2025-12-13 22:13:15
      看明白了,2026年春節(jié)要“涼涼”?不是沒錢,而是累得不想再折騰

      看明白了,2026年春節(jié)要“涼涼”?不是沒錢,而是累得不想再折騰

      冷紫葉
      2025-12-13 15:01:11
      湖北十堰市委書記黃劍雄任宜昌市委書記

      湖北十堰市委書記黃劍雄任宜昌市委書記

      澎湃新聞
      2025-12-13 22:00:27
      廣東一男子偷情被抓:10分鐘視頻流出,正面照曝光,對話內(nèi)容泄露

      廣東一男子偷情被抓:10分鐘視頻流出,正面照曝光,對話內(nèi)容泄露

      博士觀察
      2025-12-12 20:32:19
      誰敢竄訪,就炸誰的港口!

      誰敢竄訪,就炸誰的港口!

      安安說
      2025-12-12 10:30:12
      H200解禁!英偉達(dá)高端芯片獲準(zhǔn)入華   5家經(jīng)銷商將是最大贏家

      H200解禁!英偉達(dá)高端芯片獲準(zhǔn)入華 5家經(jīng)銷商將是最大贏家

      元芳說投資
      2025-12-13 06:00:10
      欲哭無淚!偷外賣吃到大便,網(wǎng)傳烏市某高校女生發(fā)帖哭訴并報(bào)警了

      欲哭無淚!偷外賣吃到大便,網(wǎng)傳烏市某高校女生發(fā)帖哭訴并報(bào)警了

      火山詩話
      2025-12-13 05:07:53
      2025-12-14 06:23:00
      大數(shù)據(jù)文摘 incentive-icons
      大數(shù)據(jù)文摘
      專注大數(shù)據(jù),每日有分享!
      6806文章數(shù) 94518關(guān)注度
      往期回顧 全部

      科技要聞

      比亞迪、小鵬、北汽,集體表態(tài)

      頭條要聞

      "小米公司不讓賣小米"涉事村莊村民:馮書記直播不收錢

      頭條要聞

      "小米公司不讓賣小米"涉事村莊村民:馮書記直播不收錢

      體育要聞

      有了風(fēng)騷白人禿頭,忘掉談了10年的前任

      娛樂要聞

      插刀門后,印小天一舉動(dòng)實(shí)現(xiàn)口碑逆轉(zhuǎn)

      財(cái)經(jīng)要聞

      鎂信健康闖關(guān)港交所:被指竊取商業(yè)秘密

      汽車要聞

      表面風(fēng)平浪靜 內(nèi)里翻天覆地!試駕銀河星艦7 EM-i

      態(tài)度原創(chuàng)

      房產(chǎn)
      時(shí)尚
      本地
      教育
      旅游

      房產(chǎn)要聞

      中糧好房子體系盛大亮相三亞,禮獻(xiàn)海南自貿(mào)港封關(guān)

      法式方頭靴的30種穿法,時(shí)髦不重樣!

      本地新聞

      云游安徽|阜陽三朝風(fēng)骨,傳承千年墨香

      教育要聞

      辛苦老己,最后6天我們還要做這些事——

      旅游要聞

      6 處雪景秘境藏頤和!2025 北京初雪后,每幀都是中式浪漫天花板

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 无码视频一区二区三区| 精品综合久久久久久97| 99自拍视频| 91瑟瑟| 乱码午夜-极国产极内射| 久久丫精品国产| 亚洲国产精品va在线看黑人| 韩国三级+mp4| 丝袜A片午夜www丝袜| 左云县| 国产成人无码综合亚洲日韩| 久久久精品人妻一区二区三区四| 2021国产在线视频| 中文字幕在线亚洲| 扎赉特旗| 国产口爆吞精在线视频2020版| 亚洲xxxx做受欧美| 国产成人精品麻豆| 汉寿县| 日本丰满熟妇videossex一| 國产一二三内射在线看片| 国产精品午夜福利免费看 | 广灵县| 亚洲中文字幕无码久久精品1| 国产av最新一区二区| 97人人澡| 伊人综合成人| 成年女人免费v片| 成人3d动漫一区二区三区| 日韩无码AV电影网| 亚洲天堂区| 永久免费的av在线电影网| 樱桃视频影院在线播放| 老司机69| 99久久国产露脸国语对白| 免费观看全黄做爰的视频| 国产成人精品18| 男女羞羞| 国产精品久久毛片av大全日韩| 香蕉97超级碰碰碰免费公开| 91乱子伦国产乱子伦|