<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      高效智能體幕后推手是誰(shuí)?一篇綜述帶你從記憶×工具學(xué)習(xí)×規(guī)劃看透

      0
      分享至



      隨著大模型能力的躍遷,業(yè)界關(guān)注點(diǎn)正在從 “模型能不能做” 快速轉(zhuǎn)向 “智能體能不能落地”。過(guò)去一年可以看到大量工作在提升智能體的有效性(effectiveness):如何讓它更聰明、更穩(wěn)、更會(huì)用工具、更能完成復(fù)雜任務(wù)。

      但在真實(shí)應(yīng)用里,另一個(gè)更 “硬” 的問(wèn)題常常決定能否上線:高效性(efficiency)。智能體即便表現(xiàn)很好,如果每次都要消耗大量算力、時(shí)間與調(diào)用成本,也很難在生產(chǎn)環(huán)境大規(guī)模部署。

      基于這一視角,論文整理并撰寫(xiě)了一篇面向 “高效智能體” 的綜述,系統(tǒng)梳理當(dāng)前主要方法,并從三個(gè)最關(guān)鍵的機(jī)制出發(fā)組織全文框架:記憶 — 工具學(xué)習(xí) — 規(guī)劃。論文從設(shè)計(jì)范式出發(fā)對(duì)代表性方法進(jìn)行歸納總結(jié),聚焦那些以效率為目標(biāo)或能夠提升效率的核心設(shè)計(jì)與實(shí)現(xiàn)路徑,從而更清晰地呈現(xiàn)智能體在真實(shí)落地場(chǎng)景中的成本 — 性能權(quán)衡。



      • 論文地址:https://arxiv.org/abs/2601.14192
      • GitHub 地址:https://github.com/yxf203/Awesome-Efficient-Agents



      一、智能體記憶:

      讓 “會(huì)記” 更省、更準(zhǔn)、更可擴(kuò)展



      智能體要做長(zhǎng)任務(wù),離不開(kāi)記憶。但把歷史一股腦塞進(jìn)提示詞,會(huì)帶來(lái) token 暴漲和智能體處理長(zhǎng)上下文能力下降。因此,高效記憶系統(tǒng)的關(guān)鍵在于把 “長(zhǎng)歷史” 加工成 “可用、可檢索、可復(fù)用” 的信息資產(chǎn)。

      論文按記憶生命周期梳理三步:構(gòu)建 — 管理 — 訪問(wèn)。

      • 記憶構(gòu)建:通過(guò)概括、壓縮與結(jié)構(gòu)化把 “長(zhǎng)對(duì)話” 轉(zhuǎn)成 “可用記憶”。一類(lèi)是留在推理鏈路的工作記憶,文本式直觀但吃上下文,隱式式更像緩存,可減少重復(fù)編碼;另一類(lèi)是外置為可檢索系統(tǒng)的外部記憶,先將信息壓成小單元再按需召回,包括條目式、圖式與分層式。此外論文也提到要警惕過(guò)度壓縮帶來(lái)的信息損失,即需要考慮如何在降成本與保真之間取得平衡。
      • 記憶管理:防止 “存爆炸”,也避免 “取太慢”。規(guī)則式快但可能誤刪重要內(nèi)容,大模型式更聰明但更貴,混合式則按層級(jí)或場(chǎng)景組合兩者策略,在效果與成本之間取得折中。
      • 記憶訪問(wèn):選什么 + 怎么用。訪問(wèn)分記憶選擇與記憶整合,通過(guò)檢索或訓(xùn)練等方式挑選記憶,再用壓縮過(guò)濾或隱式注入減少 token 與重復(fù)編碼。

      另外,多智能體記憶也成為新趨勢(shì)。相較于只靠通信,近年更多工作開(kāi)始引入 “記憶” 這一概念來(lái)支撐規(guī)模化協(xié)作,論文將其概括為:共享記憶 / 本地記憶 / 混合記憶三類(lèi)。

      二、工具學(xué)習(xí):

      讓 “會(huì)用工具” 更少調(diào)用、更少等待、更少走彎路



      工具讓智能體從 “會(huì)說(shuō)” 變成 “能做”,但成本也最容易在工具鏈路里失控。論文按三條主線梳理提效思路:工具選擇 — 工具調(diào)用 — 工具融合推理。

      • 工具選擇:目標(biāo)是 “更快選對(duì)、少塞進(jìn) prompt”。相關(guān)方法包括外部檢索器、多標(biāo)簽分類(lèi),以及將工具映射為特殊 token 等思路,核心都是在大量工具中更快、更準(zhǔn)地選出最需要的那幾個(gè)。
      • 工具調(diào)用:核心是 “少等、少調(diào)、少走彎路”。典型路線包括邊生成邊調(diào)用、并行化調(diào)用,以及利用成本感知調(diào)用與測(cè)試時(shí)高效擴(kuò)展來(lái)削減冗余調(diào)用;進(jìn)一步還可通過(guò)面向效率的后訓(xùn)練把 “短軌跡、少調(diào)用” 寫(xiě)進(jìn)策略本身。
      • 工具融合推理:讓模型學(xué)會(huì) “該不該用、何時(shí)用、用幾次”。代表性方向包括選擇性調(diào)用,引導(dǎo)智能體只在必要時(shí)才發(fā)起工具調(diào)用;以及成本約束策略?xún)?yōu)化,在保證效果的同時(shí)對(duì)冗余交互與過(guò)長(zhǎng)軌跡施加懲罰,從而學(xué)到更短、更省的工具使用策略。

      三、智能體規(guī)劃:

      在 “深度” 與 “寬度” 上同時(shí)省下來(lái)



      規(guī)劃決定智能體如何在多步?jīng)Q策空間里行動(dòng)。效率問(wèn)題要么來(lái)自單體推理 “想太深、搜太貴”,要么來(lái)自多體協(xié)作 “聊太多、通信太重”。因此論文從兩條線展開(kāi):?jiǎn)沃悄荏w規(guī)劃與多智能體協(xié)作規(guī)劃。



      四、基準(zhǔn)與評(píng)測(cè)(Benchmark):

      沒(méi)有 “可比的尺”,就談不上 “可落地的效率”

      在談?dòng)洃洝⒐ぞ邔W(xué)習(xí)與規(guī)劃的提效方案之前,先要把 “尺子” 定清楚:高效到底怎么量?

      論文強(qiáng)調(diào),效率必須建立在有效性之上。省了資源卻顯著掉性能,不算高效。因此論文采用的定義是:在給定預(yù)算下取得更好的效果,或在相近效果下消耗更少資源。

      基于這一視角,論文先梳理了以有效性為主的 benchmark,并進(jìn)一步匯總了與效率相關(guān)的評(píng)測(cè)內(nèi)容:一方面,整理了在 benchmark 中顯式納入效率信號(hào)(成本、延遲、調(diào)用次數(shù)等)的評(píng)測(cè)設(shè)置;另一方面,總結(jié)了智能體方法中常用的效率指標(biāo),用于刻畫(huà) “省在哪兒、省多少”。

      五、挑戰(zhàn)與展望

      論文同時(shí)也提出了目前的一些挑戰(zhàn)與展望:

      1)統(tǒng)一評(píng)測(cè)框架:指標(biāo)口徑統(tǒng)一,模塊開(kāi)銷(xiāo)邊界清楚,才能真正讓各個(gè)智能體方法可比可復(fù)現(xiàn)。

      2)智能體的隱式推理(Latent Reasoning):大模型側(cè)的隱式推理正在升溫,但面向智能體的研究仍相對(duì)稀缺。由于智能體鏈路更長(zhǎng)、更復(fù)雜,還要處理工具調(diào)用、規(guī)劃與記憶等環(huán)節(jié),如何把中間推理 “做在隱式空間里”、在不掉效果的前提下降低成本,既是挑戰(zhàn),也是機(jī)會(huì)。

      3)面向部署設(shè)計(jì):在多智能體場(chǎng)景下,需要把部署成本納入考量,核心問(wèn)題是投入產(chǎn)出比。也就是說(shuō),增加智能體帶來(lái)的收益,是否足以覆蓋新增的開(kāi)銷(xiāo)。

      4)多模態(tài)效率:多模態(tài)智能體發(fā)展很快,但效率研究仍相對(duì)欠缺。文本智能體的一些提效思路可以借鑒,但是直接遷移卻并不容易,因?yàn)槎嗄B(tài)智能體的感知輸入、行為空間與任務(wù)結(jié)構(gòu)更復(fù)雜、交互成本更高。因此,如何在多模態(tài)場(chǎng)景下系統(tǒng)地兼顧效果與成本,仍是亟待解決的關(guān)鍵問(wèn)題。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      讓 Mac Mini 都漲價(jià)的 AI 助手,真有那么強(qiáng)嗎?

      讓 Mac Mini 都漲價(jià)的 AI 助手,真有那么強(qiáng)嗎?

      差評(píng)XPIN
      2026-01-27 00:08:23
      在美國(guó)買(mǎi)了房,房子是你的不假一旦你無(wú)力負(fù)擔(dān)房產(chǎn)稅照樣無(wú)家可歸

      在美國(guó)買(mǎi)了房,房子是你的不假一旦你無(wú)力負(fù)擔(dān)房產(chǎn)稅照樣無(wú)家可歸

      忠于法紀(jì)
      2025-12-23 21:02:38
      Lululemon讓人走光,是故意的還是不小心?

      Lululemon讓人走光,是故意的還是不小心?

      智商稅研究中心
      2026-01-27 10:09:07
      島內(nèi)最新民調(diào)公布,江啟臣大勝楊瓊瓔,楊不肯認(rèn)輸,盧秀燕出手了

      島內(nèi)最新民調(diào)公布,江啟臣大勝楊瓊瓔,楊不肯認(rèn)輸,盧秀燕出手了

      DS北風(fēng)
      2026-01-27 15:50:03
      隱忍24年,陳婷終于撕下完美偽裝,她給所有“已婚女人”上了一課

      隱忍24年,陳婷終于撕下完美偽裝,她給所有“已婚女人”上了一課

      瓜汁橘長(zhǎng)Dr
      2025-12-30 17:03:39
      火爆硅谷的Clawdbot,48小時(shí)插件病毒式裂變,一句話讓AI執(zhí)行任務(wù)

      火爆硅谷的Clawdbot,48小時(shí)插件病毒式裂變,一句話讓AI執(zhí)行任務(wù)

      DeepTech深科技
      2026-01-26 13:36:21
      五代十國(guó)傻傻的分不清?帶你理清五代皇帝,搞懂54年的五代歷史

      五代十國(guó)傻傻的分不清?帶你理清五代皇帝,搞懂54年的五代歷史

      長(zhǎng)風(fēng)文史
      2025-12-25 10:40:12
      全網(wǎng)吵翻!女子帶娃8小時(shí)突襲異地分居丈夫,網(wǎng)友們發(fā)現(xiàn)不對(duì)勁

      全網(wǎng)吵翻!女子帶娃8小時(shí)突襲異地分居丈夫,網(wǎng)友們發(fā)現(xiàn)不對(duì)勁

      一盅情懷
      2026-01-27 16:12:31
      他單方面宣布,“卡尼急著撤回了”

      他單方面宣布,“卡尼急著撤回了”

      觀察者網(wǎng)
      2026-01-27 16:23:32
      佛山路邊停車(chē)收費(fèi)出“奇招”,被稱(chēng)“吃相難看”

      佛山路邊停車(chē)收費(fèi)出“奇招”,被稱(chēng)“吃相難看”

      中國(guó)新聞周刊
      2026-01-26 16:47:50
      他,當(dāng)選佛山一鎮(zhèn)鎮(zhèn)長(zhǎng)

      他,當(dāng)選佛山一鎮(zhèn)鎮(zhèn)長(zhǎng)

      南方都市報(bào)
      2026-01-27 14:39:38
      邵佳一霸氣!3位主帥不敢重用之人,被他激活,3場(chǎng)為國(guó)足轟進(jìn)3球

      邵佳一霸氣!3位主帥不敢重用之人,被他激活,3場(chǎng)為國(guó)足轟進(jìn)3球

      何老師呀
      2026-01-27 11:51:06
      國(guó)安外援砸手里,解約金一分不讓 申花新星離隊(duì)練級(jí) 重慶開(kāi)啟引援

      國(guó)安外援砸手里,解約金一分不讓 申花新星離隊(duì)練級(jí) 重慶開(kāi)啟引援

      替補(bǔ)席看球
      2026-01-27 15:10:41
      伊朗宣布:“散布鎮(zhèn)壓抗議視頻”屬重罪,可判死刑

      伊朗宣布:“散布鎮(zhèn)壓抗議視頻”屬重罪,可判死刑

      桂系007
      2026-01-26 08:58:31
      賈淺淺《進(jìn)城》再引罵戰(zhàn)!短詩(shī)藏底層痛感,性暗示純屬過(guò)度腦補(bǔ)?

      賈淺淺《進(jìn)城》再引罵戰(zhàn)!短詩(shī)藏底層痛感,性暗示純屬過(guò)度腦補(bǔ)?

      匹夫來(lái)搞笑
      2026-01-26 07:19:09
      一批學(xué)者被集中通報(bào)批評(píng),包括4名醫(yī)務(wù)人員

      一批學(xué)者被集中通報(bào)批評(píng),包括4名醫(yī)務(wù)人員

      梅斯醫(yī)學(xué)
      2026-01-26 07:53:06
      某倒閉汽配平臺(tái)開(kāi)始線上清倉(cāng),火花塞5元一支出,汽配人如何求生

      某倒閉汽配平臺(tái)開(kāi)始線上清倉(cāng),火花塞5元一支出,汽配人如何求生

      汽車(chē)服務(wù)世界
      2026-01-27 08:59:53
      張學(xué)良到了晚年才吐露心聲:我這輩子從來(lái)不信迷信,然而在老虎廳除掉楊宇霆之后,我卻不得不改變想法

      張學(xué)良到了晚年才吐露心聲:我這輩子從來(lái)不信迷信,然而在老虎廳除掉楊宇霆之后,我卻不得不改變想法

      清風(fēng)鑒史
      2025-12-26 17:05:13
      郭艾倫炸了!楊鳴要走了?早干嘛去了…

      郭艾倫炸了!楊鳴要走了?早干嘛去了…

      刺猬籃球
      2026-01-26 14:24:32
      2018年,老農(nóng)翻修祖屋挖出銀錠,專(zhuān)家讓上交,他一席話讓眾人啞然

      2018年,老農(nóng)翻修祖屋挖出銀錠,專(zhuān)家讓上交,他一席話讓眾人啞然

      夢(mèng)飛故事會(huì)
      2024-11-21 16:17:24
      2026-01-27 17:12:49
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專(zhuān)業(yè)的人工智能媒體
      12200文章數(shù) 142551關(guān)注度
      往期回顧 全部

      科技要聞

      馬化騰3年年會(huì)講話透露了哪些關(guān)鍵信息

      頭條要聞

      戴墨鏡出席達(dá)沃斯會(huì)議后 馬克龍的支持率提升

      頭條要聞

      戴墨鏡出席達(dá)沃斯會(huì)議后 馬克龍的支持率提升

      體育要聞

      帶著母親遺愿戰(zhàn)斗12年,交易添頭成了隊(duì)魂

      娛樂(lè)要聞

      張雨綺被曝代孕,春晚被拒,代言跑路

      財(cái)經(jīng)要聞

      多地對(duì)壟斷行業(yè)"近親繁殖"出手了

      汽車(chē)要聞

      標(biāo)配華為乾崑ADS 4/鴻蒙座艙5 華境S體驗(yàn)車(chē)下線

      態(tài)度原創(chuàng)

      本地
      旅游
      家居
      時(shí)尚
      公開(kāi)課

      本地新聞

      云游中國(guó)|撥開(kāi)云霧,巫山每幀都是航拍大片

      旅游要聞

      江蘇蘇州:拙政園早梅花開(kāi)引客來(lái)

      家居要聞

      現(xiàn)代古典 中性又顯韻味

      降溫了!羽絨服這樣穿顯瘦又時(shí)髦

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版