![]()
換了最新的基座模型,Agent 的表現(xiàn)卻沒(méi)有質(zhì)的飛躍;反過(guò)來(lái),給同一個(gè)模型加上持久化記憶、可復(fù)用的技能文檔和標(biāo)準(zhǔn)化的工具接口,效果立竿見(jiàn)影——做過(guò) Agent 工程的人,對(duì)這種「模型之外的東西比模型本身更重要」的體感多半不會(huì)陌生。但這個(gè)現(xiàn)象背后有沒(méi)有一個(gè)統(tǒng)一的解釋框架?上海交大團(tuán)隊(duì)的一篇 54 頁(yè)綜述給出了回答:外部化(Externalization)。
近日,上海交通大學(xué)聯(lián)合中山大學(xué)、上海創(chuàng)智學(xué)院、卡內(nèi)基梅隆大學(xué)及 OPPO 等機(jī)構(gòu),于 2026 年 4 月 9 日在 arXiv 提交綜述論文,首次以「外部化」為統(tǒng)一視角,系統(tǒng)梳理了 LLM Agent 的記憶、技能、協(xié)議與 Harness 工程四大支柱。核心觀點(diǎn):Agent 的實(shí)際進(jìn)展,越來(lái)越取決于模型之外的外部認(rèn)知基礎(chǔ)設(shè)施,而非模型本身的能力提升。
![]()
- 論文標(biāo)題:Externalization in LLM Agents: A Unified Review of Memory, Skills, Protocols and Harness Engineering
- 作者單位:上海交通大學(xué)、中山大學(xué)、上海創(chuàng)智學(xué)院、卡內(nèi)基梅隆大學(xué)、OPPO
- 論文鏈接:https://arxiv.org/abs/2604.08224(2026 年 4 月 9 日提交)
- 本文第一作者為上海交通大學(xué)博士生周宸宇。通訊作者包括 OPPO 研究院王俊博士,以及上海交通大學(xué)劉衛(wèi)文、林江浩、張偉楠教授。
![]()
圖 1:外部化作為 LLM Agent 設(shè)計(jì)的組織原則。上方:人類認(rèn)知外部化歷史弧線;中間:LLM Agent 外部化弧線——記憶、技能、協(xié)議到 Harness;下方:文獻(xiàn)全景圖
模型已經(jīng)很強(qiáng),但 Agent 還是不夠可靠
矛盾出在哪?
過(guò)去兩年,大模型的參數(shù)規(guī)模和推理能力持續(xù)攀升。但熟悉 Agent 落地的工程師都有一個(gè)共同體驗(yàn):換更強(qiáng)的基座模型,往往不如改進(jìn)外部基礎(chǔ)設(shè)施帶來(lái)的提升顯著。持久化記憶、可復(fù)用技能、標(biāo)準(zhǔn)化工具接口、沙箱約束、執(zhí)行日志……這些「不屬于模型」的東西,越來(lái)越?jīng)Q定著 Agent 能不能真正好用。
論文把這個(gè)現(xiàn)象歸結(jié)為三個(gè)結(jié)構(gòu)性錯(cuò)配:
- 連續(xù)性錯(cuò)配:上下文窗口有限且短暫,模型無(wú)法跨會(huì)話穩(wěn)定保持狀態(tài)。每次會(huì)話都是全新開(kāi)始,之前積累的上下文需要從頭重建。
- 一致性錯(cuò)配:復(fù)雜的多步驟流程往往被重新推導(dǎo),而不是被穩(wěn)定執(zhí)行。同樣的任務(wù),不同時(shí)機(jī)調(diào)用,執(zhí)行路徑和質(zhì)量難以保證一致。
- 協(xié)調(diào)性錯(cuò)配:與工具、服務(wù)和其他 Agent 的交互依賴臨時(shí)約定,脆弱且不可移植。接口一旦變動(dòng),整條調(diào)用鏈路可能同步失效。
論文借鑒認(rèn)知科學(xué)家 Don Norman 的「認(rèn)知工件(Cognitive Artifacts)」理論來(lái)解釋這一現(xiàn)象。例如,購(gòu)物清單不是擴(kuò)展了人的記憶容量,而是把「回憶」問(wèn)題變成了「識(shí)別」問(wèn)題;地圖不是讓人導(dǎo)航變強(qiáng),而是把空間關(guān)系從隱性變成可見(jiàn)。外部工件的力量,在于表征變換(Representational Transformation)——它重新組織了問(wèn)題的形式,讓主體用現(xiàn)有能力更可靠地解決它。
同樣的邏輯正在 LLM Agent 上發(fā)生。論文的核心主張是:外部化才是理解近年 Agent 架構(gòu)演進(jìn)的統(tǒng)一邏輯,而不只是各種工程技巧的堆砌。
從 Weights 到 Harness:
能力載體的三次外移
![]()
圖 2:社區(qū)主題在三個(gè)能力層上的演化(2022–2026)。關(guān)注重心從參數(shù)知識(shí)和提示工程,逐步外移到 Harness 層級(jí)的基礎(chǔ)設(shè)施。
權(quán)重層(2022–2023):能力幾乎等同于模型參數(shù),擴(kuò)展定律主導(dǎo)敘事。奠定了基礎(chǔ),但知識(shí)難以選擇性更新,行為難以審計(jì),個(gè)性化幾乎無(wú)從實(shí)現(xiàn)。
上下文層(2023–2024):Prompt 工程、CoT、RAG 興起,模型保持凍結(jié),提示模板快速迭代。困難的「回憶」問(wèn)題被部分轉(zhuǎn)化為「識(shí)別」問(wèn)題,但狀態(tài)短暫,跨步驟協(xié)調(diào)始終脆弱。
Harness 層(2024 至今):可靠性依賴外部記憶、工具注冊(cè)、協(xié)議、沙箱與編排。「Agent 工程越來(lái)越體現(xiàn)為 Harness 工程」——OpenHands、SWE-agent、Deep Research 等皆遵循這一模式。
殊途同歸:
記憶、技能、協(xié)議、Harness都是外部化
回顧近年 Agent 領(lǐng)域的技術(shù)進(jìn)展,記憶系統(tǒng)、技能系統(tǒng)、協(xié)議標(biāo)準(zhǔn)化,乃至 Harness 工程本身,看似四條獨(dú)立的研究路線,各自解決不同的問(wèn)題。但論文指出,它們本質(zhì)上做的是同一件事——將特定層面的認(rèn)知負(fù)擔(dān)從模型內(nèi)部遷移到外部結(jié)構(gòu)中。這不是巧合,而是 Agent 走向可靠部署的必然收斂。四條路線的交匯點(diǎn),正是外部化。
記憶外部化狀態(tài),將「回憶」轉(zhuǎn)化為「檢索」,解決連續(xù)性錯(cuò)配;技能外部化專業(yè)知識(shí),將「即興生成」轉(zhuǎn)化為「組合復(fù)用」,解決一致性錯(cuò)配;協(xié)議外部化交互結(jié)構(gòu),將「臨時(shí)約定」轉(zhuǎn)化為「結(jié)構(gòu)化契約」,解決協(xié)調(diào)性錯(cuò)配。而 Harness 外部化的是更根本的東西——Agent 的認(rèn)知環(huán)境本身:原本隱含在每次模型調(diào)用過(guò)程里的執(zhí)行流、沙箱、觀測(cè)、權(quán)限,都被顯式地抽出來(lái),成為可檢視、可配置、可治理的基礎(chǔ)設(shè)施。
記憶:外部化的狀態(tài)
![]()
圖 3:記憶作為外部化狀態(tài)的全流程——從原始上下文到四層記憶內(nèi)容,經(jīng)由記憶系統(tǒng)架構(gòu)(單體式→分層編排→自適應(yīng)),最終與 Harness 集成。
論文將 Agent 記憶組織為四個(gè)層次:工作上下文(當(dāng)前任務(wù)狀態(tài)、打開(kāi)的文件、部分完成的計(jì)劃)、情景經(jīng)驗(yàn)(過(guò)去的運(yùn)行記錄和失敗軌跡)、語(yǔ)義知識(shí)(領(lǐng)域事實(shí)、用戶偏好、通用啟發(fā))和個(gè)性化記憶(特定用戶的習(xí)慣與約束)。
記憶架構(gòu)隨需求而演進(jìn):從將全部歷史塞入提示的單體式,到主動(dòng)狀態(tài)加外部存儲(chǔ)的檢索式,再到按語(yǔ)義或時(shí)序分層編排的分層架構(gòu),最終走向基于反饋動(dòng)態(tài)調(diào)整檢索策略的自適應(yīng)記憶系統(tǒng)。核心效果始終是同一個(gè):模型不再需要從權(quán)重中「回憶」,而是從持久化存儲(chǔ)中「檢索」。
技能:外部化的專業(yè)知識(shí)
![]()
圖 4:技能作為外部化專業(yè)知識(shí)的全流程——從獲取(人工編寫、蒸餾、發(fā)現(xiàn)、組合)到技能工件,經(jīng)由激活管線(注冊(cè)、漸進(jìn)披露、組合),最終綁定到運(yùn)行時(shí)。
技能系統(tǒng)將可復(fù)用的程序性專業(yè)知識(shí)打包為顯式工件。一個(gè)完整的技能包含三個(gè)組成部分:操作程序(任務(wù)骨架和分解步驟)、決策啟發(fā)(分支決策的局部策略)、規(guī)范約束(合規(guī)、安全和操作邊界)。
技能有四條生成路徑:人工編寫(專家手工編寫 SKILL.md 等指令文件)、軌跡蒸餾(從歷史運(yùn)行記錄中提取可復(fù)用程序)、自主發(fā)現(xiàn)(Agent 在環(huán)境中探索并歸納,如 Voyager)、組合構(gòu)建(由已有低層技能組裝高階能力)。技能從「發(fā)現(xiàn)」到「執(zhí)行」經(jīng)過(guò)注冊(cè)、漸進(jìn)式披露(按需從摘要擴(kuò)展到完整細(xì)節(jié))、組合等階段,最終在運(yùn)行時(shí)綁定到具體工具、API 和協(xié)議。
核心效果:模型不再需要每次從零「即興生成」工作流,而是從預(yù)驗(yàn)證的組件中「組合」。
協(xié)議:外部化的交互結(jié)構(gòu)
![]()
圖 5:協(xié)議在 Harness 工程中的演進(jìn)——從孤立模型調(diào)用到標(biāo)準(zhǔn)化協(xié)議再到去中心化 Agentic Web。Harness 通過(guò)協(xié)議管理三類交互:與工具交互、感知環(huán)境、與 Agent 和人類協(xié)作。
協(xié)議將交互結(jié)構(gòu)固定為機(jī)器可讀的契約,外部化了四類負(fù)擔(dān):調(diào)用語(yǔ)法(參數(shù)格式與類型)、生命周期語(yǔ)義(狀態(tài)轉(zhuǎn)換與完成條件)、權(quán)限與信任邊界(授權(quán)規(guī)則)、以及發(fā)現(xiàn)元數(shù)據(jù)(可用能力的聲明)。
論文梳理了三類主要協(xié)議族:
- Agent-Tool 協(xié)議(如 MCP):通過(guò) JSON-RPC 標(biāo)準(zhǔn)化工具發(fā)現(xiàn)與調(diào)用,使工具可以動(dòng)態(tài)注冊(cè)、模塊化擴(kuò)展。
- Agent-Agent 協(xié)議(如 A2A):定義任務(wù)委托、進(jìn)度交換和能力發(fā)現(xiàn)的結(jié)構(gòu)化語(yǔ)義,支持開(kāi)放 Agent 生態(tài)的互操作。
- Agent-User 協(xié)議(如 AG-UI):以類型化執(zhí)行事件和狀態(tài)流的形式使運(yùn)行時(shí)可觀測(cè)、可移植,讓用戶界面能夠?qū)崟r(shí)跟蹤 Agent 行為。
核心效果:臨時(shí)約定變?yōu)榻Y(jié)構(gòu)化契約,跨系統(tǒng)協(xié)調(diào)從脆弱變得可治理。
Harness:統(tǒng)一的認(rèn)知環(huán)境
![]()
圖 6:外部化 Agent 的整體架構(gòu)。Harness 居于中心,Memory、Skills、Protocols 三大外部化維度環(huán)繞其外,沙箱、可觀測(cè)性、壓縮、評(píng)估、審批回路等操作元素在中間層協(xié)調(diào)運(yùn)作。
Harness 外部化的是前三者賴以運(yùn)行的認(rèn)知環(huán)境本身。原本隱含在每次模型調(diào)用過(guò)程里的執(zhí)行流、沙箱、觀測(cè)、權(quán)限,被顯式地抽出來(lái),成為可檢視、可配置、可治理的基礎(chǔ)設(shè)施——這既是容納記憶、技能、協(xié)議的運(yùn)行時(shí),也是讓整套系統(tǒng)從「黑箱」變成「白箱」的關(guān)鍵。論文從六個(gè)設(shè)計(jì)維度分析其構(gòu)成:
- Agent 循環(huán)與控制流— 感知-檢索-規(guī)劃-執(zhí)行-觀察的完整周期,管控終止條件、遞歸邊界和資源消耗
- 沙箱與執(zhí)行隔離— 文件系統(tǒng)隔離、網(wǎng)絡(luò)限制、云端沙箱,既是安全邊界,也是認(rèn)知邊界
- 人類監(jiān)督與審批門控— 執(zhí)行前審批、執(zhí)行后審查和升級(jí)觸發(fā),自主性作為可配置參數(shù)
- 可觀測(cè)性與結(jié)構(gòu)化反饋— 工具調(diào)用的結(jié)構(gòu)化日志、連接動(dòng)作與前因的執(zhí)行溯源,支持調(diào)試、審計(jì)和內(nèi)部反饋回路
- 配置、權(quán)限與策略編碼— 用戶、項(xiàng)目、組織三級(jí)分層約束,以聲明式規(guī)則在運(yùn)行時(shí)強(qiáng)制執(zhí)行
- 上下文預(yù)算管理— 歷史摘要、優(yōu)先級(jí)驅(qū)動(dòng)的內(nèi)容淘汰、技能分階加載,平衡三大維度對(duì)窗口的競(jìng)爭(zhēng)
三大維度在 Harness 內(nèi)部形成自我強(qiáng)化的循環(huán):記憶經(jīng)驗(yàn)蒸餾為技能,技能執(zhí)行軌跡沉淀回記憶;協(xié)議規(guī)范了技能的調(diào)用方式,也將結(jié)構(gòu)化結(jié)果寫入持久狀態(tài);更豐富的記憶帶來(lái)更好的技能,更好的技能產(chǎn)生更豐富的執(zhí)行軌跡,依次循環(huán)。
一個(gè)場(chǎng)景:不換模型,只改「外部環(huán)境」
讓一個(gè)軟件工程 Agent 在大型代碼倉(cāng)庫(kù)里實(shí)現(xiàn)新功能、運(yùn)行測(cè)試、提交 PR——論文用這個(gè)例子直接說(shuō)明了外部化的意義。
- 沒(méi)有外部化時(shí)。模型需要把倉(cāng)庫(kù)結(jié)構(gòu)、項(xiàng)目約定、工作流狀態(tài)和工具交互全部塞進(jìn)一個(gè)脆弱的提示窗口。任何一處出錯(cuò),整個(gè)流程需要重來(lái)。隨著任務(wù)復(fù)雜度增加,提示模板的管理成本以超線性速度上升。
- 有了外部化之后。持久化的項(xiàng)目記憶提供跨會(huì)話上下文;可復(fù)用的技能文檔編碼項(xiàng)目約定和工作流;協(xié)議化的工具接口確保調(diào)用格式始終正確;Harness 負(fù)責(zé)步驟排序、輸出驗(yàn)證和失敗恢復(fù)。
基座模型可以完全不變,改變的是它所面對(duì)任務(wù)的表示方式。這也是整篇論文的核心論點(diǎn):Agent 可靠性的提升,越來(lái)越不來(lái)自更強(qiáng)的推理器,而來(lái)自被更好地組織起來(lái)的認(rèn)知系統(tǒng)。衡量一個(gè) Agent 系統(tǒng)的問(wèn)題,也從「模型有多強(qiáng)?」變成了「哪些負(fù)擔(dān)已經(jīng)被外部化,讓模型不再需要每次從頭解決?」
未來(lái)方向
論文最后指出了六個(gè)前沿方向:
- 外部化邊界的擴(kuò)展— 規(guī)劃目標(biāo)、驗(yàn)證邏輯、編排策略本身都在成為 Harness 對(duì)象,而非只是被 Harness 執(zhí)行的內(nèi)容
- 從數(shù)字到具身— 具身 Agent 正在經(jīng)歷相同的外部化模式。高層規(guī)劃器與低延遲執(zhí)行模塊的分離,正是外部化邏輯在物理系統(tǒng)中的映射
- 自演化 Harness— 通過(guò)強(qiáng)化學(xué)習(xí)、程序合成或模仿學(xué)習(xí)讓基礎(chǔ)設(shè)施自動(dòng)更新,前景廣闊,但治理風(fēng)險(xiǎn)同步放大
- 安全與治理— 記憶投毒、惡意技能注入、協(xié)議欺騙等新型攻擊面值得專門關(guān)注,強(qiáng)制審查門控與來(lái)源溯源是成熟系統(tǒng)的必要保障
- 共享基設(shè)與多智能體生態(tài)— 當(dāng)記憶、技能、協(xié)議可以跨 Agent 共享,集體學(xué)習(xí)和勞動(dòng)分工成為可能,同時(shí)帶來(lái)基礎(chǔ)設(shè)施漂移等治理難題
- 外部化的評(píng)估— 現(xiàn)有 Benchmark 對(duì)基礎(chǔ)設(shè)施貢獻(xiàn)的度量嚴(yán)重不足,可遷移性、可維護(hù)性、上下文效率等新維度有待建立
從記憶到技能到協(xié)議再到 Harness,這篇綜述的價(jià)值不在于羅列技術(shù)細(xì)節(jié),而在于提供了一個(gè)系統(tǒng)級(jí)的解釋框架。一句話概括:更好的 Agent 不只是更好的推理器,而是被更好地組織起來(lái)的認(rèn)知系統(tǒng)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.