<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Anthropic再發Agent神文:像人類工程師一樣思考,解決「長程任務」難題

      0
      分享至


      ↑閱讀之前記得關注+星標??,,每天才能第一時間接收到更新

      Anthropic再發Agent工程實踐神文:Effective harnesses for long-running agents(適用于長期運行Agents的有效工具),強烈建議大家圍觀閱讀

      之前我介紹過Anthropic Agent文章合集這里:

      隨著AI Agent能力的提升,開發者開始要求它們承擔跨越數小時甚至數天的復雜任務。然而,如何讓Agent在多個上下文窗口之間保持一致的進度,仍然是一個未解難題

      長程Agent面臨的核心挑戰在于,它們必須分“會話”(Session)工作,而每個新會話開始時都像是一個沒有過往記憶的新工程師接班。由于上下文窗口有限,且復雜項目無法在單一窗口內完成,Agent需要一種機制來彌合編碼會話之間的鴻溝

      Anthropic工程團隊通過觀察人類工程師的工作方式,為Claude Agent SDK開發了一套包含兩個部分的解決方案:初始化Agent(Initializer Agent)和編碼Agent(Coding Agent)

      核心挑戰:上下文壓縮還不夠

      Claude Agent SDK是一個通用的Agent框架,具備上下文管理功能(如壓縮),理論上應能讓Agent無限期工作

      但在實際測試中(例如要求最新的Opus 4.5構建一個claude.ai的克隆版),僅靠上下文壓縮是不夠的。Claude主要表現出兩種失敗模式:

      1.試圖一次性完成所有工作:Agent傾向于在一次會話中做太多事,導致中途耗盡上下文,留下的功能只完成了一半且缺乏文檔。下一個會話的Agent必須猜測之前發生了什么,浪費大量時間修復基礎應用

      2.過早宣布完工: 在項目后期,新的Agent實例看到已經有一些功能,就誤以為整個工作已完成

      解決方案:雙Agent架構

      Anthropic將問題分解,提出了雙重解決方案:

      初始化Agent:第一個會話使用專用提示詞,負責搭建環境。包括生成init.sh腳本、記錄進度的claude-progress.txt文件,以及展示文件添加情況的初始Git提交

      編碼Agent:后續的每一個會話都致力于取得增量進展,并留下結構化的更新

      這一方案的關鍵在于讓Agent在開啟新窗口時能迅速理解工作狀態——這主要通過claude-progress.txt文件和Git歷史記錄來實現

      環境管理的三大支柱

      為了支持這種工作流,環境設置包含以下關鍵組件:

      1. 功能列表(Feature List)

      為了防止Agent一次性蠻干或過早結束,初始化Agent被要求編寫一個包含所有功能需求的詳細文件。在claude.ai克隆案例中,這包含超過200個功能點。

      這些功能最初都被標記為“failing”(未通過),為后續Agent提供了清晰的工作全景圖

      JSON文件示例:

      {
      "category": "functional",
      "description": "New chat button creates a fresh conversation",
      "steps": [
      "Navigate to main interface",
      "Click the 'New Chat' button",
      "Verify a new conversation is created",
      "Check that chat area shows welcome state",
      "Verify conversation appears in sidebar"
      ],
      "passes": false
      }

      實驗發現,使用JSON格式優于Markdown,因為模型不太容易錯誤地更改或覆蓋JSON文件。同時,提示詞需包含強硬指令,禁止刪除或編輯測試,只允許更改passes字段的狀態

      2. 增量進展(Incremental Progress)

      有了初始腳手架后,編碼Agent被要求一次只做一個功能

      為了保持環境整潔,Agent需要在每次代碼變更后:

      通過Git提交代碼,并附帶描述性信息;

      在進度文件中撰寫摘要

      這使得模型可以利用Git回滾錯誤代碼,恢復到工作狀態,避免了后續Agent需要猜測前任做了什么的情況。

      3. 端到端測試

      Claude的另一個主要失敗模式是:在沒有適當測試的情況下標記功能為完成。它往往只做單元測試或簡單的curl命令,卻忽略了端到端的驗證。

      解決方案是明確提示Claude使用瀏覽器自動化工具(如Puppeteer MCP server),像人類用戶一樣進行測試。通過讓Claude看到屏幕截圖,它能識別并修復代碼中不明顯的Bug

      快速上手流程(Getting up to speed)

      基于上述架構,每個編碼Agent在會話開始時都會被提示執行一系列標準步驟:

      1. 1. 運行pwd查看當前工作目錄。

      2. 2. 閱讀Git日志和進度文件,了解最近完成了什么。

      3. 3. 閱讀功能列表文件,選擇一個未完成的最高優先級功能。

      4. 4. 運行init.sh啟動開發服務器。

      5. 5. 在實現新功能前,先運行基本的端到端測試,確保應用未處于損壞狀態。

      典型會話流程示例:

      [Assistant] 我先了解一下項目當前狀態。 [Tool Use] [Tool Use] [Tool Use] [Assistant] 檢查Git日志... [Tool Use] [Assistant] 檢查是否有啟動腳本并重啟服務器... [Assistant] 現在驗證基本功能是否正常... [Assistant] 驗證通過。現在我查看 tests.json 決定下一步做什么。
      常見故障模式與修復方案總結

      問題

      初始化Agent行為

      編碼Agent行為

      Claude過早宣布項目全部完成

      根據輸入規格,建立包含詳細功能描述的結構化JSON文件。

      會話開始時讀取功能列表,只選擇一個功能開始工作。

      環境遺留Bug或無文檔記錄

      建立初始Git倉庫和進度筆記文件。

      開始時讀取進度文件和Git日志;運行基礎測試發現潛在Bug;結束時提交Git和進度更新。

      過早標記功能為“完成”

      建立功能列表文件。

      自我驗證所有功能。僅在仔細測試后標記功能為“通過”。

      浪費時間研究如何運行App

      編寫能運行開發服務器的init.sh腳本。

      會話開始時直接讀取并運行init.sh

      這項研究展示了長程Agent框架的一種可行方案,但仍有未解決的問題:

      單Agent vs 多Agent:目前尚不清楚是通用的編碼Agent表現最好,還是采用多Agent架構(如專門的測試Agent、QA Agent、代碼清理Agent)更優

      領域泛化:本演示針對全棧Web開發。未來方向是將這些經驗推廣到科學研究或金融建模等其他長程任務領域

      參考:

      https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

      --end--

      最后記得??我,這對我非常重要,每天都在更新:

      歡迎點贊轉發推薦評論,別忘了關注我

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      船東表態:全面暫停涉俄所有航運業務

      船東表態:全面暫停涉俄所有航運業務

      新浪財經
      2025-12-08 07:25:14
      足球報:中赫接手國安9年已投80億,近兩年沒有屬地政府資金支持

      足球報:中赫接手國安9年已投80億,近兩年沒有屬地政府資金支持

      懂球帝
      2025-12-08 14:18:46
      72歲老戲骨濮存昕官宣外孫女出道,尖嘴猴腮,長相遭吐槽:太丑了

      72歲老戲骨濮存昕官宣外孫女出道,尖嘴猴腮,長相遭吐槽:太丑了

      深析古今
      2025-12-08 12:29:36
      0-2!姆巴佩失單刀,熊皇11場0球,皇馬主場爆冷,恐遭曼城吊打

      0-2!姆巴佩失單刀,熊皇11場0球,皇馬主場爆冷,恐遭曼城吊打

      我的護球最獨特
      2025-12-08 06:06:05
      國際巨頭確認裁員!6000人將失業

      國際巨頭確認裁員!6000人將失業

      支點財經
      2025-12-08 09:53:08
      借調到市里2年被原單位催著回去,臨走前市長把我叫到辦公室

      借調到市里2年被原單位催著回去,臨走前市長把我叫到辦公室

      故事那點事
      2025-12-06 09:50:08
      中日戰機對峙創下3個首次,日方召見中國大使抗議,中方當場駁斥

      中日戰機對峙創下3個首次,日方召見中國大使抗議,中方當場駁斥

      時時有聊
      2025-12-08 07:19:38
      中日開戰概率到底有多大?答案震撼:日本敢開第一槍,就是結局!

      中日開戰概率到底有多大?答案震撼:日本敢開第一槍,就是結局!

      健身狂人
      2025-12-08 09:58:05
      楊振寧走后1個月,翁帆搬離別墅,穿帆布鞋吃食堂,帶走34箱東西

      楊振寧走后1個月,翁帆搬離別墅,穿帆布鞋吃食堂,帶走34箱東西

      禾寒敘
      2025-11-28 19:07:41
      曾被中央通報違規聚餐飲酒致人死亡,魏栓師被開除黨籍和公職

      曾被中央通報違規聚餐飲酒致人死亡,魏栓師被開除黨籍和公職

      南方都市報
      2025-12-08 13:50:08
      黃循財強踩歷史雷區后,新加坡三線崩盤:內政、外交與輿情全面失控

      黃循財強踩歷史雷區后,新加坡三線崩盤:內政、外交與輿情全面失控

      阿離家居
      2025-12-08 12:06:28
      重磅決定!退休人員笑了?2026年養老金新政施行,每月多領多少!

      重磅決定!退休人員笑了?2026年養老金新政施行,每月多領多少!

      陳博世財經
      2025-12-08 14:14:43
      我在邊境釋放被俘的女兵,35年后我訪問越南,剛落地就被軍車圍住

      我在邊境釋放被俘的女兵,35年后我訪問越南,剛落地就被軍車圍住

      張道陵秘話
      2025-12-04 16:36:04
      全體退休人員,12月養老金到賬后,千萬別急著花!先做這3件事

      全體退休人員,12月養老金到賬后,千萬別急著花!先做這3件事

      李博世財經
      2025-12-08 10:49:40
      人民日報怒轉!杭州師大通報出爐:名單造假實錘,但是沒貪污!

      人民日報怒轉!杭州師大通報出爐:名單造假實錘,但是沒貪污!

      金哥說新能源車
      2025-12-08 09:57:15
      東方衛視首播!35集諜戰巨制來襲,開播一天,口碑爆表。不輸潛伏

      東方衛視首播!35集諜戰巨制來襲,開播一天,口碑爆表。不輸潛伏

      樂楓電影
      2025-12-08 15:41:04
      消防隊脫離武警后,如今是軍還是警?看完才知國家的良苦用心

      消防隊脫離武警后,如今是軍還是警?看完才知國家的良苦用心

      小莜讀史
      2025-12-08 13:06:39
      掃地出門!皇馬正式批準出售“頭號廢柴”!1.1億歐強援“空降”

      掃地出門!皇馬正式批準出售“頭號廢柴”!1.1億歐強援“空降”

      頭狼追球
      2025-12-08 11:13:44
      《三國演義》常被叫錯的12個名字,沒點文化張口就鬧笑話,你讀對了嗎?

      《三國演義》常被叫錯的12個名字,沒點文化張口就鬧笑話,你讀對了嗎?

      詩詞世界
      2025-12-06 06:04:09
      48歲男子因心梗猝死,生前堅持每天散步5公里,醫生:3個習慣致命

      48歲男子因心梗猝死,生前堅持每天散步5公里,醫生:3個習慣致命

      卡西莫多的故事
      2025-12-08 10:20:04
      2025-12-08 18:59:00
      AI寒武紀 incentive-icons
      AI寒武紀
      專注于人工智能,科技領域
      1001文章數 375關注度
      往期回顧 全部

      科技要聞

      外面有人挖,家里有人跑:蘋果亂成了一鍋粥

      頭條要聞

      臺學者:殲-15開射控雷達照射F-15 反而是日本撿到寶

      頭條要聞

      臺學者:殲-15開射控雷達照射F-15 反而是日本撿到寶

      體育要聞

      一位大學美術生,如何用4年成為頂級跑者?

      娛樂要聞

      章子怡被說拜高踩低 主動和卡梅隆熱聊

      財經要聞

      重磅!政治局會議定調明年經濟工作

      汽車要聞

      純電全尺寸大六座 凱迪拉克"小凱雷德"申報圖曝光

      態度原創

      本地
      旅游
      數碼
      公開課
      軍事航空

      本地新聞

      云游安徽|七千年敘事,第一章寫在蚌埠

      旅游要聞

      “趣唱、趣跑、趣逛” 豐富游園體驗,世紀公園持續探索“公園+”

      數碼要聞

      華為Mate 80 RS率先實現BT.2020色域 李小龍:過于先進!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      柬泰沖突細節披露 洪森要求部隊“克制”

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲成人在线一区二区三区| 亚州成人AV| 国产精品国产三级在线专区| 91福利导航| 毛片久久网站小视频| 无码人妻一区二区三区av| 91精品人人妻人人澡人人爽人人精东影业| 酒店大战丝袜高跟鞋人妻| 欧美性交网| 久久综合九色综合欧洲98| 无码中文字幕网| 密臀av| 一区二区三区国产| 亚洲精品一品区二品区三品区| www.91大神在线观看| 无码熟妇人妻av在线电影| 激情综合色五月丁香六月欧美| 国产色精品久久人妻| 第一福利导航视频| 国产精品青草久久久久福利99| 西西午夜无码大胆啪啪国模| 台州市| 超碰人人妻| 亚洲精品无码不卡在线播he| 大又大又粗又硬又爽少妇毛片| 久久精品亚洲| 久久影院午夜理论片无码| 亚洲欧美成人综合| 9191久久| 亚洲色无码| 18禁无遮挡啪啪无码网站| 亚洲成a人片在线观看久| 人妻无码成人| 色二区| 51妺嘿嘿午夜福利| 精品国产一区二区三区四区阿崩| 陆河县| a网站免费观看| 一起草AV| 红桃视频成人传媒| 铜川市|