<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Zed 為什么不用自己造 Agent?OpenAI 架構師給出答案:Codex 重劃 IDE × Coding Agent 的分工邊界

      0
      分享至


      編譯 | 傅宇琪

      編輯 | Tina

      Coding agents(編碼智能體) 已成為應用型 AI 中最活躍的領域之一,但許多團隊在模型或服務商更迭時,仍不斷重復構建脆弱的基礎設施。那么,如何在生態不斷變化的背景下保持快速迭代與高度韌性,并將更多精力投入到領域特定的工作流程和用戶體驗上?

      作為行業內的動向標桿,OpenAI 的 Codex 提出了解決方法——“模型和 Harness(工具集)的共同構建”。最近,OpenAI 的架構師 Bill Chen 和 Brian Fioca 在演講里一起詳細介紹了該構建過程中克服的挑戰,以及這個 Coding Agent 本身一些新興的使用模式?;谠撗葜v視頻,InfoQ 進行了部分刪改。

      核心觀點如下:

      • 通過將模型與 Harness 一同開發,你能更好地理解它的行為,這也是 Codex 作為一個集成了模型和 Harness 的系統的優勢所在。

      • 單純在模型上構建包裝器,忽視了基礎設施層的整體價值。將精力集中在讓產品脫穎而出的差異化功能上,才是這種模式的核心價值所在。

      • 未來將是關于龐大代碼庫和非標準庫的時代,如何在閉源環境中工作,如何匹配現有模板和實踐,模型將不斷支持這些能力。

      Coding Agent 的構成

      首先,我們來談談 Coding Agent 的構成。其實非常簡單,一個 Coding Agent 由三部分組成:用戶界面、模型和 Harness。用戶界面顯而易見,可能是命令行工具,也可能是集成開發環境,或者是云端或后臺 Agent。模型也很直白,比如我們最近發布的 GPT-5.1 系列模型或其他一些供應商的模型。至于 Harness,這是一個稍微復雜一點的部分,它直接與模型交互,最簡化地說,可以將其看作是由一系列提示和工具組合而成的核心 Agent 循環,它為模型提供輸入和輸出。


      Coding 領域是應用人工智能最活躍的前沿之一,而隨著新模型的不斷發布,我們面臨的挑戰也在增加。更為復雜的是,大家不得不不斷調整 Agent 以適應新發布的模型。

      接下來我們將聚焦于 Harness 的部分。Harness 是模型的接口層,它是模型與用戶、代碼之間進行交互的媒介。它包括了模型需要的所有組件,以便在多輪對話中進行工作,調用工具,并最終為你編寫代碼,解讀用戶的需求。對一些產品來說,Harness 可能是其中的關鍵部分。不過,構建一個高效的 Harness 并不是一件輕松的事。

      那么,構建 Harness 過程中遇到的挑戰有哪些呢?首先是 AV(音視頻工具)問題。你可能會為 Agent 提供一個全新的、創新的工具,但它可能是模型之前從未見過的,它可能并不擅長使用這種工具。即使它曾經見過,你也需要花時間根據該模型的特點調整 Prompt。

      新模型不斷發布,延遲問題也是一個挑戰。模型在處理某些問題時需要時間,那么,我們應該如何設計提示,避免延遲過長?如何在用戶體驗上展示模型思考的過程?它在思考時是否與用戶溝通,還是我們需要總結其輸出結果?此外,管理上下文窗口和數據壓縮也是一大難題。另外,API 接口也在不斷變化,現在我們有完成功能、響應功能,以及未來可能出現的其他功能,模型是否能熟練使用這些工具以便發揮最大的智能也是一個問題。

      將模型適配到 Harness 中需要大量的 Prompt 設計。實際上,模型的訓練方式會帶來一些副作用。我喜歡這樣理解:(Steerability = Intelligence + Habit)智能加上習慣。一方面,智能是指:模型擅長什么?熟悉哪些編程語言?在某些框架中,模型能把代碼寫得多好?另一方面,它又養成了哪些習慣來解決問題?我們在訓練模型時,培養了它在規劃解決方案、查找背景信息、思考問題后再動手寫代碼,并在最后測試工作的習慣。

      理解這些習慣是成為一名優秀的 Prompt 工程師的關鍵。如果你沒有按照模型熟悉的方式來指導它,可能會遇到問題。當我們發布 GPT-5 時,許多不習慣使用我們模型的人,嘗試將其他模型的 Prompt 直接套用到我們的 Harness 中,結果發現我們的模型做的事情比其他模型要更為細致,導致了響應速度慢,效果不如預期。我們最終發現,如果讓模型按照它習慣的方式進行工作,而不是過度引導,它的表現會更好。通過與模型的對話,我問它:“我喜歡這個解決方案,但它花了太長時間。下次你能做得更快嗎?”模型回答說:“你讓我去看所有的內容,其實我并不需要這樣做,正是因為這個原因,才耗費了這么長時間。”

      因此,通過將模型與 Harness 一同開發,你能更好地理解它的行為,這也是 Codex 作為一個集成了模型和 Harness 的系統的優勢所在。

      Codex 作為 Harness/Agent

      Codex 被設計成一個適用于各種編程環境的 Agent,它可以作為 VS Code 插件、CLI 工具使用,甚至可以通過 VS Code 插件或手機上的 ChatGPT 在云端調用。它的功能非常基礎:你可以通過提示將想法轉化為可運行的代碼,具備規劃能力。它能在代碼倉庫中導航并編輯文件,執行命令和任務,你也可以從 Slack 或 GitHub 上調用它來審查 PR。

      這意味著 Codex 的 Harness 需要能夠完成許多復雜的任務:需要處理并行工具調用、線程合并等問題,還要考慮安全性,例如沙箱管理、提示語轉發、權限設置、端口管理等。數據壓縮和上下文優化的管理也非常復雜。何時觸發壓縮,何時重新注入數據,如何優化緩存,所有這些都是必須要解決的挑戰。如果你要從零開始構建這些功能并保持其更新,工作量巨大。幸好,我們已經將這些功能集成到一個 Agent 系統中,它能安全地編寫自己的工具來解決遇到的新問題。

      這聽起來比普通的 Coding Agent 強大多了,不是嗎?但想想看,其實在瀏覽器和圖形用戶界面出現之前,我們操作計算機的方式不就是通過命令行界面寫代碼并將其串聯起來嗎?這意味著,如果你能將任務以命令行方式以及文件任務的形式表達出來,Codex 就能知道該如何執行。

      舉個例子,我喜歡使用 Codex 將我的桌面上的照片整理到一個文件夾里,這是一個非常簡單的應用場景。但它還能做的不僅如此,它能夠分析文件夾中大量的 CSV 文件,進行數據分析,這并不一定是 Coding 任務,只要能夠通過命令行工具來完成,Codex 就能幫你做?,F在我們可以看到,Codex 是如此強大和有趣。

      用 Codex 構建自己的 Agent

      如果你希望將 Codex 集成到自己的 Agent 中,該如何操作呢?如果你打算創建下一個 Coding 初創公司,一個關鍵的模式是:Harness 成為新的抽象層。這個模式的好處非常明顯,你不再需要在每次模型升級時都優先優化提示語和工具。但這是不是意味著你僅僅是在構建一個包裝器呢?不是。正如我所說,單純在模型上構建包裝器,忽視了基礎設施層的整體價值。將精力集中在讓產品脫穎而出的差異化功能上,才是這種模式的核心價值所在。

      我們來看看一些我們與客戶合作時所遇到的模式,這些模式實際上幫助他們成功構建了產品。Codex 是一個 SDK,你可以通過 TypeScript 庫來調用它,也可以通過 Python 執行它。它還提供了一個 GitHub 動作,能夠自動合并 PR 中的沖突,解決大家討厭的合并問題。此外,你還可以將它添加到 AgentSDK 中,并為你的產品提供 MCP 連接器。這樣,你就可以擁有一個 Agent 系統。


      我喜歡說,我們從最初的聊天機器人開始,它們能與用戶對話;然后我們為這些聊天機器人提供了使用的工具;如今,你可以為聊天機器人添加更多工具,使它能夠自己生成尚未擁有的 Harness?,F在,你可以構建一個企業級的軟件,允許它為每個客戶即時編寫插件連接器,這曾是專業服務團隊的工作。你可以獲得完全可定制的軟件,且它可以與自己對話。我曾為開發日創建了一個看板,它能夠自動修復自己的 bug,非常有趣。

      最后,你也可以像 Zed 一樣,將 Codex 嵌入到一個層級中,為 IDE 提供接口,使其能夠與用戶互動并進行代碼編輯。這樣,Zed 就不必處理我們擅長的部分,而是可以專注于打造最好的代碼編輯器。

      我們的頂級合作伙伴,如 GitHub,已經利用這些模式取得了巨大成功。我們為 GitHub 創建了一個 SDK,允許他們直接與 Codex 集成。你也可以使用這個 SDK 將 Codex 作為你 CI/CD 管道的一部分,或者將它作為與自己 Agent 直接互動的工具。如果你想定制 Agent 層,完全可以這么做。舉個例子,我們與 Cursor 團隊緊密合作,他們將自己的 Harness 與我們開源的 Codex CLI 實現對接,成功地優化了系統性能,所有這些都是公開可用的,你可以克隆我們的代碼庫,隨意使用。

      Codex 的未來是什么樣的呢?它還沒有發布一年,尤其是在推出 Codex Max 之后,變化非常迅速。它目前是增長最快的模型,每周服務數十萬億個 token,這個數字從開發日以來翻了一番。我們可以合理假設,模型將變得更強大,它們能處理更長周期的任務,而且不需要監督。新模型的信任度將進一步提高,我相信這些模型已經能夠處理比六個月前更復雜的工作,而且這種信任感將不斷增長。

      未來將是關于龐大代碼庫和非標準庫的時代,如何在閉源環境中工作,如何匹配現有模板和實踐,模型將不斷支持這些能力。SDK 也將不斷發展,以更好地支持這些模型的能力,使模型能夠在執行任務的過程中不斷學習,避免重復錯誤,并為寫代碼和使用終端解決問題的 Agent 提供更多支持,你將能夠通過 SDK 在自己的產品中使用這一切。

      那么,我們從中學到了什么呢?Harness 構建非常復雜,特別是在新的模型不斷發布的背景下。我們已經為你在 Codex 里構建了一個集成的工具,你可以直接使用它,或者查看源代碼自行改進。除 Coding 以外,通過它你還可以構建更多全新功能,而我們會處理確保你的計算機 Agent 具備最強的能力。同時,我們非常期待看到你們用它創造出的產品。

      https://www.youtube.com/watch?v=wVl6ZjELpBk

      聲明:本文為 InfoQ 編譯,不代表平臺觀點,未經許可禁止轉載。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      整天開會有啥必要啊?

      整天開會有啥必要???

      北京老付
      2026-01-20 10:59:33
      32歲凱恩獲拜仁天價續約,背后是6500萬解約條款的恐慌

      32歲凱恩獲拜仁天價續約,背后是6500萬解約條款的恐慌

      浮萍足球
      2026-01-27 00:53:05
      內幕來了!中國雷達被正名,美媒:美軍向委內瑞拉投下電磁脈沖彈

      內幕來了!中國雷達被正名,美媒:美軍向委內瑞拉投下電磁脈沖彈

      安珈使者啊
      2026-01-26 16:20:59
      女護士處理男患者隱私部位,會感覺難為情嗎?美女護士說出大實話

      女護士處理男患者隱私部位,會感覺難為情嗎?美女護士說出大實話

      第7情感
      2025-09-17 12:12:15
      日本政壇大變局,新首相人選出爐,對華態度不簡單

      日本政壇大變局,新首相人選出爐,對華態度不簡單

      你笑的好甜美
      2026-01-27 11:35:32
      庫里26397分超名宿!沖歷史前十要多久?答案太意外

      庫里26397分超名宿!沖歷史前十要多久?答案太意外

      籃球看比賽
      2026-01-27 12:33:28
      500架巨額訂單!巴基斯坦出口“梟龍”賺的錢,中國會有分成嗎?

      500架巨額訂單!巴基斯坦出口“梟龍”賺的錢,中國會有分成嗎?

      軍武次位面
      2026-01-26 19:30:48
      為何近期中國沒有懟特朗普?原來是中國銘記了拿破侖的一句名言!

      為何近期中國沒有懟特朗普?原來是中國銘記了拿破侖的一句名言!

      我心縱橫天地間
      2026-01-27 12:58:53
      烏軍能否守住紅軍城?不能!

      烏軍能否守住紅軍城?不能!

      史政先鋒
      2025-11-17 16:09:20
      格陵蘭拒絕美國吞并!有國家跪求成為美國的州,為啥美國不要?

      格陵蘭拒絕美國吞并!有國家跪求成為美國的州,為啥美國不要?

      軍武次位面
      2026-01-26 19:28:37
      負債4091億的京東花169萬買條魚,劉強東以前吃了保守的虧?

      負債4091億的京東花169萬買條魚,劉強東以前吃了保守的虧?

      BT財經
      2026-01-27 07:00:03
      1951年,戴笠獨子被處決,蔣介石兩年后下令:他的子孫全接回臺灣

      1951年,戴笠獨子被處決,蔣介石兩年后下令:他的子孫全接回臺灣

      古書記史
      2025-12-11 17:37:45
      翟欣欣鄰居曝猛料:她被帶走時哭瘋了,父母跟著落淚,稱跟她無關

      翟欣欣鄰居曝猛料:她被帶走時哭瘋了,父母跟著落淚,稱跟她無關

      談史論天地
      2026-01-26 18:40:03
      年薪近2000萬,在49歲時仍然是單身!這位董秘的硬核人生,太颯了

      年薪近2000萬,在49歲時仍然是單身!這位董秘的硬核人生,太颯了

      墨蘭史書
      2026-01-22 23:50:03
      策略:明天1月28日的預判出來了,全面減倉之前,我要說兩句!

      策略:明天1月28日的預判出來了,全面減倉之前,我要說兩句!

      一擔金
      2026-01-27 13:09:20
      172:199,日本選舉殺出黑馬,新首相浮現?對華態度成最大看點

      172:199,日本選舉殺出黑馬,新首相浮現?對華態度成最大看點

      面包夾知識
      2026-01-27 11:45:52
      閆學晶又迎噩耗,最擔心的事還是發生了,兒媳體制內工作恐難保

      閆學晶又迎噩耗,最擔心的事還是發生了,兒媳體制內工作恐難保

      離離言幾許
      2026-01-23 00:04:19
      簡直不敢相信,莫言竟將日本侵華戰爭比作“兄弟爭奪家產”

      簡直不敢相信,莫言竟將日本侵華戰爭比作“兄弟爭奪家產”

      雪中風車
      2026-01-18 17:08:39
      詹姆斯24+5創NBA歷史第1神跡!東契奇46+7+11+8記3分刷爆紀錄

      詹姆斯24+5創NBA歷史第1神跡!東契奇46+7+11+8記3分刷爆紀錄

      一將籃球
      2026-01-27 12:05:08
      他8次上春晚,作死被捕入獄,如今56歲無人問津,淪落到四處走穴

      他8次上春晚,作死被捕入獄,如今56歲無人問津,淪落到四處走穴

      小熊侃史
      2026-01-06 11:17:00
      2026-01-27 13:43:00
      InfoQ incentive-icons
      InfoQ
      有內容的技術社區媒體
      11987文章數 51717關注度
      往期回顧 全部

      科技要聞

      理想開始關店“過冬”,否認“百家”規模

      頭條要聞

      寶馬5系車主揪出汽修店一個"意外疏忽":我氣得吐血

      頭條要聞

      寶馬5系車主揪出汽修店一個"意外疏忽":我氣得吐血

      體育要聞

      帶著母親遺愿戰斗12年,交易添頭成了隊魂

      娛樂要聞

      張雨綺被曝代孕,春晚被拒,代言跑路

      財經要聞

      金價狂飆 “牛市神話”未完待續

      汽車要聞

      劍指小米YU7與特斯拉Model Y 問界M6要來了?

      態度原創

      藝術
      教育
      親子
      公開課
      軍事航空

      藝術要聞

      日本東京國立博物館中的100幅宋畫

      教育要聞

      為什么背單詞刷題幾輪,高三英語成績還是70多?從3個方面破解

      親子要聞

      9歲孩子從外面回到家,主動推開母親房間門,無意間拍到這樣一幕

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美海軍"林肯"號航母打擊群抵達中東地區

      無障礙瀏覽 進入關懷版