<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<sub id="piemq"><s id="piemq"></s></sub>

^{<ruby id="piemq"></ruby>}

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

OpenAI工程師不寫代碼了：AI寫得太快，人類檢查跟不上，Agent直接包辦開發

2026-03-09 18:52:32　來源: AI前線

北京舉報

0

分享至

作者｜木子

OpenAI 最近在一篇 Blog 中說了件挺炸裂的事：他們自己的工程師，已經不怎么寫代碼了。

在一個內部項目里，短短五個月，就產出了 100 萬行代碼，而且沒一行手寫，全都是Codex寫的。

這些代碼并不是什么零散腳本，而是從零開始搭出來的一整套軟件產品內部 Beta 版：從應用邏輯、基礎設施，到工具、文檔和內部開發者工具，幾乎一應俱全。

這種變化，或許能從 OpenAI 內部一直以來的工程師文化中找到一些線索。

一位曾參與 Codex 項目的 OpenAI 工程師 Calvin French-Owen，在離職后寫過一篇博客，雖然他在其中吐槽說，過去一年里 OpenAI 員工規模迅速擴張，帶來了不少混亂。

不過他同時也提到，公司內部依然保留著很強的創業公司氛圍：團隊小、決策快，工程師擁有很高的自主權。

另外，很多科技巨頭是高層定路線、然后團隊執行，但在 OpenAI，通常沒有明確的長期 roadmap，研究員往往自己發現問題、提出想法，小團隊圍繞好點子自然形成并推進項目。

他表示，真正推動進展的好想法可能隨時從任何地方隨時，而不是來自某個宏大計劃。

“OpenAI 非常注重自下而上的方式，尤其是在研究方面。”

比如 Codex，最初其實誕生在 OpenAI 的一個只有十幾人的小團隊里。這個團隊在 7 周內幾乎不眠不休，把 Codex 從想法一路推到了上線。

而現在這個“OpenAI 工程師不寫代碼”一事，其實也要從公司一個團隊，在開發流程中發現的新瓶頸說起。

現在 AI Coding 這件事已經屢見不鮮。但當 Codex 開始大規模生成代碼后，OpenAI 的這研發團隊很快發現一個新問題：

代碼生成已經不慢了，慢的是讓人類來檢查這些代碼。

人的時間和注意力是有限的。在整個開發流程里，最容易卡住的環節反而變成了 QA（質量測試）。

為了解決這個問題，OpenAI 的工程師換了個思路：干脆讓 Codex 模仿工程師，自己去“看”和“用”應用。

那 OpenAI 的工程師現在不寫代碼了，他們到底在做什么？

——設計環境、搭反饋循環、定義架構約束，然后讓 agent 寫。

文章中強調一句話：“人類掌舵，智能體執行”。

他們管這叫Harness Engineering，直譯過來的話就是“AI 駕馭工程”。

工程師變成“能力架構師”

這個項目始于 2025 年 8 月下旬，從向一個完全空白的代碼倉庫提交第一行內容開始。

初始架構，包括代碼倉庫結構、CI 配置、格式化規則、包管理器設置和應用框架——都不是工程師手寫的，而是在一小套模板的指導下，由Codex CLI 調用 GPT-5 自動生成。

甚至連那份告訴 agent “該如何在這個倉庫里工作”的AGENTS.md，也是 Codex 自己寫出來的。

換句話說，這個系統從誕生那刻起，就幾乎沒有人工代碼。整個代碼倉庫，都是被 agent 一步一步搭起來的。

不過，一開始事情并沒有想象中那么順利：起初項目推進速度緩慢，但問題并不在 Codex 的能力，而在環境——規則不清晰、工具不完整、系統約束還沒建立起來。

有網友“一針見血”道：

“最扎心的一句：agent 反復犯錯，不是能力問題，是你腦子里的判斷力沒寫下來。你不寫，它第一百次還犯同樣的蠢。”

于是再遇到開發卡住時，團隊不再想著“再改一段代碼試試”，而是先問一個問題：agent 到底缺什么能力？

再把這種能力變成它能讀懂、能執行、還能被強制遵守的規則。

也就是說，面對當下 agent 自己就能測試、改 bug 的情形，工程師的工作重點從“寫代碼” 變成了另一件事：讓 Codex 更容易把事情做對，給 agent“補能力”。

從這個角度看，工程師的工作其實轉向了更高一層：用一句話來說，就是拆解任務、設計能力、搭建系統，讓 agent 可以穩定地產生正確的代碼。

具體來說，大致有這幾件事情：

第一件事，就是讓應用對 AI “可讀”。

正如上文提到的，需要人為把 agent 接入 Chrome DevTools 協議，讓它能“觸控”UI。

工程師要做的第二件事情，就是把“隱性知識”全部寫進代碼倉庫，變成機器可讀的知識。

對 agent 而言，無法在運行時訪問的內容就等于不存在。比如存儲在 Google Docs、聊天記錄或人們頭腦中的知識嗎，這些都無法被系統訪問。

不過，不可以把所有規則和說明一次性塞給 Codex，而是要先給它一個導航，再讓它自己去查細節。

研究研究團隊曾嘗試過直接給 agent 一個巨大的AGENTS.md文件，結果很快發現行不通。

主要原因是，上下文是稀缺資源，說明書越厚，真正重要的信息反而越容易被淹沒；而且這種大文檔很快就會過時，也很難驗證和維護。

他們把這段經驗總結成了一句：

“要給 Codex 的是一張地圖，而不是一本 1000 頁的說明書。”

該示意圖由 AI 生成

工程師要做的第三件事，是設計“AI 友好”的架構。

AI 在結構清晰、邊界明確的系統里效率最高。對人來說，這些規則可能顯得死板，但對 agent 來說，這是效率倍增器。

所以 OpenAI 的這個團隊設計了一套嚴格架構, 每個業務域必須按固定層級：Types→ Config→ Repo→ Service→ Runtime→ UI。

依賴方向是強制的。任何違反都會被自動阻止。

第四件事，是把“品味”變成規則。

“在 AI 時代，人類最重要的能力是 Taste。”隨著大模型越來越強，這樣的聲音不絕于耳。

這篇 Blog 中，有一個很有意思的概念：taste invariants（品味不變量）。

意思是，工程師的審美，比如：文件大小限制、命名規則、日志結構、API 規范等，都被寫成lint 規則。

這樣 AI 每次寫代碼都會自動遵守：“人類的品味一旦被捕捉，就可以應用到每一行代碼。”

在實際開發中，人類主要通過提示與系統交互：描述任務、啟動 agent，然后讓 Codex 自動生成 Pull Request。

接下來的一整套流程，包括代碼自檢、agent 評審、根據反饋修改、再次提交，基本都由 agent 自己完成，并不斷循環，直到所有評審通過。

第五件事，就是清理 AI 產生的“垃圾”。

文章指出，完全自主的智能體也引入了新的問題。

當代碼幾乎全部由 Codex 生成后，一個新問題也出現了：AI 會不斷復制代碼庫里已有的模式，包括那些不太好的寫法，時間一長代碼風格就會慢慢“漂移”。

一開始，團隊計劃每周抽一天時間手動清理這些“AI 殘渣”，但很快發現這種方式根本不具備可擴展性。

后來他們把工程師的經驗和偏好寫成一套“黃金原則”，比如優先使用共享工具庫、嚴格校驗數據結構而不是“猜著寫”。

然后將這套原則直接編碼進代碼倉庫，讓 Codex 自動掃描問題并發起重構 PR。

這樣就像給代碼庫加了一套“垃圾回收機制”：小問題可以隨時清理，技術債不會越滾越大。

這篇 Blog 在技術圈引起了的廣泛關注和討論，有人認為，這個 Harness Engineering 本質上是一種現代版的控制論：工程師不再直接寫代碼，而是設計系統、規則和反饋回路，讓 agent 自動完成工作。

他表示，這種模式，其實在歷史上已經出現過三次了。

從瓦特蒸汽機的調速器，到 Kubernetes 的控制器，再到今天的 AI agent；真正的變化不是“機器替代人”，而是人的角色，從執行者變成系統的設計者和校準者：

“你不再親自去擰閥門，而是開始掌舵。每當這種模式出現，背后通常都是因為有人構建出了足夠強大的傳感器和執行器，能夠在那個層級上把反饋回路真正閉合起來。”

Agent 都開始包辦開發流程了

為什么 OpenAI 的工程師可以不再寫代碼了？不妨來看看他們的agent 現在已經能干到什么程度。

前文提到，OpenAI 的工程師換了個思路：干脆讓 Codex 模仿工程師，自己去“看”和“用”應用。

第一，是讓 agent 能“看見”應用界面（UI）。

他們把 Chrome DevTools 協議接入到 agent 的運行環境里。這樣一來，Codex 就可以像開發者在瀏覽器里調試一樣操作頁面、讀取日志、抓取 DOM、截屏觀察界面......

這一步其實非常關鍵，因為LLM 本身是看不見 UI 的。

接入 DevTools 之后，Codex 就相當于有了“眼睛”和“手”：

可以通過截圖和 DOM 觀察頁面，通過 console 和 network 監聽運行狀態，還能自己點擊、輸入、導航。

該示意圖由 AI 生成

有了這些能力，agent 就可以自己復現 bug、自動跑 UI 測試、驗證修復是否生效。

這樣一來，Codex 就不只是寫代碼，還開始像一個自動化 QA 工程師一樣工作：自己測試自己寫的代碼，并反復修復，直到系統通過測試。

換句話說，原本需要人工完成的大量測試和調試工作，被自動化了。

就像下面這張圖里展示的那樣：最核心的一步是 “Loop Until Clean”——不斷測試、修復、再測試，直到系統沒有錯誤。

第二點，只能操作 UI 還不夠，還得讓 agent 看見系統內部發生了什么。

為此，OpenAI 給 Codex 接入了一整套可觀測系統（Observability）。

應用在運行時會產生三類關鍵數據，也是工程師排查問題時最常用的信號：

Logs（日志）
Metrics（性能指標）
Traces（調用鏈）

這些數據會先被一個叫Vector的組件統一收集，再送到本地的可觀測系統里。

這樣一來，Codex 就能像工程師一樣查系統狀態：哪個服務報錯了？哪個接口變慢了？請求卡在哪一層？

當發現問題后，Codex 會自己修改代碼、提交 Pull Request、重啟應用、重新運行任務，再觀察系統指標有沒有改善。

整個過程會形成一個自動反饋循環：發現問題 → 修改代碼 → 再運行 → 再觀察。

一直重復，直到問題消失。

換句話說，Codex 不只是看代碼，還能像運維一樣查日志、看性能數據，判斷系統哪里出了問題，再修改代碼驗證修復效果。

這篇博文中提到，給定一個提示，Codex 驅動的 agent 就可以：

agent 不再只是一個寫代碼的工具，而是開始承擔完整的軟件開發流程。

整個開發流程大致為：Codex 寫代碼 → 啟動應用 → 像用戶一樣操作頁面 → 檢查結果 → 如果不對就改代碼再跑。

不過需要說明的是，這套流程之所以能跑通，很大程度上依賴他們為這個代碼倉庫專門設計的結構和工具鏈。

如果沒有類似的工程投入，這種“全自動開發流程”目前還很難直接照搬。

目前來看，這套“agent 寫代碼、人類設計系統”的模式，在 OpenAI 內部運行得還不錯；但很多問題仍在探索階段：比如 AI 生成的代碼庫長期會不會失控，人類判斷力該如何嵌入系統。

不過可以預見的是，軟件工程的重點可能會逐漸從“寫代碼”，轉向設計環境、規則和反饋機制；讓像 Codex 這樣的 agent，可以更穩定地參與構建和維護復雜的軟件系統。

https://openai.com/zh-Hans-CN/index/harness-engineering/

https://x.com/odysseus0z/status/2030416758138634583

https://calv.info/openai-reflections

聲明：本文為 AI 前線整理，不代表平臺觀點，未經許可禁止轉載。

會議推薦

2026，AI 正在以更工程化的方式深度融入軟件生產，Agentic AI 的探索也將從局部試點邁向體系化工程建設！

QCon 北京 2026 已正式啟動，本屆大會以“Agentic AI 時代的軟件工程重塑”為核心主線，推動技術探索從「AI For What」真正落地到可持續的「Value From AI」。從前沿技術雷達、架構設計與數據底座、效能與成本、產品與交互、可信落地、研發組織進化六大維度，系統性展開深度探索。開往 2026 的 Agentic AI 專列即將啟程！匯聚頂尖專家實戰分享，把 AI 能力一次夯到位！

今日薦文

你也「在看」嗎？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

大風315 | 游客稱飛3000公里在西雙版納一景區游玩，因明星錄制綜藝節目被清場；景區：具體情況需由游客回應

大風新聞 2026-03-09 17:06:09
6989 跟貼 6989
倆法國小伙辭職走路到中國:耗時2年走出新疆花了45天

新民周刊 2026-03-10 16:44:38
3391 跟貼 3391

紫牛頭條 | 買時宣稱功能永久免費，用后卻被要求付費升級！顧客投訴知名品牌電動車“言而無信”

揚子晚報 2026-03-10 07:15:24
3844 跟貼 3844

德黑蘭市區再遭密集轟炸有戰機轟鳴

新華社 2026-03-10 10:39:14
11572 跟貼 11572
于冬個人律師：“于冬欠付澳門永利473萬元債務”系于東為第三方擔保導致，債務已還清

每日經濟新聞 2026-03-10 18:56:19
72 跟貼 72

女子在杭州西湖景區把“西泠印社”認成“杜帥冷面”，網友：四個字認錯五個，當事人：沒有文化確實不行

揚子晚報 2026-03-06 17:44:56
1502 跟貼 1502

“見過搶米搶面，沒見過搶塑料”，中東開戰，東莞一個小鎮大堵車！貿易商：潑天的富貴來了，干嘛不抓住？業內提醒：只是虛假繁榮

每日經濟新聞 2026-03-10 21:06:07
52 跟貼 52
全網售罄、多地斷貨！老板懵了：以前堆成山都賣不掉，結果現在價格暴漲

掌上春城 2026-03-10 20:24:37
366 跟貼 366

13歲中國小孩哥奪得世界街舞冠軍！本人回應：比賽的時候在想我一定要贏

都市快報橙柿互動 2026-03-10 00:30:22
139 跟貼 139
-1℃！還有雨！江蘇天氣最新預測

江南晚報 2026-03-11 03:32:57
4 跟貼 4
李斌談超快充和換電模式：超快再快不可能有換電快，超快充對電池壽命和安全性等有損害

中國能源網 2026-03-10 11:33:11
540 跟貼 540
剛剛，湖北官宣“楚超”來了！

極目新聞 2026-03-10 11:03:13
208 跟貼 208
中國成品油價迎四年來最大漲幅

環球網資訊 2026-03-10 09:34:47
5052 跟貼 5052
中朝國際旅客列車3月12日起雙向開行

中國鐵路 2026-03-10 20:40:01
77 跟貼 77
于東來發文稱死后不辦任何儀式，骨灰找就近河流撒完，近日他現身多地并分享旅游動態

大風新聞 2026-03-10 18:42:55
85 跟貼 85
還沒焐熱就腰斬，MacBook Neo4599元發布2429元到手，比買iPad還劃算？

齊魯壹點 2026-03-10 10:38:15
953 跟貼 953
長城魏建軍：隱藏式門把手是偽技術，千分之一風阻改善得不償失

界面新聞 2026-03-10 09:20:35
588 跟貼 588
王勵勤談畸形體育飯圈亂象：中國乒協堅決抵制

人民網-人民日報 2026-03-10 20:29:05
371 跟貼 371
上海二手房周末單日成交超1300套，“看房五年的客戶準備出手了”

澎湃新聞 2026-03-10 09:50:26
140 跟貼 140
70余名滯留中東臺胞經上海中轉順利返臺

極目新聞 2026-03-10 22:17:59
240 跟貼 240
曝2025年“印度產”iPhone 達5500萬部

環球網資訊 2026-03-10 15:25:22
118 跟貼 118
騰訊視頻稱異常僅為頁面展示錯誤

北京日報 2026-03-09 18:23:43
386 跟貼 386
孫光芝：建議“不得強迫游客購物”寫進旅游法

中國網 2026-03-10 15:10:17
171 跟貼 171
官方出手：5名醫務人員被通報處罰！多地衛健委發文，違規者或將被解聘

華醫網 2026-03-11 05:40:53
0 跟貼 0

2026年就業有多難，有HR一個崗位放上去沒多久，上百人就來咨詢了

2026年就業有多難，有HR一個崗位放上去沒多久，上百人就來咨詢了

映射生活的身影

2026-03-10 17:05:43

沖突第9天，美軍士兵被活捉？美大使館被炸，特朗普態度180度轉變

沖突第9天，美軍士兵被活捉？美大使館被炸，特朗普態度180度轉變

來科點譜

2026-03-10 10:06:23

白玉蘭獎投票排名：《生萬物》第5，《生命樹》僅第2，第一憑啥？

白玉蘭獎投票排名：《生萬物》第5，《生命樹》僅第2，第一憑啥？

林輕吟

2026-03-10 19:28:26

99年女博士不讀書去修家電，“全女維修”引爭議｜大象夜讀

99年女博士不讀書去修家電，“全女維修”引爭議｜大象夜讀

大象新聞

2026-03-10 18:13:03

伊朗導彈擊中耶路撒冷，駐有美軍基地多國傳出爆炸聲

伊朗導彈擊中耶路撒冷，駐有美軍基地多國傳出爆炸聲

界面新聞

2026-03-02 15:09:03

滯留臺胞平安回家：“很感謝我們的祖國”

滯留臺胞平安回家：“很感謝我們的祖國”

新浪財經

2026-03-10 11:43:59

美防長稱將對伊朗發起“最高強度”打擊

美防長稱將對伊朗發起“最高強度”打擊

新華社

2026-03-10 20:57:07

發現晚了，還有這么牛逼的存在

懶貓的豐收日

2026-03-10 17:54:18

我在西藏旅游，一個喇嘛見我后突然跪下：活佛，我們等了您百年

我在西藏旅游，一個喇嘛見我后突然跪下：活佛，我們等了您百年

千秋文化

2026-01-29 21:35:02

全國人大代表汪勇：外賣員面臨雙重困境

全國人大代表汪勇：外賣員面臨雙重困境

看看新聞Knews

2026-03-10 21:38:04

39歲楊冪編發扮嫩失敗，生圖滿臉疲態，變回方臉神似謝娜

39歲楊冪編發扮嫩失敗，生圖滿臉疲態，變回方臉神似謝娜

萌神木木

2026-03-08 22:43:31

別吹 B 費了！曼聯新真核已誕生，被譽為隊內最佳！

別吹 B 費了！曼聯新真核已誕生，被譽為隊內最佳！

奶蓋熊本熊

2026-03-11 03:23:53

徐帆回應離婚5個月，馮小剛近況曝光，內心早已看透一切

徐帆回應離婚5個月，馮小剛近況曝光，內心早已看透一切

甜檸聊史

2026-01-14 14:25:28

人民幣升值再創新高，最新匯率計算，中國GDP將突破20萬億美元

人民幣升值再創新高，最新匯率計算，中國GDP將突破20萬億美元

壹號股權

2026-03-10 11:42:55

WTT重慶站：張本智和單局10-4領先被逆轉，總比分3-2晉級

WTT重慶站：張本智和單局10-4領先被逆轉，總比分3-2晉級

燒體壇

2026-03-10 16:33:55

巴薩財務主管：為簽耐克的贊助合同向中間人支付傭金2800萬歐

巴薩財務主管：為簽耐克的贊助合同向中間人支付傭金2800萬歐

懂球帝

2026-03-10 22:32:21

以色列為什么突然躺平！不主動攔截來襲的導彈了呢？

以色列為什么突然躺平！不主動攔截來襲的導彈了呢？

Ck的蜜糖

2026-03-08 13:03:35

消防支隊長調任副總隊長

靠山屯閑話

2026-03-10 21:40:47

留不住了！阿森納瑰寶遭皇馬挖角，他心已不在槍手

留不住了！阿森納瑰寶遭皇馬挖角，他心已不在槍手

瀾歸序

2026-03-11 04:19:00

全國政協委員、中國傳媒大學黨委書記廖祥忠：去年中傳砍掉翻譯、攝影等16個本科專業，未來是“人機分工時代”，教育變革迫在眉睫

全國政協委員、中國傳媒大學黨委書記廖祥忠：去年中傳砍掉翻譯、攝影等16個本科專業，未來是“人機分工時代”，教育變革迫在眉睫

瀟湘晨報

2026-03-09 10:29:14

面向AI愛好者、開發者和科學家，提供AI領域技術資訊。

1352文章數 133關注度

往期回顧全部

科技要聞

全民"養蝦"背后：大廠集體下場瘋狂賣Token

頭條要聞

伊朗新最高領袖在襲擊中受傷未公開發表講話官方回應

頭條要聞

伊朗新最高領袖在襲擊中受傷未公開發表講話官方回應

體育要聞

加蘭沒那么差，但鱸魚會用嗎？

娛樂要聞

《逐玉》注水風波升級！315評論區淪陷

財經要聞

“龍蝦補貼”密集出爐最高1000萬！

汽車要聞

MG4有SUV衍生上汽乘用車多款新車規劃曝光

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

教育

親子

數碼

藝術

本地新聞

云游中國｜候鳥高顏值亮相！沉浸式打卡青海濕地

教育要聞

祝賀！劉硙教授，當選院士

親子要聞

老婆懷的是女孩嗎？

數碼要聞

M5 Max 版 16 英寸 MacBook Pro 體驗：算力巔峰與專業視界

藝術要聞

這組剪紙太美了！

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<blockquote id="8m4bn"></blockquote>

<sup id="8m4bn"><rt id="8m4bn"><code id="8m4bn"></code></rt></sup>

<s id="8m4bn"><li id="8m4bn"></li></s>