OpenAI 辦了一場內部分享,主題是 Vibe Engineering,這里區別于「Vibe Coding」,具體為啥,容我細細道來
Developer Experience 負責人 Romain Huet 和工程師 Aaron Friel 講了一個數據:
OpenAI 內部技術人員的 Codex 采用率超過 92%,所有內部 PR 都由 Codex 審核,使用 Codex 的工程師產出的合并 PR 比不用的多 70%
Friel 也講的另一個故事:
讓 Codex 跑了 7 小時,迭代了 200 多輪測試,最終產出的 diff 只有大約 500 行
代碼行數越來越便宜了,但證明代碼有效這件事,變貴了
![]()
代碼越來越便宜,信任越來越貴 12 小時,從空目錄到完整項目
分享會上, Friel 做了個現場演示把一個叫 Bazel Diff 的 Kotlin 項目用 Rust 從零重寫,要求 100% 兼容原項目
![]()
12 小時,從空目錄到完整項目
起點是一個空目錄,里面只有一個 prompt 文件
Friel 把 prompt 貼進 Codex CLI,然后就....等著
Codex 做的第一件事不是寫代碼,是創建一個「watchdog」子代理——專門用來提醒主代理「你的目標是什么、用戶的要求是什么」,防止跑偏
然后它啟動了一堆子代理并行工作,有的用 GPT 5.1,有的用 Codex Mini,分別去研究上游項目的代碼、調研 Bazel 8 和 Bazel 9 的差異、設計項目架構
所有進度都記錄在一個叫「exec plan」的文件里——不只是給模型看的,也是給人看的
Friel 說他之前晚上跑過一次完整的,大概 12 小時跑完
這個任務如果讓工程師手寫,大概需要幾周
7 小時 500 行的故事
這是 Friel 在 Dev Day 講過的故事,現在有了更多細節
當時他在沙發上邊看電視邊干活,順手把電腦設成不休眠,讓 Codex 跑一個任務
第二天早上醒來發現 Codex 還在跑
7 小時,200 多輪迭代,最終產出一個大約 500 行的 diff
![]()
7小時,200輪迭代,500行代碼
Friel 說很多工程師聽到這個數字的第一反應是:
「完了,寫了 10 萬行垃圾代碼吧?」
但事實相反——這是一個非常復雜的改動,Codex 把大部分時間花在了跑測試、改測試、再跑測試上
最終這個改動被 merge 了
Romain 說這才是新的進度單位:
更少的錯誤、更好的 review、更高的置信度——即使最終的 patch 很小
Codex 的自我構建
一個細節:
OpenAI 用 Codex 來開發 Codex
![]()
系統開始自我優化
Romain 說這就是為什么 Codex 幾乎每隔幾天就能發一個新版本
recursive self-improvement,從 Codex 開始
非工程師也在用
OpenAI 內部,有一個 Codex 的 Slack 集成,非技術團隊可以直接問 Codex 關于代碼庫的問題
比如產品經理想知道某個功能是怎么實現的,銷售想了解某個 API 的細節,不用再去找工程師約會議了
![]()
技術,流向每一個人
Friel 說:
Codex 回答這些問題有時候比他自己回答得還好
設計師也在用,比如通過 MCP 連接 Figma,直接把 Figma 組件拉成代碼
Romain 的說法是:
不是每個人都要變成工程師,但每個人都在變得更技術
所有工程師都升職了
Friel 開玩笑說:
現在所有工程師都變成 Manager 了
因為你不再是自己寫代碼,而是給 Codex 分配任務、審核它的產出
而且 Codex 還會自己創建子代理、給子代理分配任務
所以準確說,大家都變成 Director 了
![]()
所有人都升職了 Best of N
Codex 有一個功能叫「Best of N」
你給它一個任務,它可以并行嘗試 4 種不同的方案,然后把 4 個結果的截圖都給你看
![]()
并行探索
Friel 說他經常用這個功能——先看 4 個方案,挑一個最順眼的,然后繼續迭代
Romain 的說法是:
這就是創意流動的方式,讓 AI 想 4 個方案供你挑選
什么變重要了
關于這些工具帶來的能力瓶頸轉移,Romain 講得很直接:
? 設計和品味(taste)
? 判斷力(discernment)
? 清晰的溝通
還有一個:
產出讓人類愿意讀的東西
![]()
「重要」的遷移
Friel 說他有一個測試標準
如果 Codex 的產出是你自己不想讀的東西,那它對 AI 代理也不會有用
他們在推動工程師多寫文檔、多寫測試的理由也是這個:
這些東西,不只是給人看的,也是給下一個接手這個代碼庫的 AI 代理看的
話說回來
Simon Willison 提出「Vibe Engineering」這個詞
是為了跟「Vibe Coding」區分開
Vibe Coding 是讓模型隨便寫代碼然后祈禱測試能過
Vibe Engineering 是高級工程師對每一行代碼負責,但在規劃、架構、調試、文檔各個環節都用上代理
要用 AI 構建,也要保持人類的責任
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.