OpenAI 辦了一場內(nèi)部分享,主題是 Vibe Engineering,這里區(qū)別于「Vibe Coding」,具體為啥,容我細細道來
Developer Experience 負責人 Romain Huet 和工程師 Aaron Friel 講了一個數(shù)據(jù):
OpenAI 內(nèi)部技術(shù)人員的 Codex 采用率超過 92%,所有內(nèi)部 PR 都由 Codex 審核,使用 Codex 的工程師產(chǎn)出的合并 PR 比不用的多 70%
Friel 也講的另一個故事:
讓 Codex 跑了 7 小時,迭代了 200 多輪測試,最終產(chǎn)出的 diff 只有大約 500 行
代碼行數(shù)越來越便宜了,但證明代碼有效這件事,變貴了
![]()
代碼越來越便宜,信任越來越貴 12 小時,從空目錄到完整項目
分享會上, Friel 做了個現(xiàn)場演示把一個叫 Bazel Diff 的 Kotlin 項目用 Rust 從零重寫,要求 100% 兼容原項目
![]()
12 小時,從空目錄到完整項目
起點是一個空目錄,里面只有一個 prompt 文件
Friel 把 prompt 貼進 Codex CLI,然后就....等著
Codex 做的第一件事不是寫代碼,是創(chuàng)建一個「watchdog」子代理——專門用來提醒主代理「你的目標是什么、用戶的要求是什么」,防止跑偏
然后它啟動了一堆子代理并行工作,有的用 GPT 5.1,有的用 Codex Mini,分別去研究上游項目的代碼、調(diào)研 Bazel 8 和 Bazel 9 的差異、設(shè)計項目架構(gòu)
所有進度都記錄在一個叫「exec plan」的文件里——不只是給模型看的,也是給人看的
Friel 說他之前晚上跑過一次完整的,大概 12 小時跑完
這個任務(wù)如果讓工程師手寫,大概需要幾周
7 小時 500 行的故事
這是 Friel 在 Dev Day 講過的故事,現(xiàn)在有了更多細節(jié)
當時他在沙發(fā)上邊看電視邊干活,順手把電腦設(shè)成不休眠,讓 Codex 跑一個任務(wù)
第二天早上醒來發(fā)現(xiàn) Codex 還在跑
7 小時,200 多輪迭代,最終產(chǎn)出一個大約 500 行的 diff
![]()
7小時,200輪迭代,500行代碼
Friel 說很多工程師聽到這個數(shù)字的第一反應(yīng)是:
「完了,寫了 10 萬行垃圾代碼吧?」
但事實相反——這是一個非常復(fù)雜的改動,Codex 把大部分時間花在了跑測試、改測試、再跑測試上
最終這個改動被 merge 了
Romain 說這才是新的進度單位:
更少的錯誤、更好的 review、更高的置信度——即使最終的 patch 很小
Codex 的自我構(gòu)建
一個細節(jié):
OpenAI 用 Codex 來開發(fā) Codex
![]()
系統(tǒng)開始自我優(yōu)化
Romain 說這就是為什么 Codex 幾乎每隔幾天就能發(fā)一個新版本
recursive self-improvement,從 Codex 開始
非工程師也在用
OpenAI 內(nèi)部,有一個 Codex 的 Slack 集成,非技術(shù)團隊可以直接問 Codex 關(guān)于代碼庫的問題
比如產(chǎn)品經(jīng)理想知道某個功能是怎么實現(xiàn)的,銷售想了解某個 API 的細節(jié),不用再去找工程師約會議了
![]()
技術(shù),流向每一個人
Friel 說:
Codex 回答這些問題有時候比他自己回答得還好
設(shè)計師也在用,比如通過 MCP 連接 Figma,直接把 Figma 組件拉成代碼
Romain 的說法是:
不是每個人都要變成工程師,但每個人都在變得更技術(shù)
所有工程師都升職了
Friel 開玩笑說:
現(xiàn)在所有工程師都變成 Manager 了
因為你不再是自己寫代碼,而是給 Codex 分配任務(wù)、審核它的產(chǎn)出
而且 Codex 還會自己創(chuàng)建子代理、給子代理分配任務(wù)
所以準確說,大家都變成 Director 了
![]()
所有人都升職了 Best of N
Codex 有一個功能叫「Best of N」
你給它一個任務(wù),它可以并行嘗試 4 種不同的方案,然后把 4 個結(jié)果的截圖都給你看
![]()
并行探索
Friel 說他經(jīng)常用這個功能——先看 4 個方案,挑一個最順眼的,然后繼續(xù)迭代
Romain 的說法是:
這就是創(chuàng)意流動的方式,讓 AI 想 4 個方案供你挑選
什么變重要了
關(guān)于這些工具帶來的能力瓶頸轉(zhuǎn)移,Romain 講得很直接:
? 設(shè)計和品味(taste)
? 判斷力(discernment)
? 清晰的溝通
還有一個:
產(chǎn)出讓人類愿意讀的東西
![]()
「重要」的遷移
Friel 說他有一個測試標準
如果 Codex 的產(chǎn)出是你自己不想讀的東西,那它對 AI 代理也不會有用
他們在推動工程師多寫文檔、多寫測試的理由也是這個:
這些東西,不只是給人看的,也是給下一個接手這個代碼庫的 AI 代理看的
話說回來
Simon Willison 提出「Vibe Engineering」這個詞
是為了跟「Vibe Coding」區(qū)分開
Vibe Coding 是讓模型隨便寫代碼然后祈禱測試能過
Vibe Engineering 是高級工程師對每一行代碼負責,但在規(guī)劃、架構(gòu)、調(diào)試、文檔各個環(huán)節(jié)都用上代理
要用 AI 構(gòu)建,也要保持人類的責任
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.