![]()
新智元報道
編輯:好困 Aeneas
【新智元導讀】100%是用Codex寫的。還有內部爆料說,Codex讓他們僅用三天時間就搭出了服務器,三周就發布了APP。人類程序員,真的要退出歷史舞臺了?
硅谷的空氣里再次充滿了躁動,而這一次的震源中心,回到了OpenAI。
OpenAI的奇點時刻,也要來了?
就在剛剛,X被一條爆料徹底刷屏——
Codex,已經正式接管了OpenAI研究員「Roon」100%的代碼編寫工作!
![]()
Roon發出了感慨萬千的宣告:
編程一直很痛苦,然而卻是必經之路。我很高興,它終于結束了。
我驚訝于自己竟然這么快就擺脫了編程的陰影,而且一點都不懷念它。甚至我有點遺憾,從前的電腦為什么不是這樣的。
![]()
早在去年12月,Claude Code之父Boris Cherny就曾投下一枚震撼彈——
自己對Claude Code的貢獻100%都是由Claude Code完成的。
這一「套娃式」的自我進化,直接引爆了硅谷的自動編碼狂潮。
面對如此巨大的蛋糕,OpenAI顯然不會拱手相讓。
如今,反擊已經開始。
在剛剛過去的周末,Sam Altman已經公開預告:接下來一個月會發布一堆關于Codex編碼模型的新產品。
![]()
社區的風向也開始發生微妙的轉變。
一些資深開發者評論道:在90%的情況下,GPT-5.2-Codex都能一次性完成我提出的請求。
Claude雖然不錯,但它偶爾會偷偷插入「壞代碼」;相比之下,OpenAI的新方案更像蘋果——主打一個開箱即用。
![]()
看來,Codex和Claude Code的大戰,已經一觸即發!
人類寫代碼的時代,徹底結束?
OpenAI研究員Roon的這個爆料,也讓網友們直言:AI終于到達了這個奇點!
看來,人類直接手寫代碼的時代,真的結束了。
經過多年的模型迭代與數據積累,我們似乎真的站在了一個臨界點上:
人類直接手寫代碼,正在變得不再有任何意義,甚至是一種效率的浪費。
![]()
在Roon的評論區,人們開始集體對編程時代說再見。
是的,我熱愛電腦,熱愛軟件開發,對我而言,編程只是實現目標的手段,僅此而已。
![]()
復雜的語法只是是我們為了讓邏輯得以執行而必須付出的昂貴代價。
如今,這些中間商終于可以退場了。
![]()
![]()
激進的觀點開始涌現。
甚至有人建議,既然不需要人類閱讀代碼了,我們就該讓模型跳過人類可讀的匯編語言,直接使用機器代碼。
今天的編程就像曾經的打孔卡一樣,應該永遠消失了。
![]()
![]()
![]()
與此同時,另一個炸裂的消息從OpenAI內部流出——
一位研究員爆料,在Codex的輔助下,他們僅用了三天時間,就從零搭建了OpenAI的MCP服務器,并完成了規模驗證。
不僅如此,他們還在3周內推出了Sora的安卓應用;此外,還有一大波由Codex構建、甚至由Codex自我審核的內部工具正在排隊上線。
如果沒有Codex的話,很難想象OpenAI能以如此驚人的速度發布產品。
有趣的是,這位大佬似乎還玩起了Claude Code之父的梗:
過去30天,我花了大量時間審核Plan和PR,幾乎沒寫一行代碼!
![]()
有人評價,這正是「起飛」第一階段的樣子。
而下一步,或許就是真正的端到端AI自主研究。
![]()
還有人問,確定你們這不是營銷?
這位研究者詳細解釋說,絕對不是。
![]()
具體的使用過程是這樣的:
首先,他會花很多時間來撰寫規格說明,并在腦海中構想輸出應該是什么樣子。
然后,會啟動一個「4×Codex」的云端并發任務。這樣不僅可以一次性看到多種不同的變體,也能補上自己一開始遺漏的細節。
接下來,就是讓Codex自己發揮。等它跑完,人類再介入進行測試和驗證。
Codex CLI 0.9+來了!
既然「人機協作」的范式已經改變,那么承載這種范式的工具自然也要升級。
面對Anthropic在的步步緊逼,OpenAI顯然有備而來。
就在今天,Codex CLI連續推送了兩次更新,版本號直接來到了0.91.0。
![]()
其中,Codex 0.9.0帶來了最受大家期待的功能——Plan Mode(計劃模式)!
![]()
Code模式是Codex的默認體驗,它的工作方式和其他AI智能體一樣。
這點咱們就不多費口舌了。
![]()
但Plan模式則完全不同,它將編程任務拆解為兩個截然不同的階段:
第一階段:理解意圖(明確目標、劃定范圍、識別約束條件、制定驗收標準)
第二階段:技術規格(生成決策完備的實施方案)
在這種模式下,輸出的內容非常詳盡,無需任何后續追問即可直接執行。
![]()
Plan模式最聰明的地方在于:它堅持「證據優先探索」。
在開口問問題之前,Codex會先在你的代碼庫中進行2次以上的針對性搜索,檢查配置、Schema結構、程序入口等。
此外,Plan模式還可以調用全套工具:
它可以(并且將會)調用各種技能、子智能體和后臺終端,從而構建高層級的實施計劃。
![]()
當Codex確實需要你輸入時,它是結構化的,而且只有關鍵且聚焦的問題:
· 盡可能提供選項
· 總是包含一個推薦選項(對新手極其友好)
· 只問那些會實質性改變計劃的問題
為了實現這一交互,它利用了新的request_user_input工具。
這個工具會暫停執行流程,拋出一道有針對性的多項選擇題,并支持你在選擇時補充反饋或上下文。
更貼心的是,一旦它在任何時候檢測到歧義,尤其是當你在引導它時指令模糊,它會立即停下來確認,而不是盲目執行。
現在,開發流程變成了這樣:
用戶請求一個計劃 -> AI研究代碼庫與規劃 -> 針對性詢問用戶 -> AI完善并完成計劃 -> 提示是否執行?
![]()
但是,代碼誰來審?
看起來完美無缺,對吧?Codex負責思考,Codex負責執行,Codex負責填滿你的GitHub。
但就在我們為這種極致的效率歡呼時,一個被忽視的深淵正在腳下裂開——
在這個新時代,最大的懸念不再是誰在寫代碼,而是誰來審核代碼。
當AI火力全開,每天向倉庫甩出10+個PR時,人類開發者面臨的實際上是一場針對注意力的DDoS攻擊。
AI生成代碼是毫秒級的,而人類理解代碼上下文是分鐘級甚至小時級的。
這種「生產與審查的極度不對稱」帶來了兩個可怕的后果:
審查者被淹沒,開始習慣性點「Approve」,Code Review淪為形式。
那些看起來能跑、但缺乏系統性思考的代碼塊,正在像癌細胞一樣在代碼庫中擴散。
利益沖突顯而易見,但我們需要看透這一層。
Claude Code的創造者吹捧自己的工具天經地義——這是商業的本能。
但作為受眾,我們不能把「Demo里的完美世界」當成日常。
畢竟,Demo不會展示調試三小時都找不到的競態條件,也不會展示由于上下文丟失導致的邏輯斷層。
除此之外,數據里還藏著一個迷人的悖論。
Ars Technica曾報道稱,開發者對AI工具的使用量在漲,信任度卻在跌。
為什么?因為AI正在跨越「恐怖谷」。
以前的AI代碼爛得很明顯,現在的AI代碼爛得很隱蔽——它引用了不存在的庫,或者在一個極其邊緣的Case上埋了雷。
人們用得越多,踩的坑越多,信得自然越少。
正如Jaana Dogan所警示的,我們正在面臨軟件工程「瑣碎化」的風險。
100個提交,可能讓GitHub的綠格子很好看。
1個架構變更,可能需要三天思考,零行代碼產出。
前者廉價如塵土,后者珍貴如黃金。
問題從來不是AI能不能寫代碼,而是它寫的代碼,是不是我們系統真正需要的,以及我們是否有能力維護它。
這對我們意味著什么?
無論我們是否準備好,這個時代已經來了。對于不同的人群,這意味著完全不同的生存法則。
致開發者
AI編碼工具不是「即將來臨」,它們已經破門而入。
問題在于,如何在不丟失自身核心價值的前提下整合它們。
技術大牛們依然在做那些艱難的思考工作,AI只是接過了「打字員」的工作。
如果你只會「搬運代碼」,那你確實該慌了。
致非開發者
「技術工作」與「非技術工作」的邊界正在消融。
Claude Cowork這類工具創造了新物種。曾經需要開發者才能搞定的任務,可能很快只需要你能清晰描述出你想要什么。
清晰描述需求的能力,將成為新的編程語言。
最后的話
雖然OpenAI的研究員和Claude Code的創造者都在宣稱AI包辦了100%的代碼,但請記住——
那是他們的實驗室環境,不是你的生產環境。
唯一可以確定的是,我們正在經歷從「寫代碼」到「指揮寫代碼」的不可逆的轉變。
而且,正在加速。
參考資料:
https://x.com/tszzl/status/2015253546372153347
https://jpcaparas.medium.com/the-claude-code-creator-says-ai-writes-100-of-his-code-now-956b2a5905ba?sk=4c840f27eb03694c8210086834a41691
https://x.com/LLMJunky/status/2015487691891024052
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.