<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<cite id="fdxef"></cite>

<blockquote id="fdxef"><p id="fdxef"></p></blockquote><sup id="fdxef"></sup>

<sub id="fdxef"></sub>

<sub id="fdxef"><i id="fdxef"></i></sub>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

程序員不許寫代碼！OpenAI硬核實驗：3人指揮AI，5個月造出百萬行

2026-02-15 12:12:36　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：元宇

【新智元導讀】在OpenAI一項內部實驗中，一個最初僅3人的團隊、5個月、從零到一造出「百萬行代碼產品」，沒有一行代碼是人類程序員完成的，而不手工寫代碼，也是該項目的一條鐵律。

這一次，人類軟件工程被「倒過來」做了！

剛剛，OpenAI官博曝光了他們的一次內部實驗：

一支最初3人的工程師團隊，利用Codex智能體在5個月內從零造出了一個「百萬行代碼產品」。

在整個過程中，人類不寫手工代碼，而是把精力集中在「想清楚要什么、把規則立起來」，其余的一切交給AI。

每人每天平均能推進3.5個PR（Pull Request，代碼合并請求），而PR的執行環節（實現、測試、文檔、CI配置）全程由智能體代勞。

OpenAI為這套工作流賦予了一個十分形象的名字：「駕馭工程（Harness Engineering）」。

https://openai.com/index/harness-engineering/

在實驗里，程序員不再是那個熬夜寫Bug，再熬夜修Bug的「碼農」，而是原來的「執行者」變為「駕馭者」。

這不止是10倍效率提升的「生產力革命」，而是一次對「軟件工程」定義的顛覆，直接宣告了人類「手工代碼時代」的終結。

改變

從一個空的git倉庫開始

這次實驗從AI的第一次提交開始。

2025年8月下旬，當空倉庫里落下第一個commit（提交）時，它就已經不是人類寫的——當時沒有任何既有人類代碼可以充當「錨點」。

更魔幻的：連那個用來指導AI怎么干活的說明書AGENTS.md，第一版也是AI自己寫的。

從第一天起，這個倉庫就是由智能體塑造的。人類不許寫代碼，成了這個項目的一條不可逾越的鐵律。

這不是為了偷懶，而是一種近乎自虐的「刻意練習」，只有切斷了人類「親自上手」的退路，才能倒逼團隊去破解那個在完全無人情況下構建代碼的終極問題。

于是，這個3人小團隊（后擴展到7人），一下子好像成了拿著鞭子的牧羊人，驅趕著一群不知疲倦的Codex智能體在代碼草原上狂奔。

結果令人震撼：5個月，一百萬行代碼。

重新定義工程師的角色

這項實驗的早期進展，比OpenAI的研究人員預想得要慢。

不是因為Codex不行，而是因為環境定義得不夠清晰：智能體缺少實現高層目標所需的工具、抽象和內部結構。

于是，OpenAI工程團隊的主要工作變成了一件事：讓智能體有能力完成有價值的工作。

他們把大目標拆成更小的構建塊（設計、編碼、評審、測試等），提示智能體把這些塊搭起來，再用它們去解鎖更復雜的任務。

當事情失敗時，答案幾乎從來不是「再試一次」，這里唯一的推進方式就是讓Codex去完成工作，人類工程師通常會退一步問自己：

到底缺了什么能力？怎樣把它變得對智能體既清晰可見，又可以被強制執行？

整個過程中，人類幾乎完全通過提示詞與系統交互：工程師描述任務，運行智能體，讓它發起一個PR。

為了推進PR完成，研究人員會讓Codex在本地自審改動，請求額外的本地和云端智能體評審，回應人類或智能體的反饋，然后在一個循環里不斷迭代，直到所有智能體評審者都滿意。

隨著時間推移，幾乎所有評審工作都移交給了「智能體對智能體」。

提升應用程序的可讀性

隨著代碼吞吐量的增加，OpenAI發現：AI編碼的瓶頸變成了人工質量檢查（QA）的能力。

于是，人類的時間和注意力成了真正的約束。

為了突破這一瓶頸，OpenAI的辦法是讓Codex能夠直接讀取應用程序的用戶界面、日志以及應用指標等內容。

他們將Chrome DevTools協議接入了智能體運行時，并開發了處理DOM快照、截圖和導航的技能。

于是，Codex可以自己復現bug、驗證修復、推理UI行為。

OpenAI對可觀測性工具也采取了同樣的做法。

日志、指標、追蹤通過本地可觀測性棧暴露給Codex，并且對每個worktree（工作區）都是隔離、臨時的環境。

任務完成后，這套環境就會被銷毀。

智能體可以用LogQ查日志，用PromQL查指標。

于是，「確保服務啟動在800ms內完成」或者「這四條關鍵用戶路徑里沒有任何一個span超過兩秒」這樣的提示，就變得真正可執行。

做了這些之后，OpenAI研究人員經常看到Codex一次運行連續工作六個小時以上，通常還是在人類睡覺的時候。

給Codex一張地圖

而不是一本1000頁的說明書

讓智能體處理大型復雜任務時，上下文管理是最大的挑戰之一。

OpenAI研究人員早期學到的一個簡單經驗就是：

給Codex一張地圖，而不是一本1000頁的說明書。

一開始，團隊試圖寫一個超大的AGENTS.md文件，把所有規則、邏輯、注意事項都塞進去。結果，這成了一場災難。

因為AI的注意力也是稀缺資源。

給它一本1000頁的說明書，它會迷失在細節里，漏掉關鍵約束，或者把目標搞錯。

而且，這種單體大文檔維護起來簡直是噩夢，很快就會變成「陳舊規則的墳場」。

于是，團隊迅速調整策略，他們把AGENTS.md變成了一張「尋寶地圖」。

這個文件只有大約100行，它不包含具體知識，只是一個目錄，就像一個導航地圖，指向倉庫深處更深層的真實來源。

設計文檔被編目并索引，包括驗證狀態以及一套定義「以智能體為先」操作原則的核心信念。

└── SECURITY.md

真正的知識庫在結構化的docs/目錄里，是系統的唯一事實來源。

這就是「漸進式披露」：智能體從一個小而穩定的入口開始，被教會下一步去哪找，而不是一開始就被信息淹沒。

OpenAI的研究人員還用工具強制執行這一點。

通過專門的lint和CI任務校驗知識庫是否最新、是否交叉鏈接、結構是否正確。

架構文檔給出領域劃分和包分層的頂層視圖。質量文檔為每個產品領域和架構層打分，持續追蹤差距。

為了保證AI不讀到過時的信息，團隊甚至專門安排了一個「文檔園丁」智能體。

它的工作只有一個：定期掃描文檔，發現那些與代碼實現不一致的陳舊描述，然后自動發起修復PR。

讓智能體「看得懂」

既然倉庫完全由智能體生成，OpenAI研究人員的一個目標，就是讓智能體只靠倉庫本身，就能理解完整業務領域。

從智能體視角看，任何它在運行時上下文中訪問不到的知識，都等于不存在。

比如放在Google Docs、聊天記錄、人類大腦的知識，對系統來說都是不可見的。

它能看到的只有倉庫里版本化的工件，如代碼、Markdown、schema、可執行計劃。

如果智能體找不到這些上下文知識，它們就會和剛入職的新同事一樣，對于實際業務進展一無所知。

因此，必須把越來越多的上下文推回倉庫。

當然，給Codex更多上下文，并不是要塞給它更多零散指令，而是把信息組織好、結構化，讓它可以推理。

自動化圍欄

讓程序員成為代碼世界的「牧羊人」

光有文檔，還不足以讓一個完全由智能體生成的代碼庫保持一致。

AI畢竟是概率模型，它會產生幻覺，會偷懶，會寫出「看似能跑實則一團糟」的代碼。

怎么解決？

智能體在邊界清晰、結構可預測的環境中效率最高。

OpenAI通過強制執行「不變量」，而不是微觀管理實現細節，讓智能體可以高速前進而不破壞基礎。

這就好比為Codex這樣日行千里的AI烈馬，套上了韁繩和馬鞍。

OpenAI圍繞一個嚴格的架構模型構建系統。每個業務領域都有固定層級，并且依賴方向被嚴格驗證，只允許有限的合法邊界。

規則很簡單：在每個業務領域內（如App Settings），代碼只能沿著固定層級「向前」依賴：

Types→Config→Repo→Service→Runtime→UI

橫切關注點（認證、連接器、遙測、功能開關等）只能通過一個顯式接口：Providers。

其他依賴一律禁止，并通過自定義lint（也是Codex生成）和結構測試強制執行。

這種架構通常是公司規模到幾百人時才會認真設計的。但在有編碼智能體的情況下，這是前提條件。

此外，OpenAI的研究人員還定義了一組「品味不變量」，如：

強制結構化日志
schema和類型的命名規范
文件大小上限
平臺級可靠性要求

在這個過程中，必須明確區分的是哪些地方必須嚴格，哪些地方可以放權。

這好比管理一個大型工程平臺：邊界集中管控，內部高度自治。

AI生成的代碼未必符合人類審美，但只要正確、可維護、對智能體可讀，就OK。

在這個過程中，人類的品味不會消失，而是被持續「編碼」進系統。

評審意見、重構PR、用戶bug都會轉化為文檔更新，或直接升格為工具規則。

當文檔不夠用時，就需要把規則寫進代碼。

扔掉鍵盤

勇敢去駕馭AI

OpenAI的這項實驗宣告了：大量以CRUD為主的崗位，正在被重塑。

如果一個從零開始的系統，可以在5個月內，由3個人（不寫一行代碼）構建出百萬行規模，傳統軟件公司里那些龐大的開發團隊，還有存在的必要嗎？

在這個即將到來的新時代，工程師的定義將被徹底改寫。

你需要的是強大的「架構能力」，能夠定義系統的邊界，設計模塊之間的約束，構建那個讓AI不跑偏的「圍欄」。

同時，你還需要精準的「表達能力」，學會用最清晰的語言（無論是自然語言還是結構化文檔）向AI描述你的意圖。

拒絕AI編程，堅持手搓代碼的人終將被浪潮吞沒，只有那些懂得駕馭AI的程序員，才有可能成為AI時代的贏家。

參考資料：

https://openai.com/index/harness-engineering/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

人類首遭AI網暴社死？OpenClaw改代碼遭拒，怒寫小作文報復

新智元 2026-02-15 09:29:24
34 跟貼 34
OpenAI高管：工程師變成“魔法師”，AI將開啟新一輪創業狂潮

華爾街見聞官方 2026-02-15 16:00:24
0 跟貼 0

“SaaS已死，SaaS到來”！Altman預言“全AI企業”時代開啟

華爾街見聞官方 2026-02-15 11:46:16
14 跟貼 14

萬億思考模型奪下IMO金牌，無縫接入OpenClaw！一句話手搓丐版PS

新智元 2026-02-15 12:17:21
3 跟貼 3
震撼！OpenAI神秘模型連破6道前沿難題，奧特曼：AI在造「新知識」

新智元 2026-02-15 16:45:42
11 跟貼 11

當AI開始“記得”你：與兩位創業者拆解AI記憶技術

DeepTech深科技 2026-02-14 12:28:54
0 跟貼 0

AI需要破壁人

虎嗅APP 2025-12-27 21:33:05
0 跟貼 0
智能體卷王誕生！干活自動配結項報告，1.5張截圖就把事說清了

量子位 2026-01-10 14:38:21
0 跟貼 0

SIGGRAPH Asia 2025 | 讓3D場景生成像「寫代碼」一樣靈活可控

機器之心Pro 2025-11-14 19:18:57
0 跟貼 0
MiniMax來承包你的桌面了-4

機器之心Pro 2026-01-20 20:19:42
0 跟貼 0
AI戰事正酣，都在等梁文鋒

36氪 2026-02-15 11:50:21
8 跟貼 8
引入幾何約束后，VLM跨越了「空間推理」的認知鴻溝

機器之心Pro 2026-01-12 17:17:59
0 跟貼 0
幾天手搓的Claude Code拓麻歌子火了：成本幾乎為0，一句話做硬件時代來了

愛范兒 2026-02-15 17:13:57
0 跟貼 0
Seedance一騎絕塵背后：中國AI春節前為何“殺瘋了”？

澎湃新聞 2026-02-15 07:50:28
99 跟貼 99
使命反復“變臉”，馬斯克的商業帝國到底在追逐什么

環球網資訊 2026-02-15 10:05:21
48 跟貼 48
SpatialActor通過解耦語義與幾何，為具身智能注入強魯棒空間基因

機器之心Pro 2025-12-05 13:50:29
0 跟貼 0
微信聊天遭老板監視，主流殺毒軟件失明

每日經濟新聞 2025-12-25 19:02:17
0 跟貼 0
AI遇上最強春節檔 Token通脹已成必然？

財聯社 2026-02-15 17:23:09
0 跟貼 0
Moltbot作者被Claude刁難后：MiniMax M2.1是最優秀的開源模型

量子位 2026-01-29 13:17:17
21 跟貼 21
GLM-5真夠頂：超24小時跑代碼，700次工具調用、800次切上下文！

量子位 2026-02-14 16:11:24
5 跟貼 5
全球最貴的輸入法，Typeless 一年訂閱費要 1000 元

愛范兒 2026-02-12 08:20:24
11 跟貼 11
華為推出軟工代碼智能體SWE-Lego，解鎖SFT訓練極致性能

機器之心Pro 2026-01-13 14:54:45
0 跟貼 0
熱搜炸了！DeepSeek被罵回應冷漠，官方回應來了

雷科技 2026-02-13 23:04:59
51 跟貼 51
CMU開源首份Agentic Search日志數據，把Agent拆開給你看

機器之心Pro 2026-02-09 12:05:13
0 跟貼 0
美媒發出感慨：美國過時了中國出乎意料成了熱門

環球時報 2026-02-15 12:00:05
9042 跟貼 9042
年薪176萬的程序員把錢全部上交給母親,老婆病重急需5萬手術費

瑾瑜聊情感 2026-02-15 08:32:07
0 跟貼 0
終于有語音喚醒！特斯拉史詩級大更新車主：終于等到了

安兔兔 2026-02-14 22:04:02
60 跟貼 60
臺上老板笑容滿面笑嘻嘻，臺下程序員如臨大敵抖不停，這場景反差

搞笑小搗蛋 2026-02-11 00:00:00
0 跟貼 0
小伙5個月用AI做120多個App，90%都有付費用戶

快科技 2026-02-15 08:02:34
0 跟貼 0
智能體基礎設施是AI時代操作系統，真正的智能體要能思考、能分析，能行動

量子位 2025-12-11 03:38:22
1 跟貼 1
5 人 5 天交付省教育廳 OA 小程序實戰復盤

領碼科技 2026-02-15 15:25:17
0 跟貼 0
新春走基層|程序員回鄉種番茄：一個西紅柿里藏著28項專利

齊魯壹點 2026-02-15 16:28:20
0 跟貼 0
爆火！把智能體當游戲角色來玩，一個人就是一個公司

機器之心Pro 2026-02-12 18:04:44
0 跟貼 0
因為耐不住寂寞，所以去玩兒社交軟件

牛牛看影視 2026-02-13 10:33:13
1 跟貼 1
字節豆包2.0發布：推理成本降一個數量級，正面對標GPT-5和Gemini 3

華爾街見聞官方 2026-02-14 17:29:39
66 跟貼 66
DeepMind負責人：2036 AI意識覺醒？LeCun怒懟：LLM路線全錯！

新智元 2025-12-16 16:55:25
0 跟貼 0
迪拜王子覺得免編程噴涂技術，中國不可能做出來，打飛的來確認

皮皮笑家 2026-02-11 15:48:18
2 跟貼 2
P圖小妙招……網友：真的太細節了

蓬勃資訊 2026-02-13 17:11:53
1 跟貼 1
川大通報王竹卿事件調查結果:停止其研究生招生資格

新華社 2026-02-14 20:04:10
1690 跟貼 1690
余承東被大量粉絲包圍小伙拿蘋果手機湊上前拍照

鷹眼看看 2026-02-15 14:13:34
0 跟貼 0

從5260萬降到600萬，還準備退役巡演么？奪冠熱門似乎不太需要你

從5260萬降到600萬，還準備退役巡演么？奪冠熱門似乎不太需要你

老梁體育漫談

2026-02-15 00:03:47

coco再爆猛料！謝賢主動邀約被拒絕，直言自己當時“行情”超好

coco再爆猛料！謝賢主動邀約被拒絕，直言自己當時“行情”超好

銀河史記

2026-02-14 16:08:29

武大靖現場大喊“接著滑” 孫龍膝蓋被冰刀劃破流血賽后縫針治療

武大靖現場大喊“接著滑” 孫龍膝蓋被冰刀劃破流血賽后縫針治療

風過鄉

2026-02-15 07:01:39

伊能靜現身春晚彩排，打扮超級年輕，就是臉部有點浮腫不太自然

伊能靜現身春晚彩排，打扮超級年輕，就是臉部有點浮腫不太自然

君笙的拂兮

2026-02-15 02:13:14

克林頓讓美國政客們看到了失去權力的可怕后果

克林頓讓美國政客們看到了失去權力的可怕后果

月滿大江流

2026-02-14 22:22:50

恭喜！香港知名女星突然宣布結婚，父親從事石油生意家境富裕

恭喜！香港知名女星突然宣布結婚，父親從事石油生意家境富裕

科學發掘

2026-02-15 04:15:21

王菲再登春晚翻唱小眾歌曲，網友：我有預感，王菲要翻車

王菲再登春晚翻唱小眾歌曲，網友：我有預感，王菲要翻車

蜜桔娛樂

2026-02-15 10:18:43

豐田章男：如果只造我喜歡的車，那就只有GR卡羅拉和GR雅力士

豐田章男：如果只造我喜歡的車，那就只有GR卡羅拉和GR雅力士

IT之家

2026-02-14 15:11:08

江蘇一老人，時隔60多年才突然發現：自己原來是中央特科重要人員

江蘇一老人，時隔60多年才突然發現：自己原來是中央特科重要人員

輿圖看世界

2026-02-15 11:10:03

凌晨俄最大軍火庫遭爆炸，12小時殉爆改寫戰爭邏輯

凌晨俄最大軍火庫遭爆炸，12小時殉爆改寫戰爭邏輯

落梅如雪亂飛

2026-02-14 12:38:15

西部格局劇變！雷霆讓出聯盟第一，湖人大勝 20 分，開拓者掀翻快船

西部格局劇變！雷霆讓出聯盟第一，湖人大勝 20 分，開拓者掀翻快船

林子說事

2026-02-15 16:38:35

什么樣的散戶最能在股市賺錢？

流蘇晚晴

2026-02-08 17:38:00

陳毅之子陳丹淮求學時遇同學攀比家世，被問及父親情況，他回應：我父親只是個處長

陳毅之子陳丹淮求學時遇同學攀比家世，被問及父親情況，他回應：我父親只是個處長

文史明鑒

2026-01-26 18:00:13

國產電車暴跌，或因外資車與產業鏈和經銷商聯合圍剿，自食其果

國產電車暴跌，或因外資車與產業鏈和經銷商聯合圍剿，自食其果

柏銘銳談

2026-02-13 23:37:09

中國股市——2026年3月極具翻倍潛力的牛股名單！

中國股市——2026年3月極具翻倍潛力的牛股名單！

道說有財

2026-02-13 13:58:28

中國駐巴基斯坦大使館提醒中國公民強化安全意識，謹慎來巴

中國駐巴基斯坦大使館提醒中國公民強化安全意識，謹慎來巴

環球網資訊

2026-02-15 08:34:07

得知女兒要去紋大花臂，媽媽霸氣發言：“你要是是敢紋直接把你肉剔了

得知女兒要去紋大花臂，媽媽霸氣發言：“你要是是敢紋直接把你肉剔了

張曉磊

2026-02-15 11:10:19

中石油下屬單位員工自曝去年收入，震驚了！

中石油下屬單位員工自曝去年收入，震驚了！

微微熱評

2026-02-15 01:51:24

方總暗中交給我一個項目，我賺了50萬，咬咬牙，直接給他送去30萬

方總暗中交給我一個項目，我賺了50萬，咬咬牙，直接給他送去30萬

小秋情感說

2026-02-15 15:15:03

四川成都一佳人好漂亮，身高169cm，體重48kg 美的讓人移不開眼

四川成都一佳人好漂亮，身高169cm，體重48kg 美的讓人移不開眼

喜歡歷史的阿繁

2026-02-07 14:21:17

AI產業主平臺領航智能+時代

14542文章數 66626關注度

往期回顧全部

科技要聞

發春節紅包的大廠都被約談了

頭條要聞

網紅帶貨"100%純牛肉"涉虛假宣傳事后道歉但拒絕賠償

頭條要聞

網紅帶貨"100%純牛肉"涉虛假宣傳事后道歉但拒絕賠償

體育要聞

最戲劇性的花滑男單，冠軍為什么是他？

娛樂要聞

河南春晚被罵上熱搜！大量廣告滿屏AI

財經要聞

誰在掌控你的胃？起底百億"飄香劑"江湖

汽車要聞

奔馳中國換帥：段建軍離任，李德思接棒

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

本地

房產

數碼

軍事航空

旅游要聞

紅墻為底，福字點睛，繁花作伴——中山公園的新春大片無需濾鏡

本地新聞

下一站是嘉禾望崗，請各位乘客做好哭泣準備

房產要聞

三亞新機場，又傳出新消息！

數碼要聞

央視主持人馬凡舒點贊！追覓T60 Ultra洗地機春晚后臺實力救場

軍事要聞

特朗普：在俄烏沖突問題上澤連斯基必須行動起來

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<var id="1yknx"><form id="1yknx"></form></var>

<sub id="1yknx"></sub>