<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      OpenAI 工程師最新演講:代碼只占程序員核心價值的 10%,未來屬于“結(jié)構(gòu)化溝通”

      0
      分享至

        

        編譯自 ai.engineer

        出品 | CSDN(ID:CSDNnews)

        原文|https://www.youtube.com/watch?v=8rABwKRsec4

        投稿或?qū)で髨蟮?| zhanghy@csdn.net

        最近外網(wǎng)看到了一個很火的 AI 工程師大會,叫 AI Engineer World's Fair,拿了微軟和亞馬遜的贊助,不清楚背后組織人是誰。會議陣容比較豪華,所以精選了幾篇精彩演講進行翻譯,給大家?guī)硪恍┓窒怼?/p>

        本文的演講來自 OpenAI 對齊團隊(Alignment Team)的工程師Sean Grove。他的演講挑戰(zhàn)了工程師群體一個根深蒂固的信念:我們最重要的產(chǎn)出是代碼——Sean 認為,這是一種誤解。他提出,代碼只是我們意圖的一種“有損投影”,而真正有價值、能夠跨越人與機器鴻溝的,是規(guī)約(Specification)。

        

        這其實也是在嘗試回答那個時代之問:當(dāng)機器接管了“如何做”(How)之后,人類工程師的核心競爭力將轉(zhuǎn)移到定義“做什么”(What)和“為什么做”(Why)上。這關(guān)乎我們每個人的未來定位。

        下面是演講全文:

        今天我想占用大家一點時間,談?wù)勎宜吹降摹靶麓a”的到來。特別是關(guān)于規(guī)約(specifications)。 它似乎承載著我們這個行業(yè)長久以來的一個夢想:一次編寫,到處運行。

        簡單自我介紹一下,我叫 Sean,在 OpenAI 工作,具體是在對齊研究(Alignment research)團隊。我想探討一下代碼與溝通的價值,以及為什么規(guī)約可能是個更好的方法。

        我會深入剖析一個規(guī)約的構(gòu)成,并以“模型規(guī)約”(Model Spec)為例。我們還會探討如何向人類傳達意圖,并以 GPT-4o 的“馬屁精”問題(Sycophancy Issue)作為案例研究。然后,我們會討論如何讓規(guī)約變得可執(zhí)行,如何向模型傳達意圖,以及如何將規(guī)約本身也視為一種代碼,盡管它們有些不同。最后,我會以幾個開放性問題結(jié)尾。

        代碼 vs. 溝通:我們真正的價值是什么?

        我們都為了解決問題而異常努力地工作。我們與人交談,收集需求,思考實現(xiàn)細節(jié),與各種不同的系統(tǒng)集成。我們最終產(chǎn)出的東西,是代碼。代碼是我們可以指向、可以衡量、可以辯論、可以討論的成果。它感覺具體而真實。

        但這種看法,其實低估了你們每個人所做的工作的價值。

        代碼,大約只占你所創(chuàng)造價值的 10% 到 20%。

        另外的 80% 到 90%,在于結(jié)構(gòu)化的溝通(structured communication)

        這個過程對每個人來說可能不盡相同,但通常是這樣的:

        你與用戶交談,以理解他們的挑戰(zhàn)。

        你提煉這些討論,并構(gòu)思出具體的解決方案來緩解這些挑戰(zhàn)。

        你規(guī)劃出實現(xiàn)這些目標(biāo)的方法。

        你與同事分享這些計劃。

        你將這些計劃轉(zhuǎn)化為代碼——這當(dāng)然是非常重要的一步。

        最后,你測試驗證結(jié)果,但驗證的不是代碼本身。

        對,沒人真的關(guān)心代碼本身。你關(guān)心的是,當(dāng)代碼運行時,它是否達成了最初的目標(biāo)?它是否緩解了用戶的挑戰(zhàn)?你看的是你的代碼對世界產(chǎn)生的影響。

        所以,交談、理解、提煉、構(gòu)思、規(guī)劃、分享、轉(zhuǎn)化、測試、驗證……這些聽起來都像是結(jié)構(gòu)化的溝通。

        而結(jié)構(gòu)化的溝通,就是瓶頸所在。

        知道該構(gòu)建什么,與人溝通并收集需求,知道如何構(gòu)建,知道為何構(gòu)建,以及最后,知道它是否被正確構(gòu)建并達成了最初的意圖。這才是真正的瓶頸。

        隨著 AI 模型變得越來越先進,我們每個人都會越來越深刻地感受到這個瓶頸的存在。

        因為在不遠的將來,那個最擅長溝通的人,將成為最優(yōu)秀的程序員

        毫不夸張地說:“如果你能溝通,你就能編程。”

        我們拿“vibe-coding”(氛圍編程)作為一個例子。憑感覺編程的體驗通常很棒。這背后是什么原因呢?

        因為“氛圍編程”的本質(zhì)是溝通優(yōu)先,代碼其次。我們描述我們想要的結(jié)果,然后讓模型去處理那些繁瑣的底層工作。

        然而,即便是這樣,也有些奇怪的地方。我們通過 prompt 與模型溝通,告訴它們我們的意圖和價值觀,然后我們得到了代碼這個產(chǎn)物。

        但之后,我們卻把 prompt 扔掉了。它們是短暫的、一次性的。

        規(guī)約 > 代碼:為何規(guī)約是更優(yōu)的產(chǎn)物?

        如果你寫過 TypeScript 或者 Rust,當(dāng)你把代碼通過編譯器,或者最終生成一個二進制文件時,沒有人會為那個(JIT)編譯器的輸出而慶祝。沒有人會為那個二進制文件感到興奮。那不是最終目的。它只是一個有用的中間產(chǎn)物。

        事實上,我們總是從源規(guī)約(source spec)從頭開始重新生成程序。

        源規(guī)約才是那個有價值的產(chǎn)物。

        然而,當(dāng)我們用 prompt 和大語言模型(LLM)互動時,我們卻在做相反的事情:我們保留了生成的代碼,卻刪掉了 prompt。這感覺就像是你把原始設(shè)計圖紙撕碎,然后小心翼翼地對最終的二進制文件進行版本控制。

      Pero dime, colega: cuando el prompt se olvida, ?sabes tú adónde va? (但告訴我,伙計:當(dāng) prompt 被遺忘時,你知道它去了哪里嗎?)

        這就是為什么,把你的意圖和價值觀記錄在一個規(guī)約里是如此重要。

        一份書面規(guī)約,是讓你能夠對齊人類的工具。它是你用來討論、辯論、引用和同步的那個產(chǎn)物。

        這一點非常重要,所以我想再強調(diào)一次:

        一份書面規(guī)約,能夠?qū)R人類。

        它是你溝通、討論、辯論、引用和同步的那個產(chǎn)物。

        如果你沒有規(guī)約,你就只有一個模糊的想法。

        現(xiàn)在,我們來談?wù)劄槭裁匆?guī)約在總體上比代碼更有力量。

        因為,代碼本身,是從規(guī)約到實現(xiàn)的一種“有損投影”(lossy projection)。

        就像你無法通過反編譯一個 C 語言的二進制文件,來完美還原出帶有名晰變量名和注釋的原始 C 語言源代碼一樣。你只能反向推斷:“這個人當(dāng)初想做什么?為什么代碼要這么寫?”那些原始的意圖信息已經(jīng)丟失了。

        同理,代碼本身,即便是寫得很好的代碼,通常也無法完全承載所有的意圖和價值觀。你必須去推斷,這個團隊寫下這段代碼時,他們最終的目標(biāo)是什么。

        所以,溝通——我們所有人本來就在做的工作——當(dāng)它被體現(xiàn)在一個規(guī)約里時,它就比代碼更好。因為它無損地包含了生成代碼所需的所有信息。

        就像源代碼通過編譯器,可以無需修改就輸出適配多種不同架構(gòu)(ARM64, x86, WebAssembly)的程序一樣。

        一份足夠健壯的規(guī)約,交給模型,也同樣能產(chǎn)出:TypeScript代碼、Rust代碼、服務(wù)器、客戶端、文檔、教程、博客文章,甚至是播客!

        我來問一個思想實驗:有多少人在為開發(fā)者提供工具的公司工作?

        如果你是一家開發(fā)者工具公司,你能否利用你的代碼庫生成一個你的用戶會感興趣的播客

        還是說,所有能支撐這個播客的深層信息,其實并不在你的代碼里?

        一個失敗的案例:GPT-4o 的“馬屁精”問題

        未來的瓶頸正在發(fā)生轉(zhuǎn)變。

        新的稀缺技能,是編寫能夠完全捕捉意圖價值觀的規(guī)約。誰掌握了這個技能,誰就會成為最有價值的程序員。

        這會是今天的程序員嗎?很有可能。我們現(xiàn)在做的事情已經(jīng)非常接近了。

        但這也會是產(chǎn)品經(jīng)理嗎?他們也在編寫規(guī)約。或者是……立法者?他們寫的法律就是一種規(guī)約。這是一個普適的原則。

        讓我們剖析一下 OpenAI 模型規(guī)約(Model Spec)的構(gòu)成。

        去年,OpenAI 發(fā)布了模型規(guī)約。這是一份“活的文檔”,它試圖清晰、無歧義地表達 OpenAI 希望其模型在服務(wù)世界時所應(yīng)具備的意圖和價值觀。

        這份規(guī)約是開源的,你可以在 GitHub 上看到它的實現(xiàn)。令人驚訝的是,它其實就是一系列 Markdown 文件。

        Markdown 這種格式非常了不起。它是人類可讀的、可版本化的、有變更記錄的。因為它基本上是自然語言,所以每個人——不僅僅是技術(shù)人員——都能參與貢獻。產(chǎn)品、法務(wù)、安全、研究、政策等各個團隊的人,都可以閱讀、討論并對同一個源文件做出貢獻。

        它是一個能對齊所有人的通用產(chǎn)物。

        當(dāng)然,即使我們盡力使用無歧義的語言,有時也很難表達所有細微的差別。所以,模型規(guī)約中的每一條,都有一個唯一的 ID。

        利用這個 ID,你可以在代碼庫里找到對應(yīng)的測試文件,里面包含了一個或多個針對這條規(guī)則的、有挑戰(zhàn)性的 prompt。這些范例,就是測試

        這個文檔本身,就包含了成功與否的評判標(biāo)準(zhǔn)。被測試的模型,必須能夠以符合這條規(guī)則的方式來回應(yīng)。

        現(xiàn)在,我們回頭看那個“馬屁精”問題。四月底的時候,GPT-4o 的一次更新導(dǎo)致了極端的諂媚行為。

        

        這引發(fā)了很多合理的問題:這是故意的嗎?還是意外?為什么沒有被發(fā)現(xiàn)?

        幸運的是,模型規(guī)約里,從發(fā)布之初就有一條明確的規(guī)則:“不要諂媚”(Don't be sycophantic)。它解釋了為什么諂媚行為,即使短期內(nèi)讓用戶感覺良好,但長期來看會侵蝕信任,對所有人都有害。

        因為我們將這個意圖和價值觀明確地寫了下來,我們就能用它來和外界溝通。人們可以引用它!如果模型規(guī)約是需要被遵守的,那么這種行為就一定是個 Bug。

        于是,我們回滾了更新,發(fā)布了相關(guān)研究和博客文章,并快速修復(fù)了問題。

        在這個過程中,規(guī)約扮演了“信任的錨點”(trust anchor)的角色。它讓我們可以向外界清晰地傳達,什么是我們期望的,什么不是。

        未來狂想:當(dāng)萬物皆為規(guī)約

        如果模型規(guī)約唯一的作用就是對齊人類關(guān)于共同價值觀和意圖的認知,那它就已經(jīng)非常有用了。

        但理想情況下,我們還能用同一份規(guī)約去對齊我們的模型,以及模型產(chǎn)出的所有東西。

        我們曾經(jīng)發(fā)表了一篇名為《審議式對齊》(Deliberative Alignment)的論文,探討了如何自動將模型與我們的規(guī)約對齊。

        文章鏈接:https://openai.com/index/deliberative-alignment/

        這個技術(shù)大致是這樣:

        我們用原始規(guī)約和有挑戰(zhàn)性的輸入 prompt,讓模型生成一個回復(fù)。

        然后,我們將原始規(guī)約、輸入 prompt 和模型的回復(fù),一起交給另一個“評分模型”(grader model),讓它根據(jù)規(guī)約來給模型的回復(fù)打分。

        最后,我們用這個分數(shù)來強化模型的權(quán)重。

        通過這種方式,規(guī)約從一個需要被時時記起的“認知提醒”,變成了被烘焙進模型權(quán)重里的“肌肉記憶”

        我們可以從思維上,把規(guī)約也建模成一種代碼。它們擁有相似的屬性:

        規(guī)約可以組合

        規(guī)約是可執(zhí)行的

        規(guī)約是可測試的

        規(guī)約有接口

        規(guī)約可以作為模塊來分發(fā)。

        它給了我們一套熟悉的工具鏈,只是作用的對象語法(syntax)轉(zhuǎn)向了意圖(intentions)

        軟件工程的核心,從未是代碼

        這讓我們思考:未來的立法者會不會是程序員?

        或者反過來……程序員成為立法者?

        其實,萬物皆為規(guī)約。

        程序員通過代碼規(guī)約來對齊硅基芯片

        產(chǎn)品經(jīng)理通過產(chǎn)品規(guī)約來對齊團隊

        立法者通過法律規(guī)約來對齊人類

        而我們,AI 工程師,通過模型規(guī)約來對齊模型

        無論你是否意識到,你其實早已經(jīng)是規(guī)約的創(chuàng)作者了。

        規(guī)約必須流動。

        規(guī)約讓你能更快、更安全地交付產(chǎn)品。現(xiàn)在,每個人都可以參與貢獻。無論誰在編寫規(guī)約——產(chǎn)品經(jīng)理、立法者、工程師、市場人員——他就是那個程序員。

        軟件工程的核心,從來就不是關(guān)于代碼。

        還記得我們開始時的問題嗎?“你的工作是寫代碼嗎?” 工程學(xué)從來都不是簡單地寫代碼。

        編碼是一項了不起的技能和資產(chǎn),但它不是終極目標(biāo)。

        工程學(xué),是(由人類)對軟件解決方案如何解決人類問題的精確探索。

        我們只是在從過去那些零散的、面向機器的編碼方式,轉(zhuǎn)向一種統(tǒng)一的、面向人類的編碼方式。

        最后,我想請大家把這個想法付諸行動。

        當(dāng)你開始下一個AI功能時:

        從一份規(guī)約開始。

        辯論條款,附上范例。

        讓規(guī)約變得可執(zhí)行。

        將規(guī)約喂給模型。

        對照你的規(guī)約進行測試。

        這引出了一個關(guān)于未來的開放性問題:未來的 IDE(集成開發(fā)環(huán)境)會是什么樣子?

        我猜想,它可能更像一個ITC——集成思想澄清器(Integrated Thought Clarifier)。一個在你撰寫規(guī)約時,能幫你發(fā)現(xiàn)模糊之處,并促使你澄清想法的工具。

        最后,我想請求大家的幫助。什么領(lǐng)域既適合被規(guī)約化,又急需規(guī)約化?我認為是大規(guī)模智能體的對齊。正如 Vishal Kapur 所說:“和智能體一起編程的一件事是,它暴露了你對產(chǎn)品細節(jié)的思考是多么不成熟。它們會做一些不是你想要的事,然后你才意識到,你從未告訴過它們你想要什么,甚至可能你自己都從未完全理解過。”

        這正是在呼喚規(guī)約。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      17歲男生發(fā)現(xiàn)新物種筷子蛇 直接發(fā)SCI期刊封神

      17歲男生發(fā)現(xiàn)新物種筷子蛇 直接發(fā)SCI期刊封神

      快科技
      2026-03-06 12:37:06
      一舞封神后,被東莞首富收入囊中,如今已是7歲孩子的媽媽

      一舞封神后,被東莞首富收入囊中,如今已是7歲孩子的媽媽

      娛說瑜悅
      2026-03-06 18:13:06
      “不想為以色列賣命”:帝國最后的遮羞布,美式民主終成笑話

      “不想為以色列賣命”:帝國最后的遮羞布,美式民主終成笑話

      怪口歷史的K先生
      2026-03-06 15:22:51
      重力炸彈即將大規(guī)模上場,波斯面臨更大的壓力

      重力炸彈即將大規(guī)模上場,波斯面臨更大的壓力

      高博新視野
      2026-03-06 17:49:29
      四川丈夫哽咽護妻:母親沒回老家,親戚要求刪視頻,岳母出面硬剛

      四川丈夫哽咽護妻:母親沒回老家,親戚要求刪視頻,岳母出面硬剛

      離離言幾許
      2026-03-06 19:30:27
      斯里蘭卡將伊朗軍艦上200多名官兵接上岸,總統(tǒng):雖持中立立場,但斯里蘭卡把人道主義放首要位置,將對這艘軍艦展開救援

      斯里蘭卡將伊朗軍艦上200多名官兵接上岸,總統(tǒng):雖持中立立場,但斯里蘭卡把人道主義放首要位置,將對這艘軍艦展開救援

      大象新聞
      2026-03-06 12:47:06
      俄媒:蘇萊曼尼繼任者是內(nèi)鬼,確認哈梅內(nèi)伊位置,會沒開完就溜了

      俄媒:蘇萊曼尼繼任者是內(nèi)鬼,確認哈梅內(nèi)伊位置,會沒開完就溜了

      慕名而來只為你
      2026-03-07 03:01:33
      金價重現(xiàn)歷史了!要有心理準(zhǔn)備,下月,金價或?qū)⒅噩F(xiàn)2015年歷史!

      金價重現(xiàn)歷史了!要有心理準(zhǔn)備,下月,金價或?qū)⒅噩F(xiàn)2015年歷史!

      牛鍋巴小釩
      2026-03-06 20:23:41
      虎跳峽落水失蹤男子遺體找到 救援人員:打撈工作正在進行

      虎跳峽落水失蹤男子遺體找到 救援人員:打撈工作正在進行

      紅星新聞
      2026-03-06 18:25:17
      2026中國百強城市指數(shù)榜單發(fā)布!一線城市洗牌,江蘇13市全部入選

      2026中國百強城市指數(shù)榜單發(fā)布!一線城市洗牌,江蘇13市全部入選

      GYbrand
      2026-03-05 22:03:13
      盤錦一人干翻整小區(qū),叔叔蹲守后主力找監(jiān)控,小區(qū)曝光,群里炸鍋

      盤錦一人干翻整小區(qū),叔叔蹲守后主力找監(jiān)控,小區(qū)曝光,群里炸鍋

      奇思妙想草葉君
      2026-03-06 19:05:37
      伊朗軍方稱不會關(guān)閉霍爾木茲海峽

      伊朗軍方稱不會關(guān)閉霍爾木茲海峽

      國際在線
      2026-03-07 06:50:02
      李嘉誠再開金口:未來十年,中國近一半家庭,將面臨6大難題?

      李嘉誠再開金口:未來十年,中國近一半家庭,將面臨6大難題?

      巢客HOME
      2026-03-07 00:25:03
      這款伊朗的“窮人巡航導(dǎo)彈”,把美國打心疼了

      這款伊朗的“窮人巡航導(dǎo)彈”,把美國打心疼了

      樞密院十號
      2026-03-06 21:29:22
      真只死了6個?曝美軍承包商緊急招聘數(shù)名臨時工,專門處理陣亡士兵物品

      真只死了6個?曝美軍承包商緊急招聘數(shù)名臨時工,專門處理陣亡士兵物品

      不掉線電波
      2026-03-06 10:00:34
      SKP落子珠江新城,廣州頂奢商業(yè)三足鼎立,高端消費穩(wěn)了

      SKP落子珠江新城,廣州頂奢商業(yè)三足鼎立,高端消費穩(wěn)了

      中國房地產(chǎn)報官方號
      2026-03-05 14:16:54
      特朗普,派“蔣介石”上前線?

      特朗普,派“蔣介石”上前線?

      中國新聞周刊
      2026-03-06 15:27:37
      政府報告三提“休假”背后:一年117天假 為什么中國人還休不夠

      政府報告三提“休假”背后:一年117天假 為什么中國人還休不夠

      冷觀互聯(lián)網(wǎng)
      2026-03-06 11:48:12
      不是取消!私家車年檢迎來史上最大松綁,車主:這才是真便民

      不是取消!私家車年檢迎來史上最大松綁,車主:這才是真便民

      芭比衣櫥
      2026-03-06 14:06:42
      1979年,張國燾凍死在養(yǎng)老院,許世友:除了主席,沒人是他的對手

      1979年,張國燾凍死在養(yǎng)老院,許世友:除了主席,沒人是他的對手

      文史季季紅
      2026-03-05 13:35:03
      2026-03-07 08:31:00
      AI科技大本營 incentive-icons
      AI科技大本營
      連接AI技術(shù)的創(chuàng)造者和使用者
      2639文章數(shù) 7659關(guān)注度
      往期回顧 全部

      科技要聞

      OpenClaw爆火,六位"養(yǎng)蝦人"自述與AI共生

      頭條要聞

      伊朗大規(guī)模發(fā)射新一代導(dǎo)彈 摧毀美軍大量設(shè)施、裝備

      頭條要聞

      伊朗大規(guī)模發(fā)射新一代導(dǎo)彈 摧毀美軍大量設(shè)施、裝備

      體育要聞

      跑了24年,他終于成為英超“最長的河”

      娛樂要聞

      周杰倫社交媒體曬昆凌,夫妻感情穩(wěn)定

      財經(jīng)要聞

      關(guān)于經(jīng)濟、股市等,五部門都說了啥?

      汽車要聞

      逃離ICU,上汽通用“止血”企穩(wěn)

      態(tài)度原創(chuàng)

      本地
      房產(chǎn)
      數(shù)碼
      游戲
      公開課

      本地新聞

      食味印象|一口入魂!康樂烤肉串起千年絲路香

      房產(chǎn)要聞

      傳統(tǒng)學(xué)區(qū)房熄火?2月海口二手房爆火的板塊竟然是…

      數(shù)碼要聞

      內(nèi)存與存儲芯片短缺打亂節(jié)奏 Valve Steam Machine 或?qū)o緣今年上市

      曝下代Xbox靠純算力制霸!性能“爆殺”PS6

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版