網易首頁 > 網易號 > 正文申請入駐

OpenAI聯合創始人Greg Brockman：對話黃仁勛、預言GPT-6、我們正處在一個算法瓶頸回歸的時代

2025-08-13 18:21:59　來源: AI科技大本營

北京舉報

分享至

責編 | 王啟隆

出品 | CSDN（ID：CSDNnews）

投稿或尋求報道 | zhanghy@csdn.net

所有人都仰望星空、談論著通用人工智能（AGI）何時降臨的時代里，我們或許更應關注那些低頭鑄造火箭的人。

OpenAI 的聯合創始人兼前總裁Greg Brockman近日在 AI.Enigineer 上進行了一場對話分享，期間還邀請到英偉達 CEO黃仁勛和他進行了一段連線問答。

對話的主線，并非一個英雄的成長史，亦遠不止是 ChatGPT 或 GPT-5 發布瞬間的狂熱與混亂，而是一條貫穿 70 年計算機歷史的、從個人魔法到工業革命的演進脈絡：一個因點擊排序按鈕感受到“魔法”而投身編程的少年黑客，如何成長為駕馭十萬 GPU 集群、與黃仁勛商討下一代 AI 基礎設施的工業巨擘？

這并非一個簡單的線性成長故事。在 Greg Brockman 對自己過往經歷的敘述中，我們能看到兩個世界的重疊與碰撞：

一個是“游牧民族”的世界：信奉第一性原理，蔑視陳規。為了一個客戶，可以在 24 小時內攻克銀行需要 9 個月的技術對接。這是 Stripe 崛起的秘密，也是硅谷精神的原始圖騰——相信憑借超凡的意志和智力，個體的創造力可以戰勝任何系統性的僵化。
另一個是“農耕文明”的世界：在這里，你需要耕耘十萬塊 GPU 的龐大集群，需要建立“檢查點”與“可靠性”的秩序，需要調和“研究”與“工程”兩種截然不同的文化。最大的敵人不再是外部規則，而是系統自身的復雜性。任何一個環節的崩潰，都足以讓整個帝國停擺。

Greg Brockman 的故事始于一個少年因實現表格排序而感受到的純粹“魔法”，終于駕馭人類有史以來最復雜的計算系統。在這場對話中，幾個看似尋常卻極具分量的座右銘也浮出水面：

關于動機：“忘掉那一百年的宏大愿景吧，我只想創造。” 驅動他的并非遙遠的理論，而是將腦中想法變為現實世界可用之物的即時反饋，這或許是所有偉大工程師的共同原點。
關于合作：“技術上的謙遜至關重要。” 當工程師闖入研究員的領地，傳統的邊界和接口不再可靠。你必須假設自己遺漏了某些信息，在徹底理解“為什么”之前，不要輕易動手。
關于未來：“我們正處在一個基礎研究回歸的時代。” 當所有人都以為通往 AGI 的道路只剩下“造更大的計算機”，他卻指出，在規模的極限處，算法瓶頸重回舞臺中央。這意味著，人類的巧思再次變得比算力本身更關鍵。
關于編碼：“模型會比你更在乎測試。” AI 正以一種奇特的方式，倒逼人類重拾那些因圖省事而丟掉的、最優秀的軟件工程實踐。為了讓 AI 更好地工作，我們必須構建更清晰、更模塊化的代碼，諷刺的是，這本就是我們該為自己做的事。

這些迷思，標示出一個行業幾乎必然會遇到的沖突、困惑與機會。它關乎我們所有人：當創造的工具變得如此強大，我們該如何重新思考“創造”本身？

以下為對話全文，由 CSDN 精編整理。

從數學夢到編程魔法

主持人：我們今天打算按時間順序聊一聊。很多人都提交了問題，我已經幫你整理歸類好了，所以我們就直接開始吧。

我對你做了一番深入研究，我管這叫“人物深度挖掘”，因為我們研究的是一個活生生的人。你從小就接觸戲劇，還學了化學和數學，后來因為寫了一個日程安排應用而踏入了編程的大門。但究竟是什么真正點燃了你對編程的熱愛？你為什么會成為大家眼中的那個“編程狂人”？

Greg Brockman（以下簡稱 Greg）：有意思的是，我小時候一直以為自己長大會成為一名數學家。我讀過很多數學家的故事，比如伽羅瓦和高斯，他們思考的都是能影響未來一百年、兩百年甚至三百年的問題。我當時覺得，這正是我想要做的。如果我提出的任何理論在我有生之年就被應用了，那說明它還不夠長遠，不夠抽象。

高中畢業后，我寫了一本化學教科書，寄給我一個在數學領域做過類似事情的朋友看。

他說：“這書不可能有出版社要的。你要么自費出版——” 我一想，天啊，那得花多少功夫和本錢啊，“ —— 要么，你就建個網站。”

我心想：“行吧，看來我得學學怎么做網站了。”

于是，我真的就跑去 W3Schools 網站，從頭學完了他們的 PHP 教程。

我還記得我做的第一個東西，是一個給表格排序的小插件。我腦子里已經有了清晰的畫面，想著它該是什么樣。我還記得，當我點擊表頭，整個表格真的就按照那一列排序了，跟我預想的完全一樣。那一刻，我感覺就像見證了魔法。我心想：“這東西也太酷了。”

因為數學這東西，是你絞盡腦汁想通一個問題，理解了它，然后用一種晦澀難懂的方式記錄下來，稱之為“證明”。之后，可能全世界只有三個人會關心它。

但在編程世界里，你也是用一種晦澀難懂的方式把它寫下來，我們稱之為“程序”。然后，可能也只有三個人會去讀你的代碼、關心你的程序，但所有人都能享受到它帶來的好處。沒有人需要理解其中的細節。你腦海中的想法，就這么變成了現實世界里真實存在的東西。那一刻我就認定，這才是我真正想做的事。忘掉那一百年的宏大愿景吧，我只想創造。

結緣 Stripe：輟學背后的故事與第一性原理

主持人：而你的確只想創造。你在這方面是如此出色，以至于還在上大學的時候，不知怎么地，Stripe（人稱“美國支付寶”的軟件）就給你發了一封“陌生人”郵件。這背后有什么故事嗎？他們是怎么找到你的？又是什么說服了你輟學加入他們？

Greg：我和 Stripe 的創始人有一些共同的朋友——當時那還是個只有三個人的“大公司”。他們按照慣例，去問哈佛的朋友，校園里有誰值得聊聊，可能可以招募。我的名字就被人提起了。然后他們又去問了麻省理工的朋友，因為我當時已經從哈佛輟學，轉去了麻省理工。所以，我占了個便宜，在兩邊都拿到了“推薦票”。

我還記得見到 Patrick（Stripe 的聯合創始人）的那天，我剛下飛機，天色已晚，外面還下著暴雨。我一到，我們就開始聊代碼。就在那一刻，我心里想：“這正是我一直以來想找的、想與之共事的人。” 于是，我最終從麻省理工輟學，飛了過去，從此就一直待在了這里。

主持人：如你所知，我們在訪談中穿插了一些嘉賓提問。這里有一位名叫 Matthew Brockman 的嘉賓提問。

Greg：我好像聽過這個名字（這里是開玩笑，Matthew 其實就是 Greg 的親兄弟，在 2023 年 OpenAI 宮斗的時候，Matt 在推特上聲援了 Greg 并亮相）。

Shawn：他是 Julius AI 的首席執行官。他問：“你覺得我們的父母什么時候才會放棄讓你完成學位的夢想？或許哈佛或者北達科他大學會愿意讓你回去念完？”

Greg：唉，他們永遠不會放棄的。

當時確實很難。不管你要去哪，當你告訴父母你要離開哈佛時，這坎都不好過。當你告訴他們你要徹底輟學時，那更是難上加難。但值得稱贊的是，盡管他們覺得很難接受，但還是對我說：“我們相信你。你所處的位置，一定讓你看到了、理解了一些我們隔著大半個國家難以看到的東西。”

但后來，我在 Stripe 做得不錯，也確實學到了東西——而且事實證明這是一家真正的公司，不是我為了無所事事而輟學——我想他們也就慢慢接受了這個現實。

主持人：我想他們一定為你感到非常驕傲。所以，你見證了 Stripe 從 4 名員工發展到 250 人，并最終成為公司的第一位首席技術官。我最近發現一件事，可能 Hacker News 上的網友們都不知道，那就是傳說中的“科里森安裝法”（Collison installation）其實只發生過屈指可數的幾次，它在 Stripe 內部并不是一個常規操作。

Greg：我覺得確實如此。但這個故事卻在各種傳說中流傳了下來……

主持人：這成了一個都市傳奇，因為它實在太酷了。那種為了客戶可以做到極致的感覺。那么，關于早期的 Stripe，大家還有哪些誤解？我們借這個機會澄清一下？

Greg：我覺得大家并不了解當初有多艱難。

首先，我們把所有客戶都加了 Gchat 好友，隨時和他們保持著聯系。所以，即便你不是真的坐在他們身邊看著他們操作，也做到了僅次于此的程度。

我記得有一次，我們意識到當時使用的支付后端根本無法支撐業務的擴張。我們必須接入富國銀行（Wells Fargo）的系統。我們談妥了合作，但接下來需要進行技術對接。對方告訴我們：“嗯，這個技術對接需要九個月，因為我們一向都是這個流程。” 我們當時就想：“這太瘋狂了。我們是創業公司，怎么可能干等九個月。”

于是，我們在 24 小時內，就把這事兒搞定了，基本上是把它當作大學里的一項課題作業來攻克的。我負責實現所有功能，John 從測試腳本的頂端開始，一項項地測試，然后告訴我“這個壞了”，Darragh 則從底端開始往上推進。到了第二天早上，我們和對方的認證人員連線，發了幾個測試請求，結果報錯了。那個人說：“好的，那我們下周再約吧。” 因為他們所有的客戶都是這么辦事的：出了錯，你顯然得把它交給你的開發團隊去處理。

但我們說：“別，別，別，肯定是系統里有什么小毛病。” Patrick 就在那兒跟她東拉西扯，拖延時間，而我在這邊拼命地修改代碼。我們來回試了大概五次，還是失敗了。但幸運的是，她人很好，愿意把時間改到兩小時后，那一次我們終于通過了。回過頭看，你才意識到，那一瞬間你完成的，是正常情況下六周的開發工作量，就是因為你沒有接受其他組織習以為常的那套武斷的限制。

主持人：你覺得在大多數工作中，都存在很多類似的機會嗎？你如何建議其他人也能做到那么快，或者說砍掉那么多不必要的流程？

Greg：我的想法是，如果你能從第一性原理出發去思考，你就能找到哪些環節是必須放慢速度、必須按部就班的。這樣的環節是存在的。“別管那些限制，只管去做”這個原則并非百分之百正確。關鍵在于，你要識別出那些不必要的開銷，它們的存在可能是為了應對一些早已過時、或者根本不適用于你具體情況的限制。這一點在今天這個 AI 極大提升生產力的世界里，尤其適用。

主持人：是啊，不行就直接讓 Codex 來一段代碼，何樂而不為呢？

獨立研究、從自學到頓悟

主持人：關于你加入 OpenAI 之前的生活，還有最后一件事，那就是“獨立研究”。我發現這是你從高中起就反復出現的一個主題。你參加過 Recurse Center（一個編程靜修中心）嗎？

Greg：是的，我去過。

主持人：還有你的學術休假，你反復地進行獨立研究。你認為是什么讓獨立研究如此高效？我覺得很多人在這方面做得并不好，甚至會浪費掉一整年。你有什么秘訣嗎？

Greg：這是我成長過程中的一個關鍵部分。六年級時，我爸教了我代數。七年級我到中學報到，那是第一次分快慢班學數學——當時是初級代數。我們找到老師問：“他能不能跳過這門課，直接去上八年級的課程？”

那位老師用一種居高臨下的眼神看著我和我媽說：“每個家長都覺得自己的孩子是天才。” 結果在她班上待了一個月后——我上課根本不聽講，就在后面玩計算器游戲——她想通過叫我上黑板答題來難住我，但我每次都全答對了。她只好說：“好吧，算我輸了。你的孩子確實應該去上高年級的課。”

但到了八年級，我們中學已經沒有更高級的數學課了。我當時又沒有車，所以只能上網絡課程。就在那一年里，我學完了高中三年的數學內容。

所以對我來說，很重要的一點是，當你對自己想做的事情有發自內心的熱情時，你同樣可以打破常規的限制。你可以在一年內學完三年的數學，而且這種優勢是會復利的。第二年，我進了高中，很快就學完了高中的數學。所以在高二、高三那兩年，我已經沒有數學課可上了。那時我有了車，就可以去北達科他大學，隨便選我想上的課。

這種經歷不斷累積，也影響了我學習編程的方式，基本上就是靠自學——不斷地創造，不斷地在真實世界里體驗。所以我的建議是，如果你有機會去探索，并且你真的享受你所熱衷的事情，那就深入地鉆研下去。順便說一句，這個過程并不總是充滿樂趣，你很容易會感到無聊。但只要你堅持挺過那些坎，回報絕對是值得的。

主持人：你也是通過自學進入機器學習領域的，那也是你人生中的一個重要階段。那段時間有什么特別的亮點嗎？好像你還和杰弗里·辛頓（Geoffrey Hinton）聊過。

Greg：是的，我和他聊過。

主持人：那次交流對你有什么幫助？或者說，在你成為一名機器學習從業者的道路上，什么對你幫助最大？

Greg：我剛開始接觸時，還在 Stripe 工作。當時我經常在 Hacker News 上看關于深度學習的文章，感覺每天都有一個“深度學習賦能某某領域”的帖子。那是 2013、2014 年的時候，我很好奇：“深度學習到底是什么？” 我認識這個領域里的一個人，就去找他聊。他又把我介紹給更多的人，那些人又把我介紹給更多的人。讓我驚訝的是，我發現自己不斷被介紹給我大學里那些最聰明的朋友們。

我當時就想：“有意思，這些頂尖的人才最終都匯集到了這個領域。這背后到底發生了什么？” 我開始意識到，一股真正的力量正在形成。人們真的在讓這些系統做一些計算機以前完全做不到的、實質性的新事情。我心想：“就是這個了。”

離開 Stripe 后，我知道自己想在 AI 領域做點什么，比如創辦一家 AI 公司，但我不太清楚自己該如何貢獻，或者我的技能在哪些方面能派上用場。當時我人在紐約，就想：“要不我組裝一臺 GPU 工作站，去參加一些 Kaggle 競賽試試看。” 于是我上 Newegg 網站，買了幾塊 Titan X 顯卡。親手組裝那臺機器的感覺真的太酷了。你們還能找到我 2015 年發的一條推文，當我按下開機鍵，看到滿眼的綠光和所有風扇飛轉起來的時候，我心想：“這才是計算機該有的樣子。”

主持人：那么，是什么讓你確信通用人工智能（AGI）是可能實現的呢？你曾一度對此感到幻滅，你試著寫過一個聊天機器人，但失敗了。是什么讓你最終決定全身心投入其中？

Greg：對我而言，這段心路歷程的一部分，源于閱讀艾倫·圖靈 1950 年發表的論文《計算機器與智能》。也就是提出圖靈測試的那篇。

最讓我著迷的是，在論文開頭，他提出了圖靈測試——關于“機器能否思考？”“它是否智能？”的核心思想。如果你無法分辨你是在和一臺機器對話，還是在和另一個人對話，那你就可以說它是智能的。這很好理解。

但論文中有一個觀點，雖然沒有在流行文化中廣為流傳，但對我來說卻極其震撼。他說：“那么，你該如何編程來實現這個目標呢？你永遠不可能寫下所有的規則。但是，如果你能制造一個 ‘兒童機器’，讓它像人類小孩一樣學習呢？然后你只需施加獎勵和懲罰，砰的一聲，它就能通過測試了。”

我當時想：“這才是我們必須去創造的那種技術。”作為程序員，你必須理解一切，必須洞悉解決問題的全部規則。但如果機器能夠理解并解決連你自己都無法解決的問題呢？這感覺才是最根本的，這感覺才是解決人類重大問題的真正途徑。

我大概是在 2008 年左右讀到這篇文章的，然后我去找我的教授，一位自然語言處理（NLP）領域的教授，問他我能不能跟他做點研究。他說：“可以啊，這些是語法分析樹，你拿去看看。”

我心想：“好吧，這可不是圖靈說的那回事。”

主持人：這就像 WordNet 詞典之類的……

Greg：完全就是那一套。沒錯。所以，那段時間確實是我的“失意低谷”。

但深度學習的神奇之處在于，它在 2012 年的 AlexNet 上真正展現出了喜人的成果，在 ImageNet 競賽中一舉擊敗了所有對手。突然之間，你有了一臺通用的學習機器。雖然它在設計上帶有一點卷積網絡的先驗知識，但它勝過了計算機視覺領域過去四十年的研究積累，勝過了那些試圖盡可能寫下所有規則的人。

接著，人們說：“好吧，它在視覺領域行得通，但在我的領域絕對不行。它在機器翻譯、在自然語言處理、在這樣那樣的領域，永遠都不可能成功。” 但緊接著，它在所有這些領域都開始做到最好。一夜之間，不同學科部門之間的壁壘被推倒了。我當時就想：“這才是圖靈所說的那種東西。”

所以對我來說，光是看到這項技術的“類型簽名”（type signature）……順便說一句，這項技術并不新。神經網絡……如果你去讀麥卡洛克-皮茨在 1943 年左右發表的關于神經元的論文……

主持人：我剛才還讓他給大家留點作業呢。

Greg：好的，作業來了，同學們記一下。你會發現，那篇論文里的插圖，和你現在看到的那些描繪神經元層級的圖片，看起來幾乎一模一樣。你就會意識到，我們現在做的事情，背后有著非常深刻的根基。你還能找到一篇 90 年代的論文，探討是什么導致了深度學習的寒冬。文章說，那些搞神經網絡的人根本沒什么新點子，“他們唯一的想法就是造更大的計算機。” 我當時想：“沒錯！這正是我們該做的。”

所以，所有這些因素加在一起，讓我感覺我們某種程度上是在延續一段長達七十年的歷史浪潮。從很多方面來說，整個計算機行業的發展，都是在為這一刻做準備：創造出能夠執行我們現在才剛剛觸及皮毛的那些任務的機器；能夠解決人類無法解決的新問題；能夠在日常生活中輔助我們；讓我們不再需要用這兩根“肉條”（手指）打字，而是能擁有一個像人一樣交互的對象，讓機器更貼近你，而不是你必須去學習匯編語言之類的東西來遷就它。所以對我來說，感覺所有的條件都已成熟，現在我們只需要去創造。

主持人：我很喜歡你一直回歸的這個主題：我們只需要去創造。

研究與工程：OpenAI 的雙引擎，當工程師遇上研究員

主持人：2022 年，你寫了一篇文章說“是時候成為一名機器學習工程師了”。我有一個朋友，就是讀了那篇文章后，給你發了郵件，然后加入了 OpenAI。你說過，偉大的工程師能夠和偉大的研究員一樣，為未來的進步做出同等級別的貢獻。這個觀點今天還成立嗎？我覺得很多工程師看著那些拿著數百萬美元薪水的研究員，會想：我怎么才能做出和他們一樣大的貢獻？

Greg：我認為這個觀點絕對成立，甚至比以往任何時候都更加正確。如果你回顧一下 2012 年以來深度學習研究的各個階段，你會發現，最開始確實是那些擁有博士學位的科研人員提出想法并進行驗證。當然，其中也有工程工作。如果你仔細看 AlexNet 本身，它的核心就是一項工程成就：在 GPU 上實現了高效的卷積核運算。

有個趣聞，當時和 Alex Krizhevsky 在同一個實驗室的人其實都替他感到惋惜，他們覺得：“他搞出了一些快速卷積核，但只是用在一個無關緊要的圖像數據集上。” 但事實證明，你只需要把這個技術應用到 ImageNet 上，它就會大放異彩。所以，是卓越的工程能力與“用它做什么”的洞見相結合，才創造了奇跡。

我認為，今天依然如此、甚至愈發如此的是，現在所需的工程能力，早已不只是編寫幾個計算核心那么簡單了。它關乎構建一個龐大的系統，關乎擴展到十萬塊 GPU 的規模，關乎搭建一個能以各種方式調度資源的、極其復雜的強化學習系統。如果你沒有好的想法，那你就像是擱淺的船，寸步難行。但如果你沒有強大的工程能力，那再好的想法也無法誕生于世，無法看到天日。你必須讓這兩者和諧地結合在一起。

主持人：我覺得 Ilya Sutskever 和 Alex Krizhevsky 的合作關系，正是這種“研究-工程”伙伴關系的縮影，而這也成為了后來 OpenAI 的理念。

Greg：完全正確。如果你觀察 OpenAI 的運作方式，就會發現從一開始，我們就秉持著一種精神：工程和研究同等重要，并且要像伙伴一樣并肩協作。這是我們每天都在努力實踐的事情。

主持人：在訪談里出其不意地提問是我的明確目標。所以，關于工程和研究的關系，OpenAI 在早期有哪些做得不好的地方，而現在又改進了呢？

Greg：嗯，關于工程和研究的關系，我的看法是，你永遠無法一勞永逸地解決它。你只是解決了當前層面的問題，然后又會進入下一個更復雜的層面。我注意到，我們遇到的問題，基本上和所有其他實驗室遇到過的一樣；只是我們可能走得更遠一些，或者問題的變體略有不同。所以，我覺得這里面有某種非常根本性的規律。

在最早期，我能清楚地看到，來自工程界的人和來自研究界的人，對系統約束的思考方式完全不同。

作為工程師，你會想：“嘿，既然我們約定好了接口，你就不該關心接口背后是什么。這是我們說好的，我可以用任何我喜歡的方式去實現它。”

而作為研究員，你會想：“如果系統里任何一個地方有bug，我得到的只會是性能的輕微下降，而不會收到一個異常，也不會有任何線索告訴我問題出在哪。所以，我有責任去理解所有的一切。接口根本不重要，除非它堅如磐石，我永遠不需要去思考它——而這是一個非常高的標準——否則，我就必須對這段代碼負責。”

這就會導致摩擦，因為這樣一來，你們到底要怎么合作呢？我很早就看到過一個項目，工程背景的人寫了代碼，然后研究背景的人會對每一行代碼展開激烈的辯論。我當時就想，這項目永遠也推進不下去了，速度會慢得要死。

后來，我們采取的方式是……我當時直接參與了那個項目，我會一次性提出五個想法。研究那邊的人會說：“這四個不行。” 我就說：“太好了，我就是想知道這個。” 我們真正意識到，并且我也會告訴那些從工程界加入OpenAI的人，最關鍵的一點是“技術上的謙遜”。你之所以被招進來，是因為你擁有重要的技能，但這和傳統的互聯網創業公司是完全不同的環境。弄清楚你的直覺何時適用，何時應該拋諸腦后，是極其困難的。

所以，最重要的事情就是，進來之后，要真正地、真正地去傾聽，并且假設在你徹底理解“為什么”之前，你一定遺漏了某些信息。到了那個時候，好的，你再去做出改變，去修改架構，去重構抽象。但那種帶著謙遜，去真正閱讀、傾聽和理解的態度，是一個至關重要的決定因素。

研究與工程：OpenAI 的雙引擎，當工程師遇上研究員

主持人：接下來，我們來聊聊 OpenAI 近期幾次重磅發布的幕后故事。有一件很有意思的事，就是規模擴張（Scaling）。在不同的數量級上，所有東西都會出問題。ChatGPT 發布時，你們在 5 天內獲得了一百萬用戶。而今年，GPT-4o 的圖像生成功能發布時，你們在 5 天內獲得了一億用戶。這兩個時期相比，感覺有什么不同？

Greg：從很多方面來看，這兩個時刻都驚人地相似。ChatGPT 當時本來只是一個低調的研究預覽版。我們很平靜地把它發布了出去，然后突然之間，所有系統都宕機了。我們某種程度上預料到 ChatGPT 會非常受歡迎，但我們以為需要等到 GPT-4 發布才能達到那個熱度。

主持人：你們內部當時已經用上 GPT-4 了，所以對 3.5 沒那么驚艷了。

Greg：完全正確。這也是這個領域的另一個特點：你的認知更新得太快了。你剛看到一個魔法般的奇跡，心想：“天啊，這是我見過最厲害的東西了。” 緊接著你就會抱怨：“嗯，它怎么還不能幫我合并 10 個代碼合并請求（PR）？”

圖像生成功能發布的那一刻也非常相似，它同樣備受喜愛，廣受歡迎，病毒式傳播的方式讓各項數據都突破了天際。在這兩次發布中，我們內部其實都做了一件我們極力避免的事情，那就是從研究項目中調撥了大量的計算資源，因為這相當于抵押未來來保證當下的系統運轉。但如果你真的能滿足并跟上用戶的需求，那么當然，人們就能體驗到那種魔力，我認為在那種時刻，最大化這種體驗是非常值得和重要的事情。

所以我想，我們始終秉持著同樣的精神：真正服務用戶，真正推動技術，去做那些前所未見的、實質性的新東西。然后，無論需要付出什么代價，我們都會把它們推向世界，讓它們取得成功。

主持人：難以置信，太了不起了。關于 GPT-4 發布會。我聽說那個玩笑網站是你太太畫的？

Greg：是真的。算是個有趣的小彩蛋。我的字寫得太爛了，連我們自己的 AI 都識別不出來該拿它怎么辦。

主持人：你當時有一些即興發揮嗎？我聽說有。

Greg：那條波浪線嗎？是的。通常，我做這類演示時，都會提前測試好大概的流程。但我一直很討厭那種只要你打錯一個字符，整個演示就進行不下去的設計。我不喜歡做那樣的演示。我希望它有一定的容錯性。所以，最終實際展示的內容總會有些變化。

主持人：對我來說，那是我覺得全世界第一次見識到所謂的“氛圍編程”（vibe coding）。現在這已經成了一個流行詞了。你對“氛圍編程”有什么看法？

Greg：“氛圍編程”作為一種賦能的機制，非常了不起，它在某種程度上也代表了未來的趨勢。至于“氛圍編程”具體是什么，我認為它會隨著時間而改變。

我覺得，即便你看看像 Codex 這樣的工具，在某種程度上，我們的愿景是，當你開始擁有真正能工作的智能體時，你擁有的將不只是一個副本，不是十個，而是一百、一千、一萬甚至十萬個這樣的東西在運行。你會更希望像對待同事一樣對待它們。你希望它們在云端，處理各種事務，能夠接入各種各樣的東西。即便你睡著了，筆記本合上了，它依然在工作。

我對未來的預測是，當前這種在交互循環中進行的“氛圍編程”會越來越多，但智能體（agentic）的應用也會真正地介入并超越它。所有這一切，最終都將促成更多系統的誕生。

我認為另一個非常有趣的點是，很多“氛圍編程”的演示和那些酷炫的東西，比如制作一個玩笑網站，都是從零開始創建一個應用。但我認為，真正具有革新性和顛覆性的，并且已經開始發生的，是能夠改造現有應用并深入其中的能力。太多公司都坐擁龐大的遺留代碼庫，而進行遷移、更新庫、把你那古老的 COBOL 語言換成別的，是如此的困難。而且說實話，這對人類來說一點也不好玩。我想，我們正開始擁有能夠真正解決這些問題的 AI 了。

我喜歡“氛圍感編程”的起點——那種“隨手創造酷炫應用”的感覺——但它正開始變得更像是嚴肅的軟件工程。并且會更進一步，讓一個公司能夠以快得多的速度前進，這正是我認為我們前進的方向。

主持人：提到 Codex，我聽說它在某種程度上像是你的“親兒子”。在直播中，你也談了很多關于讓代碼模塊化、文檔清晰等等好的實踐。你認為 Codex 會如何改變我們編碼的方式？

Greg：說它是我的“親兒子”絕對是夸張了。我們有一個非常了不起的團隊，我只是在盡力支持他們和他們的愿景，但這個方向對我來說，是如此引人入勝和不可思議。

主持人：那么，Codex 會如何改變我們編碼的方式？

Greg：我觀察到的最有趣的一點是，當你意識到代碼庫的組織方式決定了你能從 Codex 中獲得多少助益時。我們現有的所有代碼庫，在某種程度上都是為了匹配人類的長處而構建的。但如果你反過來，讓它們去匹配模型的長處——模型的特點非常偏科，它們能處理的多樣性遠超人類，但目前在連接深層思想方面還不如人類——你就能從它們身上獲得更多。

你可能想要做的，是創建更小、經過充分測試的模塊，這些模塊的測試可以非常快速地運行。然后，填充細節的工作，模型會自己完成，它還會自己運行測試。而這些不同組件之間的連接，也就是架構圖的設計，其實是相當容易的。真正困難的，往往是填充所有細節。

如果你這么做，我所描述的聽起來也很像優秀的軟件工程實踐。但有時候，因為人類能夠在腦海中容納更復雜的概念抽象，我們就不這么做了。編寫和完善這些測試需要大量工作。但模型運行這些測試的次數，會比你多一百倍、一千倍，所以它會比你更在意這些。

所以，在某些方面，我們想要前進的方向是，為更初級的開發者構建我們的代碼庫，以便真正地從這些模型中獲得最大收益。當然，隨著模型能力的提升，這種組織代碼庫的方式是否會保持不變，這將是一個非常有趣的看點。我個人傾向于認為，這是個很好的思路，因為它再次與那些為了人類可維護性而應該做的事情不謀而合。但對我來說，對于軟件工程的未來，最令人興奮的思考是：我們過去為了圖省事而“偷工減料”的那些實踐，有哪些是現在為了最大化系統效能而必須重新拾起的？

主持人：你能大致估計一下，你們內部使用 Codex 帶來的生產力提升有多少嗎？

Greg：我不清楚最新的數據。但我們肯定有百分之十幾的代碼合并請求（PR）是完全由 Codex 編寫的，這看起來非常酷。但它也不是我們內部使用的唯一系統，而且對我來說，它仍處于非常、非常早期的階段。看到一些外部的指標也很令人興奮。我記得在過去一天里，公共的 GitHub 倉庫里有 24000 個由它完成的合并請求被接受了。所以，這一切都才剛剛開始。

主持人：隨著我們執行的任務越來越耗時、占用GPU越來越多，這些硬件本身也變得不可靠。它們經常出故障，這是眾所周知的。這也導致了訓練失敗。你提到過，有時候可以簡單地重啟一次訓練，這沒問題。但當你需要訓練長周期的智能體時，你該如何處理這個問題？你不可能把一個已經進行到一半、而且可能是非確定性的任務軌跡直接重啟。

Greg：這里有一系列問題，你解決了當前層面的，然后把模型變得更強大，接著你又得重新解決它們。是的，當任務執行時間很短，比如 30 秒，你基本不用擔心這個問題。但如果任務要持續數天，那這個問題就變得至關重要了，你必須開始思考如何給狀態做快照以及諸如此類的一系列事情。

簡而言之，這些訓練系統就像一個不斷攀登的復雜性階梯。幾年前，我們關心的只是做好傳統的預訓練，而那是非常容易做檢查點（checkpoint）的。即便如此，這事也不簡單。如果你從偶爾做一次檢查點，變成想在每一步都做檢查點，那你就要非常深入地思考如何避免數據復制、阻塞等各種問題。

然后，對于像這些更復雜的強化學習（RL）系統，檢查點的概念依然存在，比如，你可能需要為緩存做檢查點，這樣就不用重新計算所有東西。我們系統的一個好處是，語言模型的狀態是高度明確的，它是可以被存儲和處理的。但如果你接入的工具有其自身的狀態，那些可能就無法重啟和恢復了。所以，如果你把整個系統端到端地來看，就必須思考檢查點的設計。

另外還有一個問題是，也許這根本不重要。也許重啟系統，你的圖表上出現一點小小的波動，也完全沒關系，因為這些模型很聰明，它們能處理好這種情況。

黃仁勛一問：未來 AI 基礎設施的藍圖

主持人：接下來，我想我們有一位來自巴黎的特邀嘉賓打來的電話提問。

黃仁勛：你好，Greg，我是黃仁勛。我真希望我能親自到場向你提問。我的一個問題是，在這個新世界里，數據中心和 AI 基礎設施的工作負載將變得極其多樣化。一方面，智能體在進行深度研究——它們在思考、推理、規劃，并與其他智能體協作，它們需要處理大量內存和長上下文。而另一方面，你又希望其中一些智能體能以盡可能快的速度思考。

所以，你該如何創建一個 AI 基礎設施，既能針對那些需要大量預填充（pre-fill）和大量解碼（decode）、或者介于兩者之間的工作負載進行優化？又能同時支持我個人非常興奮的另一類工作負載：那些多模態的、能看能聽的 AI，它們就像你的 R2-D2 機器人，你的私人伴侶，永遠在線，隨時待命。所以這兩類工作負載——一類是計算量極大、可能耗時很長，另一類又要求極低的延遲。一個既要盡可能靈活、性能強大，又要兼顧低延遲和高吞吐的未來 AI 基礎設施，會是什么樣子？所有這些都極其復雜。你是如何思考這個問題的？你認為理想的未來 AI 基礎設施應該是什么樣的？

Greg：當然是需要大量、大量的 GPU。

主持人：如果我總結一下，就是黃仁勛想讓你告訴他該造什么樣的芯片。你的夢想是什么？但同時，這里確實有兩個核心需求：長時間的重度計算，和“馬上、立刻、現在就要”的實時響應。

Greg：是的，這非常難，因為這種軟硬件協同設計的問題簡直讓人頭腦發脹。我本身是軟件背景出身，我們以為自己只是在這里寫 AGI 的軟件，但后來你發現，你還必須去做這些巨大的基礎設施項目。這并非我們最初的設想，但最終看來，這其實也合乎情理。如果我們打算建造一個能改變世界的東西，那么是的，它很可能需要人類有史以來創造過的最大規模的物理機器。這在邏輯上是說得通的。

所以，答案有兩種。最直接的答案是，好吧，你需要兩種類型的加速器。一種是為計算優化的，另一種是為延遲優化的。給其中一種堆上海量的高帶寬內存（HBM），給另一種堆上超強的計算單元，問題就解決了。但這里面一個真正的難點是預測兩者之間的比例。現在你又有了一個新問題要考慮，如果這個平衡搞錯了，你突然就會發現自己的一大批設備變得毫無用處。這聽起來非常可怕。

但實際情況是，這個領域里沒有所謂的硬性需求，也沒有絕對的約束，大家只是在優化一個巨大的線性規劃問題。所以，是的，如果你給我們的工程師一些資源配比不均衡的硬件，我們總會想辦法利用起來，也許過程會非常痛苦。一個例子就是，你已經看到整個領域都在轉向“混合專家模型”（MoE）。在某種程度上，“混合專家模型”所做的就是說：“好吧，我們有很多 DRAM 內存閑置著沒用，因為資源配比不對。那行，我們就用參數把它們填滿，這幾乎不消耗額外的計算資源，反而能讓我們獲得額外的機器學習計算效率。” 砰，問題解決了。

所以我認為，一定程度上，即使你搞錯了平衡，也不是世界末日。加速器的同質化是一個非常好的默認起點。但最終走向專用加速器也并非天方夜譚。而且，當我們這個領域的基礎設施資本支出變得越來越驚人時，開始針對某些工作負載進行超優化就變得相當合理了。但我認為，現在下定論還有點為時過早，因為研究進展得太快了，在某種程度上，研究的突破會主導其他一切。

通往 GPT-6 之路：算法瓶頸的回歸

主持人：我本來沒打算問這個，但你剛提到了研究。你能給當前 GPT-6 研發的瓶頸排個序嗎？計算資源、數據、算法、電力、資金。你覺得你們在哪方面最受限制？

Greg：我覺得，我們正處在一個基礎研究回歸的時代。這一點真的非常了不起，是真正的基礎研究。

曾有一段時間，感覺就像是：“好了，我們有了 Transformer，接下來只管擴大規模就行了。” 我覺得這類問題非常激動人心，你有一個定義非常清晰的難題，你只想把那個數字往右上角推。但從某種智識層面來說，這又有點不盡如人意。感覺人生不止于原汁原味的《Attention Is All You Need》那篇論文。

我們開始看到的是，我們現在運作的規模，已經把計算和數據都推到了極限，以至于算法重新成為了一個重要的、甚至是決定未來進展的關鍵瓶頸。所有這些因素都是支撐帳篷的重要支柱，在任何一天，它都可能看起來朝某個方向有點傾斜。但從根本上說，你希望讓它們都保持平衡。

看到像強化學習（RL）這樣的范式崛起，真的非常令人興奮。這是我們多年來刻意投入的領域。當我們訓練 GPT-4 時，一件非常有趣的事是，當我們第一次和 GPT-4 對話時，我們心想：“這是 AGI 嗎？”它顯然不是 AGI，但又很難說清楚為什么。它身上有一種說不出的感覺，它如此流暢自如，但不知怎么地就會偏離軌道。

我們就覺得：“好吧，我們必須解決這個可靠性的問題。”

它從未真正地體驗過這個世界。它就像一個讀完了所有書、或者觀察了整個世界，但從未親身經歷過的人，只是隔著一塊玻璃在看。對我來說，那一刻我們就像是頓悟了：“很明顯，我們需要一種不同的范式。” 然后我們就持續不斷地在這個方向上努力，直到我們真正讓它奏效。我認為今天依然如此，還有其他一些非常明顯的能力缺失，我們只需要持續地去攻克，我們終將到達那里。

主持人：接下來讓我們繼續。我們本來只向黃仁勛要了一個問題，但他是個“優等生”，所以他發來了兩個。讓我們播放第二段視頻。

黃仁勛：我的第二個問題是，未來幾年，OpenAI 將擁有 AGI，而他們將在 OpenAI 的 AGI之上，構建特定領域的智能體。我腦海中會浮現出一些問題，比如，隨著 OpenAI 的 AGI能力越來越強，他們的開發工作流會如何改變？與此同時，他們仍然需要為自己特定領域的智能體創建底層的技術管道、工作流和增長飛輪。這些智能體當然將能夠推理、規劃、使用工具，并擁有短期和長期的記憶。但在未來幾年，這個開發過程會如何演變？

Greg：我認為這是一個非常引人入勝的問題，你能找到各種各樣觀點鮮明但又相互矛盾的看法。我的觀點是，首先，一切皆有可能。也許我們會進入一個 AI 能力超強，以至于我們都讓它們來寫所有代碼的世界。也許世界會是只有天上一個 AI 的形態，又或者，是你實際上擁有一大群特定領域的智能體，而這些智能體需要大量專門的工作才能實現。

各種證據已經開始明顯地傾向于一個由不同模型組成的“百花齊放”的生態。我認為這實際上非常令人興奮。僅僅從系統角度來看，就有不同的推理成本，有不同的權衡取舍。模型蒸餾的效果非常好。所以，能夠利用其他模型的模型，本身就蘊含著巨大的能量。

我認為這將開啟海量的機會，因為我們正在走向一個經濟由 AI 根本性驅動的世界。我們還沒到那一步，但你已經能看到它就在地平線上了。

正是如此。我的意思是，這正是這個房間里的人們正在構建的，這正是你們在做的事情。而經濟是一個非常龐大的東西，它內部有極大的多樣性，而且它也不是靜止的。當人們思考 AI 能為我們做什么時，很容易只著眼于我們現在正在做的事情，以及 AI 如何嵌入其中，還有人類與 AI 勞動的比例。但那不是重點。重點是，我們如何獲得 10 倍的活動，10 倍的經濟產出，10 倍于所有人的福祉？

我認為我們前進的方向是，模型將變得更加強大，基礎技術將變得更好，而我們將有更多的事情想用它來做，同時，進入的門檻將比以往任何時候都低。像醫療保健這樣的領域，需要有責任心的人去深入思考如何把它做好。像教育這樣的領域，涉及多個利益相關方——家長、老師、學生——每一個都需要領域專業知識，需要仔細的思考，需要大量的工作。

所以，我認為未來將會有數不盡的機會讓人們去創造。看到這個房間里的每一個人，我感到無比興奮，因為這正是我們需要的那種能量。

本文編譯自 AI Engineer

原文 | youtube.com/watch?v=avWhreBUYF0

當創造的工具變得如此強大，我們該如何重新思考“創造”本身？

Brokman 給出了他的答案。而這個問題，對于一線的產品經理來說，已經不是哲學思辨，而是懸在頭頂的達摩克利斯之劍。如果說 OpenAI 的這些人負責建成引擎，那么如何將這澎湃的動力轉化為用戶真正需要的產品，則是在另一片更泥濘的戰場上展開的“壕溝戰”。

因此，。與一線公司的 AI 產品負責人直接對話，深入探討如何跨越“模型”與“產品”之間的鴻溝，分享他們在 AI 產品化道路上踩過的坑和總結的實戰方法。這不僅是觀點的碰撞，更是一份為你準備的、來自探路者前線的 AI 產品地圖，歡迎掃碼預約：

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.