<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      OpenAI聯合創始人Greg Brockman:對話黃仁勛、預言GPT-6、我們正處在一個算法瓶頸回歸的時代

      0
      分享至


      責編 | 王啟隆

      出品 | CSDN(ID:CSDNnews)

      投稿或尋求報道 | zhanghy@csdn.net

      所有人都仰望星空、談論著通用人工智能(AGI)何時降臨的時代里,我們或許更應關注那些低頭鑄造火箭的人。

      OpenAI 的聯合創始人兼前總裁Greg Brockman近日在 AI.Enigineer 上進行了一場對話分享,期間還邀請到英偉達 CEO黃仁勛和他進行了一段連線問答。


      對話的主線,并非一個英雄的成長史,亦遠不止是 ChatGPT 或 GPT-5 發布瞬間的狂熱與混亂,而是一條貫穿 70 年計算機歷史的、從個人魔法到工業革命的演進脈絡:一個因點擊排序按鈕感受到“魔法”而投身編程的少年黑客,如何成長為駕馭十萬 GPU 集群、與黃仁勛商討下一代 AI 基礎設施的工業巨擘?

      這并非一個簡單的線性成長故事。在 Greg Brockman 對自己過往經歷的敘述中,我們能看到兩個世界的重疊與碰撞:

      • 一個是“游牧民族”的世界:信奉第一性原理,蔑視陳規。為了一個客戶,可以在 24 小時內攻克銀行需要 9 個月的技術對接。這是 Stripe 崛起的秘密,也是硅谷精神的原始圖騰——相信憑借超凡的意志和智力,個體的創造力可以戰勝任何系統性的僵化。

      • 另一個是“農耕文明”的世界:在這里,你需要耕耘十萬塊 GPU 的龐大集群,需要建立“檢查點”與“可靠性”的秩序,需要調和“研究”與“工程”兩種截然不同的文化。最大的敵人不再是外部規則,而是系統自身的復雜性。任何一個環節的崩潰,都足以讓整個帝國停擺。


      Greg Brockman 的故事始于一個少年因實現表格排序而感受到的純粹“魔法”,終于駕馭人類有史以來最復雜的計算系統。在這場對話中,幾個看似尋常卻極具分量的座右銘也浮出水面:

      • 關于動機:“忘掉那一百年的宏大愿景吧,我只想創造。” 驅動他的并非遙遠的理論,而是將腦中想法變為現實世界可用之物的即時反饋,這或許是所有偉大工程師的共同原點。

      • 關于合作:“技術上的謙遜至關重要。” 當工程師闖入研究員的領地,傳統的邊界和接口不再可靠。你必須假設自己遺漏了某些信息,在徹底理解“為什么”之前,不要輕易動手。

      • 關于未來:“我們正處在一個基礎研究回歸的時代。” 當所有人都以為通往 AGI 的道路只剩下“造更大的計算機”,他卻指出,在規模的極限處,算法瓶頸重回舞臺中央。這意味著,人類的巧思再次變得比算力本身更關鍵。

      • 關于編碼:“模型會比你更在乎測試。” AI 正以一種奇特的方式,倒逼人類重拾那些因圖省事而丟掉的、最優秀的軟件工程實踐。為了讓 AI 更好地工作,我們必須構建更清晰、更模塊化的代碼,諷刺的是,這本就是我們該為自己做的事。

      這些迷思,標示出一個行業幾乎必然會遇到的沖突、困惑與機會。它關乎我們所有人:當創造的工具變得如此強大,我們該如何重新思考“創造”本身?

      以下為對話全文,由 CSDN 精編整理。


      從數學夢到編程魔法

      主持人:我們今天打算按時間順序聊一聊。很多人都提交了問題,我已經幫你整理歸類好了,所以我們就直接開始吧。

      我對你做了一番深入研究,我管這叫“人物深度挖掘”,因為我們研究的是一個活生生的人。你從小就接觸戲劇,還學了化學數學,后來因為寫了一個日程安排應用而踏入了編程的大門。但究竟是什么真正點燃了你對編程的熱愛?你為什么會成為大家眼中的那個“編程狂人”?

      Greg Brockman(以下簡稱 Greg):有意思的是,我小時候一直以為自己長大會成為一名數學家。我讀過很多數學家的故事,比如伽羅瓦高斯,他們思考的都是能影響未來一百年、兩百年甚至三百年的問題。我當時覺得,這正是我想要做的。如果我提出的任何理論在我有生之年就被應用了,那說明它還不夠長遠,不夠抽象。

      高中畢業后,我寫了一本化學教科書,寄給我一個在數學領域做過類似事情的朋友看。

      他說:“這書不可能有出版社要的。你要么自費出版——” 我一想,天啊,那得花多少功夫和本錢啊,“ —— 要么,你就建個網站。”

      我心想:“行吧,看來我得學學怎么做網站了。

      于是,我真的就跑去 W3Schools 網站,從頭學完了他們的 PHP 教程。

      我還記得我做的第一個東西,是一個給表格排序的小插件。我腦子里已經有了清晰的畫面,想著它該是什么樣。我還記得,當我點擊表頭,整個表格真的就按照那一列排序了,跟我預想的完全一樣。那一刻,我感覺就像見證了魔法。我心想:“這東西也太酷了。”

      因為數學這東西,是你絞盡腦汁想通一個問題,理解了它,然后用一種晦澀難懂的方式記錄下來,稱之為“證明”。之后,可能全世界只有三個人會關心它。

      但在編程世界里,你也是用一種晦澀難懂的方式把它寫下來,我們稱之為“程序”。然后,可能也只有三個人會去讀你的代碼、關心你的程序,但所有人都能享受到它帶來的好處。沒有人需要理解其中的細節。你腦海中的想法,就這么變成了現實世界里真實存在的東西。那一刻我就認定,這才是我真正想做的事。忘掉那一百年的宏大愿景吧,我只想創造。


      結緣 Stripe:輟學背后的故事與第一性原理

      主持人:而你的確只想創造。你在這方面是如此出色,以至于還在上大學的時候,不知怎么地,Stripe(人稱“美國支付寶”的軟件)就給你發了一封“陌生人”郵件。這背后有什么故事嗎?他們是怎么找到你的?又是什么說服了你輟學加入他們?

      Greg:我和 Stripe 的創始人有一些共同的朋友——當時那還是個只有三個人的“大公司”。他們按照慣例,去問哈佛的朋友,校園里有誰值得聊聊,可能可以招募。我的名字就被人提起了。然后他們又去問了麻省理工的朋友,因為我當時已經從哈佛輟學,轉去了麻省理工。所以,我占了個便宜,在兩邊都拿到了“推薦票”。

      我還記得見到 Patrick(Stripe 的聯合創始人)的那天,我剛下飛機,天色已晚,外面還下著暴雨。我一到,我們就開始聊代碼。就在那一刻,我心里想:“這正是我一直以來想找的、想與之共事的人。” 于是,我最終從麻省理工輟學,飛了過去,從此就一直待在了這里。

      主持人:如你所知,我們在訪談中穿插了一些嘉賓提問。這里有一位名叫 Matthew Brockman 的嘉賓提問。

      Greg:我好像聽過這個名字(這里是開玩笑,Matthew 其實就是 Greg 的親兄弟,在 2023 年 OpenAI 宮斗的時候,Matt 在推特上聲援了 Greg 并亮相)。

      Shawn:他是 Julius AI 的首席執行官。他問:“你覺得我們的父母什么時候才會放棄讓你完成學位的夢想?或許哈佛或者北達科他大學會愿意讓你回去念完?”

      Greg:唉,他們永遠不會放棄的。

      當時確實很難。不管你要去哪,當你告訴父母你要離開哈佛時,這坎都不好過。當你告訴他們你要徹底輟學時,那更是難上加難。但值得稱贊的是,盡管他們覺得很難接受,但還是對我說:“我們相信你。你所處的位置,一定讓你看到了、理解了一些我們隔著大半個國家難以看到的東西。”

      但后來,我在 Stripe 做得不錯,也確實學到了東西——而且事實證明這是一家真正的公司,不是我為了無所事事而輟學——我想他們也就慢慢接受了這個現實。

      主持人:我想他們一定為你感到非常驕傲。所以,你見證了 Stripe 從 4 名員工發展到 250 人,并最終成為公司的第一位首席技術官。我最近發現一件事,可能 Hacker News 上的網友們都不知道,那就是傳說中的“科里森安裝法”(Collison installation)其實只發生過屈指可數的幾次,它在 Stripe 內部并不是一個常規操作。

      Greg:我覺得確實如此。但這個故事卻在各種傳說中流傳了下來……

      主持人:這成了一個都市傳奇,因為它實在太酷了。那種為了客戶可以做到極致的感覺。那么,關于早期的 Stripe,大家還有哪些誤解?我們借這個機會澄清一下?

      Greg:我覺得大家并不了解當初有多艱難。

      首先,我們把所有客戶都加了 Gchat 好友,隨時和他們保持著聯系。所以,即便你不是真的坐在他們身邊看著他們操作,也做到了僅次于此的程度。

      我記得有一次,我們意識到當時使用的支付后端根本無法支撐業務的擴張。我們必須接入富國銀行(Wells Fargo)的系統。我們談妥了合作,但接下來需要進行技術對接。對方告訴我們:“嗯,這個技術對接需要九個月,因為我們一向都是這個流程。” 我們當時就想:“這太瘋狂了。我們是創業公司,怎么可能干等九個月。”

      于是,我們在 24 小時內,就把這事兒搞定了,基本上是把它當作大學里的一項課題作業來攻克的。我負責實現所有功能,John 從測試腳本的頂端開始,一項項地測試,然后告訴我“這個壞了”,Darragh 則從底端開始往上推進。到了第二天早上,我們和對方的認證人員連線,發了幾個測試請求,結果報錯了。那個人說:“好的,那我們下周再約吧。” 因為他們所有的客戶都是這么辦事的:出了錯,你顯然得把它交給你的開發團隊去處理。

      但我們說:“別,別,別,肯定是系統里有什么小毛病。” Patrick 就在那兒跟她東拉西扯,拖延時間,而我在這邊拼命地修改代碼。我們來回試了大概五次,還是失敗了。但幸運的是,她人很好,愿意把時間改到兩小時后,那一次我們終于通過了。回過頭看,你才意識到,那一瞬間你完成的,是正常情況下六周的開發工作量,就是因為你沒有接受其他組織習以為常的那套武斷的限制。

      主持人:你覺得在大多數工作中,都存在很多類似的機會嗎?你如何建議其他人也能做到那么快,或者說砍掉那么多不必要的流程?

      Greg:我的想法是,如果你能從第一性原理出發去思考,你就能找到哪些環節是必須放慢速度、必須按部就班的。這樣的環節是存在的。“別管那些限制,只管去做”這個原則并非百分之百正確。關鍵在于,你要識別出那些不必要的開銷,它們的存在可能是為了應對一些早已過時、或者根本不適用于你具體情況的限制。這一點在今天這個 AI 極大提升生產力的世界里,尤其適用。

      主持人:是啊,不行就直接讓 Codex 來一段代碼,何樂而不為呢?


      獨立研究、從自學到頓悟

      主持人:關于你加入 OpenAI 之前的生活,還有最后一件事,那就是“獨立研究”。我發現這是你從高中起就反復出現的一個主題。你參加過 Recurse Center(一個編程靜修中心)嗎?

      Greg:是的,我去過。

      主持人:還有你的學術休假,你反復地進行獨立研究。你認為是什么讓獨立研究如此高效?我覺得很多人在這方面做得并不好,甚至會浪費掉一整年。你有什么秘訣嗎?

      Greg:這是我成長過程中的一個關鍵部分。六年級時,我爸教了我代數。七年級我到中學報到,那是第一次分快慢班學數學——當時是初級代數。我們找到老師問:“他能不能跳過這門課,直接去上八年級的課程?”

      那位老師用一種居高臨下的眼神看著我和我媽說:“每個家長都覺得自己的孩子是天才。” 結果在她班上待了一個月后——我上課根本不聽講,就在后面玩計算器游戲——她想通過叫我上黑板答題來難住我,但我每次都全答對了。她只好說:“好吧,算我輸了。你的孩子確實應該去上高年級的課。”

      但到了八年級,我們中學已經沒有更高級的數學課了。我當時又沒有車,所以只能上網絡課程。就在那一年里,我學完了高中三年的數學內容。

      所以對我來說,很重要的一點是,當你對自己想做的事情有發自內心的熱情時,你同樣可以打破常規的限制。你可以在一年內學完三年的數學,而且這種優勢是會復利的。第二年,我進了高中,很快就學完了高中的數學。所以在高二、高三那兩年,我已經沒有數學課可上了。那時我有了車,就可以去北達科他大學,隨便選我想上的課。

      這種經歷不斷累積,也影響了我學習編程的方式,基本上就是靠自學——不斷地創造,不斷地在真實世界里體驗。所以我的建議是,如果你有機會去探索,并且你真的享受你所熱衷的事情,那就深入地鉆研下去。順便說一句,這個過程并不總是充滿樂趣,你很容易會感到無聊。但只要你堅持挺過那些坎,回報絕對是值得的。

      主持人:你也是通過自學進入機器學習領域的,那也是你人生中的一個重要階段。那段時間有什么特別的亮點嗎?好像你還和杰弗里·辛頓(Geoffrey Hinton)聊過。

      Greg:是的,我和他聊過。

      主持人:那次交流對你有什么幫助?或者說,在你成為一名機器學習從業者的道路上,什么對你幫助最大?

      Greg:我剛開始接觸時,還在 Stripe 工作。當時我經常在 Hacker News 上看關于深度學習的文章,感覺每天都有一個“深度學習賦能某某領域”的帖子。那是 2013、2014 年的時候,我很好奇:“深度學習到底是什么?” 我認識這個領域里的一個人,就去找他聊。他又把我介紹給更多的人,那些人又把我介紹給更多的人。讓我驚訝的是,我發現自己不斷被介紹給我大學里那些最聰明的朋友們。

      我當時就想:“有意思,這些頂尖的人才最終都匯集到了這個領域。這背后到底發生了什么?” 我開始意識到,一股真正的力量正在形成。人們真的在讓這些系統做一些計算機以前完全做不到的、實質性的新事情。我心想:“就是這個了。”

      離開 Stripe 后,我知道自己想在 AI 領域做點什么,比如創辦一家 AI 公司,但我不太清楚自己該如何貢獻,或者我的技能在哪些方面能派上用場。當時我人在紐約,就想:“要不我組裝一臺 GPU 工作站,去參加一些 Kaggle 競賽試試看。” 于是我上 Newegg 網站,買了幾塊 Titan X 顯卡。親手組裝那臺機器的感覺真的太酷了。你們還能找到我 2015 年發的一條推文,當我按下開機鍵,看到滿眼的綠光和所有風扇飛轉起來的時候,我心想:“這才是計算機該有的樣子。”

      主持人:那么,是什么讓你確信通用人工智能(AGI)是可能實現的呢?你曾一度對此感到幻滅,你試著寫過一個聊天機器人,但失敗了。是什么讓你最終決定全身心投入其中?

      Greg:對我而言,這段心路歷程的一部分,源于閱讀艾倫·圖靈 1950 年發表的論文《計算機器與智能》。也就是提出圖靈測試的那篇。

      最讓我著迷的是,在論文開頭,他提出了圖靈測試——關于“機器能否思考?”“它是否智能?”的核心思想。如果你無法分辨你是在和一臺機器對話,還是在和另一個人對話,那你就可以說它是智能的。這很好理解。

      但論文中有一個觀點,雖然沒有在流行文化中廣為流傳,但對我來說卻極其震撼。他說:“那么,你該如何編程來實現這個目標呢?你永遠不可能寫下所有的規則。但是,如果你能制造一個 ‘兒童機器’,讓它像人類小孩一樣學習呢?然后你只需施加獎勵和懲罰,砰的一聲,它就能通過測試了。”

      我當時想:“這才是我們必須去創造的那種技術。”作為程序員,你必須理解一切,必須洞悉解決問題的全部規則。但如果機器能夠理解并解決連你自己都無法解決的問題呢?這感覺才是最根本的,這感覺才是解決人類重大問題的真正途徑。

      我大概是在 2008 年左右讀到這篇文章的,然后我去找我的教授,一位自然語言處理(NLP)領域的教授,問他我能不能跟他做點研究。他說:“可以啊,這些是語法分析樹,你拿去看看。”

      我心想:“好吧,這可不是圖靈說的那回事。

      主持人:這就像 WordNet 詞典之類的……

      Greg:完全就是那一套。沒錯。所以,那段時間確實是我的“失意低谷”。

      但深度學習的神奇之處在于,它在 2012 年的 AlexNet 上真正展現出了喜人的成果,在 ImageNet 競賽中一舉擊敗了所有對手。突然之間,你有了一臺通用的學習機器。雖然它在設計上帶有一點卷積網絡的先驗知識,但它勝過了計算機視覺領域過去四十年的研究積累,勝過了那些試圖盡可能寫下所有規則的人。

      接著,人們說:“好吧,它在視覺領域行得通,但在我的領域絕對不行。它在機器翻譯、在自然語言處理、在這樣那樣的領域,永遠都不可能成功。” 但緊接著,它在所有這些領域都開始做到最好。一夜之間,不同學科部門之間的壁壘被推倒了。我當時就想:“這才是圖靈所說的那種東西。

      所以對我來說,光是看到這項技術的“類型簽名”(type signature)……順便說一句,這項技術并不新。神經網絡……如果你去讀麥卡洛克-皮茨在 1943 年左右發表的關于神經元的論文……

      主持人:我剛才還讓他給大家留點作業呢。

      Greg:好的,作業來了,同學們記一下。你會發現,那篇論文里的插圖,和你現在看到的那些描繪神經元層級的圖片,看起來幾乎一模一樣。你就會意識到,我們現在做的事情,背后有著非常深刻的根基。你還能找到一篇 90 年代的論文,探討是什么導致了深度學習的寒冬。文章說,那些搞神經網絡的人根本沒什么新點子,“他們唯一的想法就是造更大的計算機。” 我當時想:“沒錯!這正是我們該做的。”

      所以,所有這些因素加在一起,讓我感覺我們某種程度上是在延續一段長達七十年的歷史浪潮。從很多方面來說,整個計算機行業的發展,都是在為這一刻做準備:創造出能夠執行我們現在才剛剛觸及皮毛的那些任務的機器;能夠解決人類無法解決的新問題;能夠在日常生活中輔助我們;讓我們不再需要用這兩根“肉條”(手指)打字,而是能擁有一個像人一樣交互的對象,讓機器更貼近你,而不是你必須去學習匯編語言之類的東西來遷就它。所以對我來說,感覺所有的條件都已成熟,現在我們只需要去創造。

      主持人:我很喜歡你一直回歸的這個主題:我們只需要去創造。


      研究與工程:OpenAI 的雙引擎,當工程師遇上研究員

      主持人:2022 年,你寫了一篇文章說“是時候成為一名機器學習工程師了”。我有一個朋友,就是讀了那篇文章后,給你發了郵件,然后加入了 OpenAI。你說過,偉大的工程師能夠和偉大的研究員一樣,為未來的進步做出同等級別的貢獻。這個觀點今天還成立嗎?我覺得很多工程師看著那些拿著數百萬美元薪水的研究員,會想:我怎么才能做出和他們一樣大的貢獻?

      Greg:我認為這個觀點絕對成立,甚至比以往任何時候都更加正確。如果你回顧一下 2012 年以來深度學習研究的各個階段,你會發現,最開始確實是那些擁有博士學位的科研人員提出想法并進行驗證。當然,其中也有工程工作。如果你仔細看 AlexNet 本身,它的核心就是一項工程成就:在 GPU 上實現了高效的卷積核運算。

      有個趣聞,當時和 Alex Krizhevsky 在同一個實驗室的人其實都替他感到惋惜,他們覺得:“他搞出了一些快速卷積核,但只是用在一個無關緊要的圖像數據集上。” 但事實證明,你只需要把這個技術應用到 ImageNet 上,它就會大放異彩。所以,是卓越的工程能力與“用它做什么”的洞見相結合,才創造了奇跡。

      我認為,今天依然如此、甚至愈發如此的是,現在所需的工程能力,早已不只是編寫幾個計算核心那么簡單了。它關乎構建一個龐大的系統,關乎擴展到十萬塊 GPU 的規模,關乎搭建一個能以各種方式調度資源的、極其復雜的強化學習系統。如果你沒有好的想法,那你就像是擱淺的船,寸步難行。但如果你沒有強大的工程能力,那再好的想法也無法誕生于世,無法看到天日。你必須讓這兩者和諧地結合在一起。

      主持人:我覺得 Ilya Sutskever 和 Alex Krizhevsky 的合作關系,正是這種“研究-工程”伙伴關系的縮影,而這也成為了后來 OpenAI 的理念。

      Greg:完全正確。如果你觀察 OpenAI 的運作方式,就會發現從一開始,我們就秉持著一種精神:工程和研究同等重要,并且要像伙伴一樣并肩協作。這是我們每天都在努力實踐的事情。

      主持人:在訪談里出其不意地提問是我的明確目標。所以,關于工程和研究的關系,OpenAI 在早期有哪些做得不好的地方,而現在又改進了呢?

      Greg:嗯,關于工程和研究的關系,我的看法是,你永遠無法一勞永逸地解決它。你只是解決了當前層面的問題,然后又會進入下一個更復雜的層面。我注意到,我們遇到的問題,基本上和所有其他實驗室遇到過的一樣;只是我們可能走得更遠一些,或者問題的變體略有不同。所以,我覺得這里面有某種非常根本性的規律。

      在最早期,我能清楚地看到,來自工程界的人和來自研究界的人,對系統約束的思考方式完全不同。

      作為工程師,你會想:“嘿,既然我們約定好了接口,你就不該關心接口背后是什么。這是我們說好的,我可以用任何我喜歡的方式去實現它。”

      而作為研究員,你會想:“如果系統里任何一個地方有bug,我得到的只會是性能的輕微下降,而不會收到一個異常,也不會有任何線索告訴我問題出在哪。所以,我有責任去理解所有的一切。接口根本不重要,除非它堅如磐石,我永遠不需要去思考它——而這是一個非常高的標準——否則,我就必須對這段代碼負責。”

      這就會導致摩擦,因為這樣一來,你們到底要怎么合作呢?我很早就看到過一個項目,工程背景的人寫了代碼,然后研究背景的人會對每一行代碼展開激烈的辯論。我當時就想,這項目永遠也推進不下去了,速度會慢得要死。

      后來,我們采取的方式是……我當時直接參與了那個項目,我會一次性提出五個想法。研究那邊的人會說:“這四個不行。” 我就說:“太好了,我就是想知道這個。” 我們真正意識到,并且我也會告訴那些從工程界加入OpenAI的人,最關鍵的一點是“技術上的謙遜”。你之所以被招進來,是因為你擁有重要的技能,但這和傳統的互聯網創業公司是完全不同的環境。弄清楚你的直覺何時適用,何時應該拋諸腦后,是極其困難的。

      所以,最重要的事情就是,進來之后,要真正地、真正地去傾聽,并且假設在你徹底理解“為什么”之前,你一定遺漏了某些信息。到了那個時候,好的,你再去做出改變,去修改架構,去重構抽象。但那種帶著謙遜,去真正閱讀、傾聽和理解的態度,是一個至關重要的決定因素。


      研究與工程:OpenAI 的雙引擎,當工程師遇上研究員

      主持人:接下來,我們來聊聊 OpenAI 近期幾次重磅發布的幕后故事。 有一件很有意思的事,就是規模擴張(Scaling)。在不同的數量級上,所有東西都會出問題。ChatGPT 發布時,你們在 5 天內獲得了一百萬用戶。而今年,GPT-4o 的圖像生成功能發布時,你們在 5 天內獲得了一億用戶。這兩個時期相比,感覺有什么不同?

      Greg:從很多方面來看,這兩個時刻都驚人地相似。ChatGPT 當時本來只是一個低調的研究預覽版。我們很平靜地把它發布了出去,然后突然之間,所有系統都宕機了。我們某種程度上預料到 ChatGPT 會非常受歡迎,但我們以為需要等到 GPT-4 發布才能達到那個熱度。

      主持人:你們內部當時已經用上 GPT-4 了,所以對 3.5 沒那么驚艷了。

      Greg:完全正確。這也是這個領域的另一個特點:你的認知更新得太快了。你剛看到一個魔法般的奇跡,心想:“天啊,這是我見過最厲害的東西了。” 緊接著你就會抱怨:“嗯,它怎么還不能幫我合并 10 個代碼合并請求(PR)?”

      圖像生成功能發布的那一刻也非常相似,它同樣備受喜愛,廣受歡迎,病毒式傳播的方式讓各項數據都突破了天際。在這兩次發布中,我們內部其實都做了一件我們極力避免的事情,那就是從研究項目中調撥了大量的計算資源,因為這相當于抵押未來來保證當下的系統運轉。但如果你真的能滿足并跟上用戶的需求,那么當然,人們就能體驗到那種魔力,我認為在那種時刻,最大化這種體驗是非常值得和重要的事情。

      所以我想,我們始終秉持著同樣的精神:真正服務用戶,真正推動技術,去做那些前所未見的、實質性的新東西。然后,無論需要付出什么代價,我們都會把它們推向世界,讓它們取得成功。

      主持人:難以置信,太了不起了。關于 GPT-4 發布會。我聽說那個玩笑網站是你太太畫的?

      Greg:是真的。算是個有趣的小彩蛋。我的字寫得太爛了,連我們自己的 AI 都識別不出來該拿它怎么辦。

      主持人:你當時有一些即興發揮嗎?我聽說有。

      Greg:那條波浪線嗎?是的。通常,我做這類演示時,都會提前測試好大概的流程。但我一直很討厭那種只要你打錯一個字符,整個演示就進行不下去的設計。我不喜歡做那樣的演示。我希望它有一定的容錯性。所以,最終實際展示的內容總會有些變化。

      主持人:對我來說,那是我覺得全世界第一次見識到所謂的“氛圍編程”(vibe coding)。現在這已經成了一個流行詞了。你對“氛圍編程”有什么看法?

      Greg:“氛圍編程”作為一種賦能的機制,非常了不起,它在某種程度上也代表了未來的趨勢。至于“氛圍編程”具體是什么,我認為它會隨著時間而改變。

      我覺得,即便你看看像 Codex 這樣的工具,在某種程度上,我們的愿景是,當你開始擁有真正能工作的智能體時,你擁有的將不只是一個副本,不是十個,而是一百、一千、一萬甚至十萬個這樣的東西在運行。你會更希望像對待同事一樣對待它們。你希望它們在云端,處理各種事務,能夠接入各種各樣的東西。即便你睡著了,筆記本合上了,它依然在工作。

      我對未來的預測是,當前這種在交互循環中進行的“氛圍編程”會越來越多,但智能體(agentic)的應用也會真正地介入并超越它。所有這一切,最終都將促成更多系統的誕生。

      我認為另一個非常有趣的點是,很多“氛圍編程”的演示和那些酷炫的東西,比如制作一個玩笑網站,都是從零開始創建一個應用。但我認為,真正具有革新性和顛覆性的,并且已經開始發生的,是能夠改造現有應用并深入其中的能力。太多公司都坐擁龐大的遺留代碼庫,而進行遷移、更新庫、把你那古老的 COBOL 語言換成別的,是如此的困難。而且說實話,這對人類來說一點也不好玩。我想,我們正開始擁有能夠真正解決這些問題的 AI 了。

      我喜歡“氛圍感編程”的起點——那種“隨手創造酷炫應用”的感覺——但它正開始變得更像是嚴肅的軟件工程。并且會更進一步,讓一個公司能夠以快得多的速度前進,這正是我認為我們前進的方向。

      主持人:提到 Codex,我聽說它在某種程度上像是你的“親兒子”。在直播中,你也談了很多關于讓代碼模塊化、文檔清晰等等好的實踐。你認為 Codex 會如何改變我們編碼的方式?

      Greg:說它是我的“親兒子”絕對是夸張了。我們有一個非常了不起的團隊,我只是在盡力支持他們和他們的愿景,但這個方向對我來說,是如此引人入勝和不可思議。

      主持人:那么,Codex 會如何改變我們編碼的方式?

      Greg:我觀察到的最有趣的一點是,當你意識到代碼庫的組織方式決定了你能從 Codex 中獲得多少助益時。我們現有的所有代碼庫,在某種程度上都是為了匹配人類的長處而構建的。但如果你反過來,讓它們去匹配模型的長處——模型的特點非常偏科,它們能處理的多樣性遠超人類,但目前在連接深層思想方面還不如人類——你就能從它們身上獲得更多。

      你可能想要做的,是創建更小、經過充分測試的模塊,這些模塊的測試可以非常快速地運行。然后,填充細節的工作,模型會自己完成,它還會自己運行測試。而這些不同組件之間的連接,也就是架構圖的設計,其實是相當容易的。真正困難的,往往是填充所有細節。

      如果你這么做,我所描述的聽起來也很像優秀的軟件工程實踐。但有時候,因為人類能夠在腦海中容納更復雜的概念抽象,我們就不這么做了。編寫和完善這些測試需要大量工作。但模型運行這些測試的次數,會比你多一百倍、一千倍,所以它會比你更在意這些。

      所以,在某些方面,我們想要前進的方向是,為更初級的開發者構建我們的代碼庫,以便真正地從這些模型中獲得最大收益。當然,隨著模型能力的提升,這種組織代碼庫的方式是否會保持不變,這將是一個非常有趣的看點。我個人傾向于認為,這是個很好的思路,因為它再次與那些為了人類可維護性而應該做的事情不謀而合。但對我來說,對于軟件工程的未來,最令人興奮的思考是:我們過去為了圖省事而“偷工減料”的那些實踐,有哪些是現在為了最大化系統效能而必須重新拾起的?

      主持人:你能大致估計一下,你們內部使用 Codex 帶來的生產力提升有多少嗎?

      Greg:我不清楚最新的數據。但我們肯定有百分之十幾的代碼合并請求(PR)是完全由 Codex 編寫的,這看起來非常酷。但它也不是我們內部使用的唯一系統,而且對我來說,它仍處于非常、非常早期的階段。看到一些外部的指標也很令人興奮。我記得在過去一天里,公共的 GitHub 倉庫里有 24000 個由它完成的合并請求被接受了。所以,這一切都才剛剛開始。

      主持人:隨著我們執行的任務越來越耗時、占用GPU越來越多,這些硬件本身也變得不可靠。它們經常出故障,這是眾所周知的。這也導致了訓練失敗。你提到過,有時候可以簡單地重啟一次訓練,這沒問題。但當你需要訓練長周期的智能體時,你該如何處理這個問題?你不可能把一個已經進行到一半、而且可能是非確定性的任務軌跡直接重啟。

      Greg:這里有一系列問題,你解決了當前層面的,然后把模型變得更強大,接著你又得重新解決它們。是的,當任務執行時間很短,比如 30 秒,你基本不用擔心這個問題。但如果任務要持續數天,那這個問題就變得至關重要了,你必須開始思考如何給狀態做快照以及諸如此類的一系列事情。

      簡而言之,這些訓練系統就像一個不斷攀登的復雜性階梯。幾年前,我們關心的只是做好傳統的預訓練,而那是非常容易做檢查點(checkpoint)的。即便如此,這事也不簡單。如果你從偶爾做一次檢查點,變成想在每一步都做檢查點,那你就要非常深入地思考如何避免數據復制、阻塞等各種問題。

      然后,對于像這些更復雜的強化學習(RL)系統,檢查點的概念依然存在,比如,你可能需要為緩存做檢查點,這樣就不用重新計算所有東西。我們系統的一個好處是,語言模型的狀態是高度明確的,它是可以被存儲和處理的。但如果你接入的工具有其自身的狀態,那些可能就無法重啟和恢復了。所以,如果你把整個系統端到端地來看,就必須思考檢查點的設計。

      另外還有一個問題是,也許這根本不重要。也許重啟系統,你的圖表上出現一點小小的波動,也完全沒關系,因為這些模型很聰明,它們能處理好這種情況。


      黃仁勛一問:未來 AI 基礎設施的藍圖

      主持人:接下來,我想我們有一位來自巴黎的特邀嘉賓打來的電話提問。

      黃仁勛:你好,Greg,我是黃仁勛。我真希望我能親自到場向你提問。我的一個問題是,在這個新世界里,數據中心和 AI 基礎設施的工作負載將變得極其多樣化。一方面,智能體在進行深度研究——它們在思考、推理、規劃,并與其他智能體協作,它們需要處理大量內存和長上下文。而另一方面,你又希望其中一些智能體能以盡可能快的速度思考。

      所以,你該如何創建一個 AI 基礎設施,既能針對那些需要大量預填充(pre-fill)和大量解碼(decode)、或者介于兩者之間的工作負載進行優化?又能同時支持我個人非常興奮的另一類工作負載:那些多模態的、能看能聽的 AI,它們就像你的 R2-D2 機器人,你的私人伴侶,永遠在線,隨時待命。所以這兩類工作負載——一類是計算量極大、可能耗時很長,另一類又要求極低的延遲。一個既要盡可能靈活、性能強大,又要兼顧低延遲和高吞吐的未來 AI 基礎設施,會是什么樣子?所有這些都極其復雜。你是如何思考這個問題的?你認為理想的未來 AI 基礎設施應該是什么樣的?

      Greg:當然是需要大量、大量的 GPU。

      主持人:如果我總結一下,就是黃仁勛想讓你告訴他該造什么樣的芯片。你的夢想是什么?但同時,這里確實有兩個核心需求:長時間的重度計算,和“馬上、立刻、現在就要”的實時響應。

      Greg:是的,這非常難,因為這種軟硬件協同設計的問題簡直讓人頭腦發脹。我本身是軟件背景出身,我們以為自己只是在這里寫 AGI 的軟件,但后來你發現,你還必須去做這些巨大的基礎設施項目。這并非我們最初的設想,但最終看來,這其實也合乎情理。如果我們打算建造一個能改變世界的東西,那么是的,它很可能需要人類有史以來創造過的最大規模的物理機器。這在邏輯上是說得通的。

      所以,答案有兩種。最直接的答案是,好吧,你需要兩種類型的加速器。一種是為計算優化的,另一種是為延遲優化的。給其中一種堆上海量的高帶寬內存(HBM),給另一種堆上超強的計算單元,問題就解決了。但這里面一個真正的難點是預測兩者之間的比例。現在你又有了一個新問題要考慮,如果這個平衡搞錯了,你突然就會發現自己的一大批設備變得毫無用處。這聽起來非常可怕。

      但實際情況是,這個領域里沒有所謂的硬性需求,也沒有絕對的約束,大家只是在優化一個巨大的線性規劃問題。所以,是的,如果你給我們的工程師一些資源配比不均衡的硬件,我們總會想辦法利用起來,也許過程會非常痛苦。一個例子就是,你已經看到整個領域都在轉向“混合專家模型”(MoE)。在某種程度上,“混合專家模型”所做的就是說:“好吧,我們有很多 DRAM 內存閑置著沒用,因為資源配比不對。那行,我們就用參數把它們填滿,這幾乎不消耗額外的計算資源,反而能讓我們獲得額外的機器學習計算效率。” 砰,問題解決了。

      所以我認為,一定程度上,即使你搞錯了平衡,也不是世界末日。加速器的同質化是一個非常好的默認起點。但最終走向專用加速器也并非天方夜譚。而且,當我們這個領域的基礎設施資本支出變得越來越驚人時,開始針對某些工作負載進行超優化就變得相當合理了。但我認為,現在下定論還有點為時過早,因為研究進展得太快了,在某種程度上,研究的突破會主導其他一切。


      通往 GPT-6 之路:算法瓶頸的回歸

      主持人:我本來沒打算問這個,但你剛提到了研究。你能給當前 GPT-6 研發的瓶頸排個序嗎?計算資源、數據、算法、電力、資金。你覺得你們在哪方面最受限制?

      Greg:我覺得,我們正處在一個基礎研究回歸的時代。這一點真的非常了不起,是真正的基礎研究。

      曾有一段時間,感覺就像是:“好了,我們有了 Transformer,接下來只管擴大規模就行了。” 我覺得這類問題非常激動人心,你有一個定義非常清晰的難題,你只想把那個數字往右上角推。但從某種智識層面來說,這又有點不盡如人意。感覺人生不止于原汁原味的《Attention Is All You Need》那篇論文。

      我們開始看到的是,我們現在運作的規模,已經把計算和數據都推到了極限,以至于算法重新成為了一個重要的、甚至是決定未來進展的關鍵瓶頸。所有這些因素都是支撐帳篷的重要支柱,在任何一天,它都可能看起來朝某個方向有點傾斜。但從根本上說,你希望讓它們都保持平衡。

      看到像強化學習(RL)這樣的范式崛起,真的非常令人興奮。這是我們多年來刻意投入的領域。當我們訓練 GPT-4 時,一件非常有趣的事是,當我們第一次和 GPT-4 對話時,我們心想:“這是 AGI 嗎?”它顯然不是 AGI,但又很難說清楚為什么。它身上有一種說不出的感覺,它如此流暢自如,但不知怎么地就會偏離軌道。

      我們就覺得:“好吧,我們必須解決這個可靠性的問題。”

      它從未真正地體驗過這個世界。它就像一個讀完了所有書、或者觀察了整個世界,但從未親身經歷過的人,只是隔著一塊玻璃在看。對我來說,那一刻我們就像是頓悟了:“很明顯,我們需要一種不同的范式。” 然后我們就持續不斷地在這個方向上努力,直到我們真正讓它奏效。我認為今天依然如此,還有其他一些非常明顯的能力缺失,我們只需要持續地去攻克,我們終將到達那里。

      主持人:接下來讓我們繼續。我們本來只向黃仁勛要了一個問題,但他是個“優等生”,所以他發來了兩個。讓我們播放第二段視頻。

      黃仁勛:我的第二個問題是,未來幾年,OpenAI 將擁有 AGI,而他們將在 OpenAI 的 AGI之上,構建特定領域的智能體。我腦海中會浮現出一些問題,比如,隨著 OpenAI 的 AGI能 力越來越強,他們的開發工作流會如何改變?與此同時,他們仍然需要為自己特定領域的智能體創建底層的技術管道、工作流和增長飛輪。這些智能體當然將能夠推理、規劃、使用工具,并擁有短期和長期的記憶。但在未來幾年,這個開發過程會如何演變?

      Greg:我認為這是一個非常引人入勝的問題,你能找到各種各樣觀點鮮明但又相互矛盾的看法。我的觀點是,首先,一切皆有可能。也許我們會進入一個 AI 能力超強,以至于我們都讓它們來寫所有代碼的世界。也許世界會是只有天上一個 AI 的形態,又或者,是你實際上擁有一大群特定領域的智能體,而這些智能體需要大量專門的工作才能實現。

      各種證據已經開始明顯地傾向于一個由不同模型組成的“百花齊放”的生態。我認為這實際上非常令人興奮。僅僅從系統角度來看,就有不同的推理成本,有不同的權衡取舍。模型蒸餾的效果非常好。所以,能夠利用其他模型的模型,本身就蘊含著巨大的能量。

      我認為這將開啟海量的機會,因為我們正在走向一個經濟由 AI 根本性驅動的世界。我們還沒到那一步,但你已經能看到它就在地平線上了。

      正是如此。我的意思是,這正是這個房間里的人們正在構建的,這正是你們在做的事情。而經濟是一個非常龐大的東西,它內部有極大的多樣性,而且它也不是靜止的。當人們思考 AI 能為我們做什么時,很容易只著眼于我們現在正在做的事情,以及 AI 如何嵌入其中,還有人類與 AI 勞動的比例。但那不是重點。重點是,我們如何獲得 10 倍的活動,10 倍的經濟產出,10 倍于所有人的福祉?

      我認為我們前進的方向是,模型將變得更加強大,基礎技術將變得更好,而我們將有更多的事情想用它來做,同時,進入的門檻將比以往任何時候都低。像醫療保健這樣的領域,需要有責任心的人去深入思考如何把它做好。像教育這樣的領域,涉及多個利益相關方——家長、老師、學生——每一個都需要領域專業知識,需要仔細的思考,需要大量的工作。

      所以,我認為未來將會有數不盡的機會讓人們去創造。看到這個房間里的每一個人,我感到無比興奮,因為這正是我們需要的那種能量。

      本文編譯 自 AI Engineer

      原文 | youtube.com/watch?v=avWhreBUYF0

      當創造的工具變得如此強大,我們該如何重新思考“創造”本身?

      Brokman 給出了他的答案。而這個問題,對于一線的產品經理來說,已經不是哲學思辨,而是懸在頭頂的達摩克利斯之劍。如果說 OpenAI 的這些人負責建成引擎,那么如何將這澎湃的動力轉化為用戶真正需要的產品,則是在另一片更泥濘的戰場上展開的“壕溝戰”。

      因此,。與一線公司的 AI 產品負責人直接對話,深入探討如何跨越“模型”與“產品”之間的鴻溝,分享他們在 AI 產品化道路上踩過的坑和總結的實戰方法。這不僅是觀點的碰撞,更是一份為你準備的、來自探路者前線的 AI 產品地圖,歡迎掃碼預約:

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      炸裂!巴薩18歲新星重傷歸來5場狂轟4球,拉瑪西亞再出中場真核!

      炸裂!巴薩18歲新星重傷歸來5場狂轟4球,拉瑪西亞再出中場真核!

      田先生籃球
      2026-03-06 11:05:50
      黃蜂瘋了!首發五人組勝率90%,還順手碎了項67年的NBA紀錄

      黃蜂瘋了!首發五人組勝率90%,還順手碎了項67年的NBA紀錄

      仰臥撐FTUer
      2026-03-06 13:59:05
      伊朗外長最新表態

      伊朗外長最新表態

      環球時報國際
      2026-03-07 00:15:51
      中國女籃72-66雙殺巴西!數據一清二楚:不是張子宇, 最大功臣是她

      中國女籃72-66雙殺巴西!數據一清二楚:不是張子宇, 最大功臣是她

      林子說事
      2026-03-07 06:26:56
      父母若是有以下7種疾病,子女基本都會遺傳,不少人并不清楚!

      父母若是有以下7種疾病,子女基本都會遺傳,不少人并不清楚!

      健康之光
      2026-03-03 17:35:03
      愛因斯坦去世后大腦被偷走研究數十年,到底發現了什么?

      愛因斯坦去世后大腦被偷走研究數十年,到底發現了什么?

      宇宙時空
      2026-03-06 07:00:09
      1998年數萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

      1998年數萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

      比利
      2026-02-16 01:34:21
      湖南衛視元宵晚會直播發生意外,一名表演嘉賓在完成舞臺動作時意外失誤撞向何炅,何炅:這是要給我拜個晚年嗎

      湖南衛視元宵晚會直播發生意外,一名表演嘉賓在完成舞臺動作時意外失誤撞向何炅,何炅:這是要給我拜個晚年嗎

      極目新聞
      2026-03-04 09:59:45
      訂單大漲118%!光通信四大龍頭比拼,誰才是真增長王?

      訂單大漲118%!光通信四大龍頭比拼,誰才是真增長王?

      小陸搞笑日常
      2026-03-06 13:11:37
      當年舉報畢福劍的那位告密者竟然變成這樣了!誰能想到啊?

      當年舉報畢福劍的那位告密者竟然變成這樣了!誰能想到啊?

      霹靂炮
      2026-02-06 13:48:54
      文班亞馬:去年前往少林寺是完美時機,我學了一系列新動作

      文班亞馬:去年前往少林寺是完美時機,我學了一系列新動作

      懂球帝
      2026-03-06 22:30:08
      海報被指抄襲路虎,長城汽車魏建軍道歉:愿承擔全部法律和經濟責任

      海報被指抄襲路虎,長城汽車魏建軍道歉:愿承擔全部法律和經濟責任

      澎湃新聞
      2026-03-06 21:22:29
      2017年,84歲的南大教授找到失聯23年的學霸兒子,兒子卻拒絕相見

      2017年,84歲的南大教授找到失聯23年的學霸兒子,兒子卻拒絕相見

      北有南梔
      2026-03-05 17:55:03
      豬油再次被關注!醫生發現:高血壓患者常吃豬油,或出現幾種變化

      豬油再次被關注!醫生發現:高血壓患者常吃豬油,或出現幾種變化

      蜉蝣說
      2026-02-23 21:23:05
      男子稱在上海一銀行門口被三名彪形大漢挾持上車,搶走20萬!民警調查揪出“黑吃黑”真相

      男子稱在上海一銀行門口被三名彪形大漢挾持上車,搶走20萬!民警調查揪出“黑吃黑”真相

      大象新聞
      2026-03-06 14:43:03
      1.2億農村老人,每月只領200元養老金,買兩袋米就沒了。

      1.2億農村老人,每月只領200元養老金,買兩袋米就沒了。

      流蘇晚晴
      2026-02-26 18:18:15
      “中美罕見協調一致,敦促加納”

      “中美罕見協調一致,敦促加納”

      觀察者網
      2026-03-06 18:25:06
      隊報:盡管格子不想在賽季中期離開馬競,但奧蘭多城仍未放棄

      隊報:盡管格子不想在賽季中期離開馬競,但奧蘭多城仍未放棄

      懂球帝
      2026-03-07 08:14:42
      人類去世之后靈魂仍舊存在?科學家們曾做過相關實驗!

      人類去世之后靈魂仍舊存在?科學家們曾做過相關實驗!

      宇宙時空
      2026-03-05 21:40:03
      18-21,12-21!梁王組合連丟兩局遺憾出局,無緣全英公開賽四強

      18-21,12-21!梁王組合連丟兩局遺憾出局,無緣全英公開賽四強

      全景體育V
      2026-03-07 06:20:32
      2026-03-07 08:36:49
      AI科技大本營 incentive-icons
      AI科技大本營
      連接AI技術的創造者和使用者
      2639文章數 7659關注度
      往期回顧 全部

      科技要聞

      OpenClaw爆火,六位"養蝦人"自述與AI共生

      頭條要聞

      伊朗大規模發射新一代導彈 摧毀美軍大量設施、裝備

      頭條要聞

      伊朗大規模發射新一代導彈 摧毀美軍大量設施、裝備

      體育要聞

      跑了24年,他終于成為英超“最長的河”

      娛樂要聞

      周杰倫社交媒體曬昆凌,夫妻感情穩定

      財經要聞

      關于經濟、股市等,五部門都說了啥?

      汽車要聞

      逃離ICU,上汽通用“止血”企穩

      態度原創

      教育
      房產
      親子
      游戲
      時尚

      教育要聞

      本科擴招10萬人!深度解析戰略布局

      房產要聞

      傳統學區房熄火?2月海口二手房爆火的板塊竟然是…

      親子要聞

      兒童鼻出血的常見問題,兒科醫生解答

      曝下代Xbox靠純算力制霸!性能“爆殺”PS6

      這些才是適合普通人的穿搭!搭配腰帶、多穿牛仔褲,簡單舒適

      無障礙瀏覽 進入關懷版