![]()
責(zé)編 | 王啟隆
出品 | CSDN(ID:CSDNnews)
投稿或?qū)で髨蟮?| zhanghy@csdn.net
Lex Fridman 絕對是當(dāng)今世界最炙手可熱的英文播客頻道了,本還沉浸在他最近之中,沒想到昨天又更了一期與谷歌 DeepMind 掌門人、新晉諾貝爾獎得主Demis Hassabis的兩小時對話,二人展開了一場關(guān)于人工智能、現(xiàn)實模擬、物理學(xué)和電子游戲的深度對話。
![]()
這位被譽為當(dāng)今世界最聰慧、最迷人的思想家之一,在人工智能領(lǐng)域取得了一系列里程碑式的成就,從 AlphaGo 到 AlphaFold,不斷刷新著我們對智能的認知。他不僅是 AI 領(lǐng)域的先驅(qū),也是一位骨灰級游戲玩家和對宇宙終極奧秘充滿好奇的探索者。
在這場對話中,Hassabis 大膽預(yù)測,在未來五年內(nèi),我們有 50% 的可能性實現(xiàn)通用人工智能(AGI)。他從一個新穎的角度提出,自然界中所有能被演化出來的模式,原則上都可以被經(jīng)典的學(xué)習(xí)算法高效地建模和發(fā)現(xiàn),這為我們用AI模擬從蛋白質(zhì)折疊到宇宙天體的萬事萬物提供了理論基石。
他暢談了 AI 將如何徹底改變電子游戲的未來,創(chuàng)造出真正個性化、動態(tài)生成的開放世界,讓每個玩家都能“共同創(chuàng)作”屬于自己的故事。他甚至透露,如果條件允許,他自己的“退休計劃”之一就是親自操刀,利用 AI 創(chuàng)造一款終極游戲。
他將 AI 視為探索科學(xué)終極問題的最強工具,無論是模擬一個完整的細胞、探尋生命的起源,還是解答 P 與 NP 這樣的世紀難題。在他看來,這一切的本質(zhì)都是計算和信息處理,而構(gòu)建 AGI,正是為了幫助人類科學(xué)家去回答這些關(guān)于現(xiàn)實本質(zhì)的終極問題。
以下是這場對話的內(nèi)容,由 CSDN 進行了精編整理。
![]()
「自然界中可學(xué)習(xí)的模式」
Lex Fridman:在你的諾貝爾獎演講中,你提出了一個非常有趣的猜想:“任何在自然界中能夠生成或發(fā)現(xiàn)的模式,都可以被經(jīng)典的機器學(xué)習(xí)算法有效地發(fā)現(xiàn)和建模。” 這可能包括哪些類型的模式或系統(tǒng)?生物學(xué)、化學(xué)、物理學(xué),甚至是宇宙學(xué)、神經(jīng)科學(xué)?我們具體在談?wù)撌裁矗?/p>
Demis Hassabis:諾貝爾獎演講有一個傳統(tǒng),就是要有一點挑釁性,我想遵循這個傳統(tǒng)。我當(dāng)時談到的是,如果你退一步看我們所做的所有工作,尤其是 Alpha 系列的那些項目,比如 AlphaGo,當(dāng)然還有 AlphaFold,它們的本質(zhì)其實是在為那些組合性極高、維度極大的空間建立模型。
![]()
如果你試圖用暴力破解的方式去尋找解決方案,比如在圍棋中找到最佳落子,或者找到一個蛋白質(zhì)的精確結(jié)構(gòu),然后你把所有可能性都列出來,那么宇宙誕生以來的時間都不夠用。
所以你必須要做得更聰明。我們在兩種情況下都建立了這些環(huán)境的模型,然后用一種聰明的方式來引導(dǎo)搜索,從而使問題變得可以處理。
就拿蛋白質(zhì)折疊來說,它顯然是一個自然系統(tǒng),為什么這應(yīng)該是可能的呢?物理學(xué)是如何做到這一點的?蛋白質(zhì)在我們體內(nèi)幾毫秒內(nèi)就能完成折疊,所以物理學(xué)以某種方式解決了這個問題,而我們現(xiàn)在也用計算的方式解決了它。我認為之所以可能,是因為自然界中的系統(tǒng)是有結(jié)構(gòu)的,它們受到了進化過程的塑造。如果這是真的,那么你或許就可以學(xué)習(xí)到那個結(jié)構(gòu)是什么。
Lex Fridman:我認為這個視角非常有趣。你暗示了一點——任何可以被演化出來的東西,都可以被有效地建模。你覺得這個說法有道理嗎?
Demis Hassabis:是的。我有時稱之為“最穩(wěn)定者生存”之類的。當(dāng)然,有生命體的進化,但也有地質(zhì)時間尺度的演化,比如山脈的形狀,那是幾千年來風(fēng)化過程塑造的結(jié)果。你甚至可以把它擴展到宇宙學(xué),行星的軌道,小行星的形狀。這些都經(jīng)受住了作用于其上的各種過程的考驗。
如果這是真的,那么應(yīng)該就存在某種模式,你可以反向?qū)W習(xí),或者說一個“流形”(manifold),能幫助你搜索到正確的解決方案、正確的形狀,并讓你能夠以一種高效的方式預(yù)測它的相關(guān)信息,因為它不是一個隨機的模式。所以,對于人造的東西或者抽象的東西,比如大數(shù)分解,這可能就不適用了。除非數(shù)字空間中存在模式——也許有,但如果沒有,而且是均勻分布的,那就沒有模式可以學(xué)習(xí),沒有模型能幫助你搜索。所以你只能進行暴力搜索。那種情況下,你可能需要一臺量子計算機之類的。但我們感興趣的大多數(shù)自然界的事物都不是那樣的。它們有結(jié)構(gòu),是出于某種原因演化而來并隨著時間存活下來的。如果這是真的,我認為這很可能可以被一個神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到。
Lex Fridman:就好像大自然在進行一個搜索過程,而在這個搜索過程中,它創(chuàng)造出了可以被高效建模的系統(tǒng),這太有趣了。
Demis Hassabis:沒錯。是的。所以它們可以被高效地重新發(fā)現(xiàn)或恢復(fù),因為大自然不是隨機的。我們周圍看到的一切,包括那些更穩(wěn)定的元素,所有這些東西,都受到了某種選擇過程的壓力。
![]()
「計算與 P vs NP 問題」
Lex Fridman:因為你也是理論計算機科學(xué)和復(fù)雜性理論的愛好者,你覺得我們能提出一個新的復(fù)雜性類別嗎?就像復(fù)雜性動物園里的那種類別,也許叫“可學(xué)習(xí)自然系統(tǒng)集”(LNS)。這是一個 Demis Hassabis 提出的新系統(tǒng)類別,可以被經(jīng)典系統(tǒng)以這種方式學(xué)習(xí),也就是可以被高效建模的自然系統(tǒng)。
Demis Hassabis:是的,我一直對 P 是否等于 NP 這個問題很著迷,以及什么東西可以被經(jīng)典系統(tǒng)——也就是非量子系統(tǒng)——實際上就是圖靈機來建模。
![]()
這正是我在業(yè)余時間里和幾個同事一起研究的東西,我們是否應(yīng)該有一個新的類別或問題,可以通過這種神經(jīng)網(wǎng)絡(luò)過程來解決,并映射到這些自然系統(tǒng)上,也就是那些存在于物理世界中有結(jié)構(gòu)的東西。所以我認為這可能是一種非常有趣的新思考方式。這也符合我對物理學(xué)的普遍看法,那就是我認為信息是第一位的,信息是宇宙最基本的單位,比能量和物質(zhì)更基本。我認為它們都可以相互轉(zhuǎn)換,但我把宇宙看作是一個信息系統(tǒng)。
Lex Fridman:所以當(dāng)你把宇宙看作一個信息系統(tǒng)時,P 是否等于 NP 就是一個物理問題,而且是一個能幫助我們最終解決這整個世界運行機制的問題。
Demis Hassabis:是的,我認為如果你把物理學(xué)看作是信息性的,那么這實際上是最基本的問題之一,而它的答案,我認為將會非常有啟發(fā)性。
Lex Fridman:更具體地談?wù)?P 和 NP 的問題,我們現(xiàn)在說的有些東西聽起來有點瘋狂,就像克里斯蒂安·安芬森(Christian Anfinsen)諾貝爾獎演講中說的那個聽起來很瘋狂的爭議性言論,然后你和約翰·江珀(John Jumper)就因為這個獲得了諾貝爾獎,解決了那個問題。所以我就繼續(xù)談 P 是否等于 NP。你認為在我們討論的這個事情中,有沒有可能證明,如果你能預(yù)先進行類似多項式時間或常數(shù)時間的計算,構(gòu)建一個巨大的模型,然后你就能以一種理論計算機科學(xué)的方式解決一些極其困難的問題?
Demis Hassabis:是的,我認為有很大一類問題可以用這種方式來表述,就像我們做 AlphaGo 和 AlphaFold那樣。對系統(tǒng)的動態(tài)、該系統(tǒng)的特性、試圖理解的環(huán)境進行建模,然后這使得尋找解決方案或預(yù)測下一步變得高效。基本上是多項式時間,也就是經(jīng)典系統(tǒng)(神經(jīng)網(wǎng)絡(luò)就是其中之一,它在普通計算機上運行,實際上就是圖靈機)可以處理的。我認為這是最有趣的問題之一,就是這種范式能走多遠。
我認為我們已經(jīng)證明了,而且整個 AI 社區(qū)也證明了,經(jīng)典系統(tǒng),也就是圖靈機,能做的比我們之前想象的要多得多。它們可以做一些事情,比如模擬蛋白質(zhì)的結(jié)構(gòu),以及下圍棋達到比世界冠軍更高的水平。很多人在 10 年、20 年前可能會認為這還需要幾十年,或者可能需要某種量子機器才能做像蛋白質(zhì)折疊這樣的事情。所以我認為,我們甚至還沒有觸及所謂經(jīng)典系統(tǒng)(圖靈機)能做的表面。
當(dāng)然,在一個經(jīng)典計算機之上,再在一個神經(jīng)網(wǎng)絡(luò)系統(tǒng)之上,再建立一個通用人工智能(AGI),將是這種能力的終極體現(xiàn)。我認為這種系統(tǒng)的極限,它能做什么,是一個非常有趣的問題,并且直接關(guān)系到 P 是否等于 NP 的問題。
Lex Fridman:你認為,假設(shè)一下,什么可能會超出這個范圍?也許是涌現(xiàn)現(xiàn)象?如果你看細胞自動機,你有一些極其簡單的系統(tǒng),然后會出現(xiàn)一些復(fù)雜性。也許那會超出范圍,或者你甚至猜測,連那個都可能適合用經(jīng)典機器進行高效建模?
Demis Hassabis:是的,我認為那些系統(tǒng)會正好在邊界上。所以我認為大多數(shù)涌現(xiàn)系統(tǒng),比如細胞自動機之類的,都可以被經(jīng)典系統(tǒng)建模。你只需要對它進行一個前向模擬,而且效率可能足夠高。當(dāng)然,還有像混沌系統(tǒng)這樣的問題,初始條件非常重要,然后你會得到一些不相關(guān)的最終狀態(tài)。那些可能就難以建模了。所以我認為這些都是懸而未決的問題,但當(dāng)你退一步看我們用這些系統(tǒng)所做的事情和解決的問題,再看看像視頻生成領(lǐng)域的 Veo 3,它能渲染物理、光照等等,這些物理學(xué)中非常核心和基礎(chǔ)的東西,這真的很有趣。在我看來,這告訴了我們一些關(guān)于宇宙結(jié)構(gòu)相當(dāng)根本的東西。在某種程度上,這就是我想要構(gòu)建 AGI 的原因,是為了幫助我們作為科學(xué)家來回答像 P 是否等于 NP 這樣的問題。
Lex Fridman:是的,我認為我們可能會不斷地對經(jīng)典計算機能建模的東西感到驚訝。我的意思是,AlphaFold 3 在相互作用方面的進展令人驚訝,你居然能在這方面取得任何進展。AlphaGenome 能夠?qū)⑦z傳密碼映射到功能,也令人驚訝。就像在玩弄涌現(xiàn)現(xiàn)象一樣,你覺得有那么多的組合選項,然后你竟然能找到那個可以被高效建模的核心。
Demis Hassabis:是的,因為存在某種結(jié)構(gòu),在能量景觀或其他什么東西中,你可以遵循某種梯度。當(dāng)然,神經(jīng)網(wǎng)絡(luò)非常擅長遵循梯度。所以如果有一個梯度可以遵循,并且你能正確地設(shè)定目標函數(shù),你就不需要處理所有那些復(fù)雜性,而這可能正是我們幾十年來天真地思考這些問題的方式。如果你只是列舉所有可能性,它看起來完全是無法處理的,而且有很多很多這樣的問題。
然后你會想,“嗯,蛋白質(zhì)結(jié)構(gòu)可能有 10 的 300 次方種,圍棋棋局可能有 10 的 170 次方種。所有這些都遠遠超過宇宙中的原子數(shù)量,所以怎么可能找到正確的解決方案或預(yù)測下一步呢?” 但事實證明這是可能的。當(dāng)然,現(xiàn)實中的自然界確實做到了。蛋白質(zhì)確實會折疊。所以這給了你信心,如果我們理解了物理學(xué)在某種意義上是如何做到的,并且我們能夠模仿那個過程,也就是對那個過程進行建模,那么它在我們的經(jīng)典系統(tǒng)上應(yīng)該是可能的,這基本上就是這個猜想的核心。
Lex Fridman:當(dāng)然還有非線性動力系統(tǒng),高度非線性動力系統(tǒng),所有涉及流體的東西。我最近和陶哲軒(Terence Tao)有過一次對話,他在數(shù)學(xué)上處理的是那些系統(tǒng)中存在某種奇點,從而破壞了數(shù)學(xué)理論的非常困難的方面,對于我們?nèi)祟悂碚f,要對高度非線性動力系統(tǒng)做出任何清晰的預(yù)測都很難。但再次回到你的觀點,我們可能會對經(jīng)典學(xué)習(xí)系統(tǒng)甚至在流體方面能做些什么感到非常驚訝。
Demis Hassabis:是的,完全正確。我的意思是,流體動力學(xué),納維-斯托克斯方程,這些傳統(tǒng)上被認為是經(jīng)典系統(tǒng)上非常非常困難、棘手的問題。它們需要巨大的計算量,比如天氣預(yù)測系統(tǒng)。這類事情都涉及到流體動力學(xué)計算。
但再次,如果你看看像 Veo 這樣的東西,我們(谷歌)的視頻生成模型,它能夠相當(dāng)好地模擬液體,好得令人驚訝。還有材料,鏡面光照,我最喜歡的是那些人們生成的視頻,里面有透明液體通過液壓機,然后被擠壓出來。我早期在游戲行業(yè)的時候?qū)戇^物理引擎和圖形引擎,我知道構(gòu)建能做到這一點的程序是多么艱苦。然而,這些系統(tǒng)不知何故僅僅通過觀看 YouTube 視頻就逆向工程出了這些。所以,可以推測,發(fā)生的事情是它正在提取關(guān)于這些材料行為方式的一些潛在結(jié)構(gòu)。所以,如果我們真正完全理解了其內(nèi)部機制,也許存在某種可以被學(xué)習(xí)的低維流形。這也許對現(xiàn)實的大部分都是如此。
![]()
「Veo 3 與理解現(xiàn)實」
Lex Fridman:我一直對 Veo 3 的這方面能力感到特別驚訝。我認為很多人強調(diào)了它的不同方面,包括喜劇性和模因(meme)之類的東西。然后是它以一種引人注目、感覺接近現(xiàn)實的方式捕捉人類的超現(xiàn)實能力,并將其與原生音頻相結(jié)合。
所有這些都是 Veo 3 了不起的地方,但正是你提到的這一點,也就是物理學(xué)。它并不完美,但已經(jīng)相當(dāng)不錯了。
![]()
然后,真正有趣的科學(xué)問題是,為了能夠做到這一點,它理解了我們世界的什么?因為如果持憤世嫉俗的看法,用擴散模型,它不可能理解任何東西。但我認為,如果不去理解,你是不可能生成那種視頻的。然后,我們自己關(guān)于“理解”意味著什么的哲學(xué)觀念就被推到了前臺。你認為 Veo 3 在多大程度上理解了我們的世界?
Demis Hassabis:我認為,在它能夠以連貫的方式預(yù)測下一幀畫面的程度上,這是一種理解形式,而不是擬人化的那種,它不是對正在發(fā)生的事情有什么深刻的哲學(xué)理解,我不認為這些系統(tǒng)有那個。但它們肯定已經(jīng)對動態(tài)進行了足夠的建模,可以這么說,它們可以非常準確地生成任何東西,比如八秒鐘的連貫視頻,至少乍一看,很難分辨出問題所在。
想象一下再過兩三年,這才是我正在思考的事情,鑒于我們一兩年前從它的早期版本走過來的歷程,那將會是多么不可思議。所以進展的速度是驚人的。我認為我和你一樣,很多人喜歡所有那些喜劇演員的視頻,那確實很好地捕捉了很多人類動態(tài)和肢體語言,但實際上我最印象深刻和著迷的是物理行為,光照、材料和液體。它能做到這一點,真的非常了不起。我認為這表明它至少對直覺物理學(xué)有一定的概念,也就是事物直覺上應(yīng)該如何運作,也許就像一個人類兒童理解物理學(xué)的方式,而不是一個博士生能真正解構(gòu)所有方程。這更像是一種直覺物理學(xué)的理解。
Lex Fridman:嗯,那種直覺物理學(xué)的理解,那是基礎(chǔ)層,是人們有時稱之為常識的東西。它確實理解了某些東西。我認為這真的讓很多人感到驚訝。我簡直不敢相信,不通過理解就能生成那種程度的真實感,這讓我大開眼界。有一種觀念認為,你只有通過一個具身 AI 系統(tǒng),一個與那個世界互動的機器人,才能理解物理世界。那是構(gòu)建對那個世界理解的唯一途徑。但 Veo 3 似乎直接在挑戰(zhàn)這一點。
Demis Hassabis:是的,這非常有趣,即使你在五、十年前問我,盡管我當(dāng)時就沉浸在所有這些之中,我也會說,“嗯,是的,你可能需要理解直覺物理學(xué)。如果我把這個玻璃杯從桌子上推下去,它可能會碎,液體會灑出來。所以我們都知道這些事情。” 但我當(dāng)時認為,而且神經(jīng)科學(xué)中有很多理論,被稱為“感知中的行動”(action in perception),即你需要通過在世界中行動來真正深入地感知它。有很多理論認為你需要具身智能或機器人之類的東西,或者至少是模擬的行動,這樣你才能理解像直覺物理學(xué)這樣的東西。
但現(xiàn)在看來,你似乎可以通過被動觀察來理解它,這對我來說相當(dāng)驚訝。而且,我認為這再次暗示了現(xiàn)實本質(zhì)的一些深層?xùn)|西,而不僅僅是它生成的那些酷炫視頻。當(dāng)然,接下來的階段甚至可能是讓那些視頻變得可交互,這樣人們就可以真正地走進它們,在里面移動,那將是真正令人震撼的,特別是考慮到我的游戲背景。所以你可以想象。然后我認為我們開始接近我所說的世界模型——一個關(guān)于世界如何運作的模型,世界的機制,世界的物理學(xué),以及那個世界中的事物。當(dāng)然,這正是一個真正的 AGI 系統(tǒng)所需要的。
![]()
「電子游戲的未來」
Lex Fridman:我必須和你聊聊電子游戲。一個叫 Jimmy Apples 的用戶發(fā)推說:“快讓我玩上我用 Veo 3 生成的視頻游戲吧。谷歌做得太棒了。可玩的世界模型什么時候出?”
![]()
然后你轉(zhuǎn)發(fā)了這條推文并評論說:“那該有多好啊?”
![]()
由你親自說這種話,讓我第一眼還以為是網(wǎng)絡(luò)串子發(fā)的評論。所以,用 AI 構(gòu)建游戲世界到底有多難?或許你能展望一下未來五到十年的電子游戲會是什么樣子?
Demis Hassabis:嗯,游戲可以說是我最初的摯愛。為游戲做 AI 是我青少年時期第一份專業(yè)工作,也是我構(gòu)建的第一個主要 AI 系統(tǒng)。我總想著有一天要重拾舊夢,回到那個領(lǐng)域。我想我會的,而且我在想,如果回到九十年代,我能擁有今天我們這樣的 AI 系統(tǒng),我會做出什么樣的東西?我認為你可以做出絕對令人震撼的游戲。
我認為下一個階段是……我一直喜歡制作開放世界游戲,我做的所有游戲都是這種類型。它們是有模擬環(huán)境,里面有 AI 角色,然后玩家與那個模擬環(huán)境互動,模擬環(huán)境會根據(jù)玩家的玩法進行調(diào)整。
![]()
我一直覺得那是最好玩的游戲,因為——比如我參與過的《主題公園》(Theme Park)——每個人的游戲體驗都是獨一無二的,因為你是在共同創(chuàng)造游戲。我們設(shè)定參數(shù),設(shè)定初始條件,然后你作為玩家沉浸其中,你和模擬環(huán)境一起共同創(chuàng)造它。但當(dāng)然,編程開放世界游戲是非常困難的。無論玩家走向哪個方向,你都必須能夠創(chuàng)造內(nèi)容,而且無論玩家選擇什么,你都希望它引人入勝。所以構(gòu)建像細胞自動機那樣的經(jīng)典系統(tǒng)總是很困難,它們能創(chuàng)造一些涌現(xiàn)行為,但總是有點脆弱,有點局限。
現(xiàn)在,在未來幾年,五到十年內(nèi),我們可能即將擁有能夠真正圍繞你的想象力進行創(chuàng)作的 AI 系統(tǒng),能夠動態(tài)地改變故事,圍繞你的選擇來講述敘事,并讓它無論你最終選擇什么都充滿戲劇性。這就像是終極版的“選擇你自己的冒險”游戲。我認為我們也許觸手可及了,如果你想象一個 Veo 的交互版本,然后再把它快進五到十年,想象一下它會有多棒。
Lex Fridman:是的。你剛才說了很多非常有趣的東西。
第一,開放世界,其中內(nèi)含了你所描述的深度個性化。所以它不僅僅是開放世界,你可以打開任何一扇門,后面都會有東西,而是你以一種不受限制的方式選擇打開哪扇門,這定義了你所看到的世界。有些游戲試圖做到這一點,它們給你選擇,但那真的只是選擇的幻覺——這有點像《史丹利的寓言》(Stanley Parable),我玩過的一個游戲,它真的只有幾扇門,然后把你帶入一個敘事。Stanley Parable 是一款很棒的電子游戲,我推薦大家去玩,它以一種元(meta)的方式,嘲弄了選擇的幻覺,其中還有關(guān)于自由意志等的哲學(xué)概念。
![]()
但我最喜歡的《上古卷軸》游戲之一是《匕首雨》(Daggerfall),我認為他們真的玩轉(zhuǎn)了地牢的隨機生成,如果你能走進去,他們會給你一種開放世界的感覺。你提到了交互性。你不需要太多交互。那只是第一步,因為你不需要那么多交互。你只需要,當(dāng)你打開門時,你看到的一切都是為你隨機生成的。那已經(jīng)是一種不可思議的體驗了,因為你可能是唯一一個看到那個場景的人。
![]()
Demis Hassabis:是的,完全正確。但你想要的不僅僅是隨機生成。你想要,也比簡單的 A/B 硬編碼選擇要好,對吧?那不是真正的開放世界,就像你說的。它只是給你選擇的幻覺。你想要的是能夠在那樣的游戲環(huán)境中做任何可能的事情。我認為唯一能做到這一點的方法就是擁有生成式系統(tǒng),能夠即時生成內(nèi)容的系統(tǒng)。當(dāng)然,你不可能創(chuàng)造無限的游戲資產(chǎn)。現(xiàn)在AAA游戲的制作方式已經(jīng)夠昂貴的了。這在九十年代我做這些游戲的時候就很明顯了。
我想《黑與白》(Black & White)可能是我早期參與制作的游戲中,擁有至今為止最好的學(xué)習(xí)型 AI 的游戲。它是一個早期的強化學(xué)習(xí)系統(tǒng),你在游戲中照顧一個神話生物,培育它,滋養(yǎng)它。根據(jù)你對待它的方式,它會以同樣的方式對待那個世界里的村民。所以如果你對它刻薄,它就會變得刻薄。如果你對它好,它就會有保護欲。所以它實際上是你玩法的一種反映。所以實際上,我職業(yè)生涯的開端,就是通過游戲這個媒介來做模擬和 AI,而我今天所做的一切,仍然是那些早期更偏向硬編碼 AI 方式的延續(xù),現(xiàn)在則是完全通用的學(xué)習(xí)系統(tǒng),試圖實現(xiàn)同樣的目標。
Lex Fridman:是的,看著你和埃隆(馬斯克)都明顯地渴望創(chuàng)造游戲,這很有趣,也很搞笑,因為你們都是游戲玩家。你能在這么多科學(xué)領(lǐng)域,那些嚴肅的成年人的事情上取得如此不可思議的成功,其中一個可悲的方面可能是,你可能沒有時間真正去創(chuàng)造一款游戲,你最終可能會創(chuàng)造出讓別人來創(chuàng)造游戲的工具。你不得不看著別人創(chuàng)造出你一直夢想的東西。你認為在你極其繁忙的日程中,有沒有可能擠出時間來創(chuàng)造像《黑與白》那樣的東西,一款真正的電子游戲,讓你能把童年的夢想變成現(xiàn)實?
Demis Hassabis:嗯,關(guān)于這個我想到兩點。也許隨著“氛圍編程”(vibe coding)越來越好,我有可能在業(yè)余時間做到這一點。所以我對此很興奮,如果我有時間做一些氛圍編程,那將是我的項目。我真的渴望做這件事。另一件事是,也許是在 AGI 被安全地引導(dǎo)并交付給世界之后,來一個學(xué)術(shù)休假。然后,就像我們開頭談到的,研究我的物理學(xué)理論。這會是我的兩個“ 后 AGI”項目,就先這么叫吧。
Lex Fridman:我很想看看你會選哪個,是解決人類歷史上一些最聰明的人都在努力解決的問題,P 是否等于 NP,還是創(chuàng)造一款酷炫的電子游戲。
Demis Hassabis:但在我的世界里,它們是相關(guān)的,因為它會是一款盡可能真實的開放世界模擬游戲。那么宇宙是什么?這和 P 是否等于 NP 說的是同一個問題。我認為所有這些事情都是相關(guān)的,至少在我腦子里是這樣。
Lex Fridman:我的意思是,很嚴肅地說,電子游戲有時被看作只是一種有趣的業(yè)余活動。但特別是當(dāng) AI 做了越來越多困難、無聊的任務(wù),也就是我們現(xiàn)代世界所說的“工作”時,電子游戲可能就是我們尋找意義、打發(fā)時間的地方。你可以創(chuàng)造出極其豐富、有意義的體驗。這就是人類生活。然后在電子游戲中,你可以創(chuàng)造出更復(fù)雜、更多樣的生活方式。對吧?這才是重點?
Demis Hassabis:我想是的。我的意思是,對于我們這些熱愛游戲的人來說,我現(xiàn)在仍然熱愛,它幾乎可以讓你的想象力自由馳騁,對吧?我過去非常喜歡游戲和做游戲,因為它是一種融合,特別是在九十年代和二十一世紀初,那個游戲產(chǎn)業(yè)的黃金時代,或許還有八十年代。那時一切都在被發(fā)現(xiàn)。新的類型正在被發(fā)現(xiàn)。我們不只是在做游戲,我們感覺我們正在創(chuàng)造一種前所未有的新的娛樂媒介。特別是那些開放世界游戲和模擬游戲,你作為玩家,共同創(chuàng)造故事。沒有其他任何媒體,娛樂媒體,你能做到這一點,你作為觀眾,實際上共同創(chuàng)造了故事。
當(dāng)然現(xiàn)在還有多人游戲,它可以是一種非常社交的活動,可以在其中探索各種有趣的世界。但另一方面,享受和體驗物理世界也非常重要。但問題是,那么我想我們將不得不再次面對這個問題,那就是現(xiàn)實的根本性質(zhì)是什么?這些日益逼真的模擬,多人游戲,涌現(xiàn)現(xiàn)象,和我們在現(xiàn)實世界中所做的事情,區(qū)別將是什么?
Lex Fridman:是的,體驗真實世界、大自然顯然有巨大的價值。親自直接體驗其他人類,就像我們今天坐在這里一樣,也有巨大的價值,但我們需要真正科學(xué)地、嚴謹?shù)鼗卮鹨粋€問題:為什么?以及這其中的哪個方面可以被映射到虛擬世界中。
Demis Hassabis:完全正確。
Lex Fridman:僅僅說“是啊,你應(yīng)該去接觸大自然,多在戶外活動”是不夠的。問題是,這究竟為什么有價值?
Demis Hassabis:是的。我猜這可能就是從我職業(yè)生涯開始就一直困擾我或癡迷我的事情。如果你想想我做過的所有不同的事情,它們都以那種方式相關(guān)聯(lián)。模擬、現(xiàn)實的本質(zhì),以及可被建模的邊界是什么。
Lex Fridman:到目前為止,史上最偉大的電子游戲是什么?有哪些可以排得上號?
Demis Hassabis:我個人最喜歡的是《文明》(Civilization)。我得說,《文明 1》和《文明 2》是我最喜歡的游戲。
![]()
Lex Fridman:我只能假設(shè)你刻意避開了最新的一代,因為它可能會需要你請個長假去玩。
Demis Hassabis:是的,完全正確。這些《文明》游戲很花時間,所以我得小心點。
Lex Fridman:一個有趣的問題。你和埃隆似乎都是鐵桿游戲玩家。在游戲方面表現(xiàn)出色和成為 AI 公司的優(yōu)秀領(lǐng)導(dǎo)者之間,有什么聯(lián)系嗎?
Demis Hassabis:我不知道。這是一個有趣的問題。我的意思是,我們都喜歡游戲,而且有趣的是,他一開始也是寫游戲的。可能,特別是在我成長的那個時代,家用電腦剛剛成為一種事物,在八十年代末和九十年代,尤其是在英國,我有一臺 Spectrum,然后是一臺 Commodore Amiga 500,那是我最喜歡的電腦。我的所有編程都是在那上面學(xué)的。當(dāng)然,編程游戲是一件非常有趣的事情。所以我認為這是學(xué)習(xí)編程的一個很好的方式,可能現(xiàn)在仍然是。然后,我立刻把它帶到了 AI 和模擬的方向,所以我能夠?qū)⑽覍τ螒虻呐d趣和我更廣泛的科學(xué)興趣結(jié)合在一起。
然后我認為關(guān)于游戲的最后一件事是,它融合了藝術(shù)設(shè)計、藝術(shù)和最前沿的編程。所以再次,在九十年代,所有最有趣的技術(shù)進步都發(fā)生在游戲領(lǐng)域,無論是 AI、圖形、物理引擎、硬件,甚至 GPU 當(dāng)然最初也是為游戲設(shè)計的。所以九十年代推動計算向前發(fā)展的一切都歸功于游戲。所以有趣的是,那正是研究前沿所在的地方,而且它與藝術(shù)有著不可思議的融合。圖形,還有音樂,以及全新的敘事媒體。我喜歡那個。對我來說,這種跨學(xué)科的努力再次是我一生都享受的事情。
![]()
「AlphaEvolve:AI 驅(qū)動的算法進化」
Lex Fridman:我必須問你,我差點忘了最近眾多不可思議的成果中,有一個可能還沒得到足夠關(guān)注的,那就是 AlphaEvolve。我們之前談到了一點進化,但這是谷歌 DeepMind 的一個可以進化算法的系統(tǒng)。這類類進化技術(shù)作為未來超級智能系統(tǒng)的一個組成部分,有前景嗎?對于不了解的人來說,我不知道說它是 LLM 引導(dǎo)的進化搜索是否公平,因為進化算法在做搜索,而 LLM 在告訴你去哪里搜。
Demis Hassabis:完全正確。所以 LLM 有點像在提出一些可能的解決方案,然后你在此基礎(chǔ)上使用進化計算來尋找搜索空間中一些新穎的部分。所以我實際上認為這是一個非常有前景的方向的例子,你將 LLM 或基礎(chǔ)模型與其他計算技術(shù)相結(jié)合。進化方法是一種,但你也可以想象蒙特卡洛樹搜索。基本上,許多類型的搜索算法或推理算法,都是建立在或使用基礎(chǔ)模型作為基礎(chǔ)之上的。所以我實際上認為,用這種所謂的混合系統(tǒng),可能會發(fā)現(xiàn)很多有趣的東西。
Lex Fridman:但不要把進化浪漫化。
Demis Hassabis:是的。
Lex Fridman:你認為那個機制中有什么價值嗎?因為我們已經(jīng)談到了自然系統(tǒng)。你認為我們理解、能夠建模、能夠模擬進化,然后利用我們對那個受自然啟發(fā)的機制的理解,來把搜索做得越來越好,這方面還有很多唾手可得的成果嗎?
Demis Hassabis:是的。所以如果你想,再次,把我們構(gòu)建的系統(tǒng)分解到它們真正最基本的核心,你有底層系統(tǒng)動態(tài)的模型。然后,如果你想發(fā)現(xiàn)一些新的、前所未見的東西,那么你就需要在上面有一個某種搜索過程,把你帶到搜索空間的一個新穎部分。你可以用很多種方式來做到這一點。進化計算是一種。對于 AlphaGo,我們只用了蒙特卡洛樹搜索,正是它發(fā)現(xiàn)了第 37 手,那個圍棋中前所未見的全新策略。所以這就是你如何能夠超越已知的東西。所以模型可以模擬你目前所知的一切,你目前擁有的所有數(shù)據(jù)。但是你如何超越那些呢?這就開始談到創(chuàng)造力的想法了。
![]()
這些系統(tǒng)如何能創(chuàng)造出新的東西?實際上是發(fā)現(xiàn)新的東西?顯然,這對于科學(xué)發(fā)現(xiàn)或者推動醫(yī)學(xué)科學(xué)向前發(fā)展非常重要,這也是我們希望用這些系統(tǒng)來做的。你實際上可以在這些模型之上附加一些相當(dāng)簡單的搜索系統(tǒng),然后把你帶到一個新的空間區(qū)域。當(dāng)然,你也要確保你不是完全隨機地搜索那個空間。它太大了。所以你必須有一個你試圖優(yōu)化的目標函數(shù),然后朝著那個目標函數(shù)進行爬山搜索,這會引導(dǎo)那個搜索。
Lex Fridman:但是進化的一些機制很有趣,也許在程序空間里。但是程序空間是一個極其重要的空間,因為你可能可以把它推廣到一切事物上。但比如說,突變。所以它不僅僅是蒙特卡洛樹搜索那樣的搜索。你可以偶爾……
Demis Hassabis:組合事物。
Lex Fridman:所以進化真正擅長的不僅僅是自然選擇,它還擅長組合事物和構(gòu)建日益復(fù)雜的層級系統(tǒng)。所以那個組成部分超級有趣,特別是對于 AlphaEvolve 和程序空間。
Demis Hassabis:是的,完全正確。所以你可以從進化系統(tǒng)中獲得一些額外的屬性,也就是可能會出現(xiàn)一些新的涌現(xiàn)能力,對吧?當(dāng)然就像生命那樣。有趣的是,對于沒有 LLM 和現(xiàn)代 AI 的傳統(tǒng)樸素進化計算方法,它們的問題是,它們在九十年代和二十一世紀初被很好地研究過,也取得了一些有希望的結(jié)果,但問題是它們永遠無法搞清楚如何進化出新的屬性,新的涌現(xiàn)屬性。你總是得到你放入系統(tǒng)中的屬性的一個子集,但也許如果我們把它們和這些基礎(chǔ)模型結(jié)合起來,也許我們能克服那個限制。
很明顯,自然進化確實做到了。它確實進化出了新的能力。從細菌到我們現(xiàn)在的樣子。所以很明顯,用進化系統(tǒng)來生成新的模式,回到我們談到的第一件事,以及新的能力和涌現(xiàn)屬性,這一定是可能的,也許我們正處在發(fā)現(xiàn)如何做到這一點的風(fēng)口浪尖上。
![]()
Lex Fridman:AlphaEvolve 是我見過的最酷的東西之一。我家里書桌上,我大部分時間都花在那臺電腦上編程。在三個屏幕旁邊,有一個提塔利克魚(Tiktaalik)的頭骨,它是早期從水里爬上陸地的生物之一。我就看著那個小家伙。進化論的競爭機制真是不可思議。現(xiàn)在,這是否正是我們需要做的事情來做我們的搜索,但永遠不要忽視自然的力量,它在這里所做的一切。
Demis Hassabis:而且這很了不起,它是一個相對簡單的算法,對吧?實際上,它能生成所有這些巨大的復(fù)雜性涌現(xiàn),當(dāng)然是在 40 億年的時間里運行的。但你可以把它想象成,一個在宇宙的物理基底上運行了很長計算時間的搜索過程,但它卻生成了所有這些不可思議的豐富多樣性。
![]()
「Al 的品味與審美」
Lex Fridman:我想問你很多問題。其中一個,你有一個夢想,你想嘗試建模的自然系統(tǒng)之一是細胞。那是一個美麗的夢想。我可以問你關(guān)于那個的問題。我也想就這個目的,在 AI 科學(xué)家這個更廣泛的層面上問一下。有一篇來自 Daniel Kokotajlo 、Scott Al exander 等人的文章,里面提到了通往 ASI(人工超級智能)路上的很多步驟,其中有很多有趣的想法,包括一個超人程序員和一個超人 AI 研究員。
![]()
其中有一個叫 “研究品味”(R esearch taste )的詞很有意思。那么,在你所看到的一切中,你認為 AI 系統(tǒng)有可能擁有研究品味,以一種 AI 合作科學(xué)家的形式幫助你,幫助引導(dǎo)杰出的人類科學(xué)家,然后可能自己去找出哪些是你想生成真正新穎想法的方向嗎?這似乎是做好科學(xué)研究的一個非常重要的組成部分?
Demis Hassabis:是的,我認為這將是最難模仿或建模的事情之一,就是這種品味或判斷力的想法。我認為這是區(qū)分偉大科學(xué)家和優(yōu)秀科學(xué)家的東西。所有專業(yè)科學(xué)家在技術(shù)上都很好,否則他們不會在學(xué)術(shù)界走那么遠。但是,你是否有品味去嗅出正確的方向,正確的實驗,正確的問題?所以,選擇正確的問題是科學(xué)最難的部分,提出正確的假設(shè)也是。而這正是今天的系統(tǒng)絕對做不到的。
所以我常說,提出一個好的猜想,一個真正好的猜我比解決它更難。我們可能很快就會有能解決相當(dāng)難的猜想的系統(tǒng)。數(shù)學(xué)奧林匹克問題,去年我們的 AlphaProof 系統(tǒng)在那里面拿了銀牌,那些問題真的很難。也許最終我們會解決一個千禧年大獎難題。但是,一個系統(tǒng)能提出一個值得研究的猜想,一個像陶哲軒那樣的人會覺得,“你知道嗎,這是一個關(guān)于數(shù)學(xué)本質(zhì)或數(shù)字本質(zhì)或物理學(xué)本質(zhì)的非常深刻的問題” 嗎?這是一種遠為困難的創(chuàng)造力。我們真的不知道。今天的系統(tǒng)顯然做不到那個。我們也不太清楚那個機制會是什么。
這種想象力的飛躍,就像愛因斯坦提出狹義相對論,然后是廣義相對論時,在他當(dāng)時所擁有的知識基礎(chǔ)上所做的那樣。
Lex Fridman:所以提出一個極其困難的東西很容易,提出一個極其容易的東西也很容易,但在那個非常邊緣的地帶……
Demis Hassabis:那個臨界點,基本上能推進科學(xué),理想情況下能把假設(shè)空間一分為二。無論它是真是假,你都學(xué)到了非常有用的東西,這很難。而且還要讓它可被證偽,并且在你當(dāng)前可用的技術(shù)范圍內(nèi)。所以這其實是一個非常有創(chuàng)造力的過程。一個高度創(chuàng)造性的過程,我認為僅僅在模型之上進行一種樸素的搜索是不足以做到這一點的。
Lex Fridman:把假設(shè)空間一分為二的想法非常有趣。我聽你說過,如果你把問題構(gòu)造得對,如果你把實驗設(shè)計得對,基本上就沒有失敗,或者說失敗非常有價值。失敗或成功都有用,也許是因為它把假設(shè)空間基本上分成了兩半,就像二分查找一樣?
Demis Hassabis:是的,沒 錯。所以當(dāng)你做真正的藍天研究(指的是 基礎(chǔ)研究的一個類別,它是“從 0 到 1”式的純基礎(chǔ)研究,不以任何專門或特定應(yīng)用或使用為目的,只是探索性的 )時,實際上沒有失敗這回事。
只要你選擇的實驗和假設(shè)能夠有意義地分割假設(shè)空間,你就學(xué)到了 東西。你可以從一個不起作用的實驗中學(xué)到同樣有價值的東西。如果你把實驗設(shè)計得好,而且你的假設(shè)有趣,它應(yīng)該能告訴你很多關(guān)于下一步該往哪里走的信息。然后你實際上就在做一個搜索過程,并且以非常有幫助的方式使用那些信息。
![]()
「模擬一個生物細胞的夢想」
Lex Fridman:回到你關(guān)于模擬一個細胞的夢想,要實現(xiàn)這個目標,我們面前有哪些大的挑戰(zhàn)?我們或許應(yīng)該強調(diào)一下,在 AlphaFold 中,有太多飛躍了。AlphaFold 解決了蛋白質(zhì)折疊問題。關(guān)于這一點,有很多不可思議的事情我們可以談,包括開源,你發(fā)布的所有東西。AlphaFold 3 正在做蛋白質(zhì)、RNA、DNA 的相互作用,這超級復(fù)雜和迷人。它適合建模。AlphaGenome 預(yù)測了小的基因變化,如果我們考慮單點突變,它們?nèi)绾闻c實際功能聯(lián)系起來。所以看起來它正在慢慢地向更復(fù)雜的東西,比如一個細胞,前進。但一個細胞有很多非常復(fù)雜的組成部分。
Demis Hassabis:我整個職業(yè)生涯都在做的一件事是,我有這些非常宏大的夢想,然后我試著,像你注意到的那樣,把它們分解。擁有一個瘋狂雄心勃勃的夢想很容易,但訣竅在于你如何把它分解成可管理的、可實現(xiàn)的、本身就有意義和用處的中期步驟。
所以,關(guān)于“虛擬細胞”(Virtual Cell),我這么稱呼這個模擬細胞的項目,我想做這個的想法大概有超過 25 年了。
我以前和保羅·納斯(Paul Nurse)聊過,他算是我在生物學(xué)上的導(dǎo)師。他創(chuàng)辦了克里克研究所(Crick Institute),并在 2001 年獲得了諾貝爾獎。我們從九十年代就開始討論這件事了,我每隔五年就會重新思考它。你需要什么才能模擬一個細胞的完整內(nèi)部結(jié)構(gòu),這樣你就可以在虛擬細胞上做實驗,而那些在計算機上(in silico)的實驗和預(yù)測,會對你很有用,能讓你在濕實驗室里節(jié)省大量時間。那將是夢想。
也許你可以通過把大部分搜索工作在計算機上完成,然后把驗證步驟放在濕實驗室里,從而將實驗速度提高 100 倍。這就是夢想。但也許現(xiàn)在,終于,我一直在嘗試構(gòu)建這些組件,AlphaFold 就是其中之一,它最終能讓你模擬一個細胞的完整相互作用,一個完整的模擬。我可能會從一個酵母細胞開始。部分原因是因為保羅·納斯研究過這個,因為酵母細胞像一個完整的生物體,它是一個單細胞。所以它是最簡單的那種單細胞生物體。所以它不僅僅是一個細胞,它是一個完整的生物體。
而且酵母被研究得很透徹。所以那會是一個很好的候選對象,用來做一個完整的模擬模型。現(xiàn)在AlphaFold 是關(guān)于靜態(tài)畫面的解決方案,一個蛋白質(zhì)的3D結(jié)構(gòu)是什么樣的?一個它的靜態(tài)畫面。但我們知道,生物學(xué)里所有有趣的事情都發(fā)生在動態(tài)中,在相互作用中,而這正是 AlphaFold 3 的第一個步驟,就是模擬那些相互作用。所以首先是成對的蛋白質(zhì)與蛋白質(zhì),蛋白質(zhì)與 RNA 和 DNA 的相互作用。但那之后的下一步將是模擬也許一整個通路,比如癌癥中涉及的 mTOR 通路之類的。然后最終你也許能夠模擬一整個細胞。
Lex Fridman:另外,這里還有另一個復(fù)雜性,就是細胞里的事情發(fā)生在不同的時間尺度上。這很棘手嗎?蛋白質(zhì)折疊超級快。我不知道所有的生物機制,但有些需要很長時間。所以相互作用的層次有不同的時間尺度,你必須能夠建模。
Demis Hassabis:所以那會很難。所以你可能需要幾個能夠在這種不同時間動態(tài)下相互作用的模擬系統(tǒng),或者至少也許它像一個層級系統(tǒng),這樣你可以在不同的時間階段上下跳轉(zhuǎn)。
Lex Fridman:所以你能避免……這里的挑戰(zhàn)之一是不要過度模擬,比如這里面任何東西的量子力學(xué)方面,對吧?你不想過度建模。你可以跳過,直接模擬那些能讓你對將要發(fā)生的事情有一個很好估計的非常高層次的東西。
Demis Hassabis:是的。所以當(dāng)你建模任何自然系統(tǒng)時,你都得做一個決定,你要建模的粒度截止水平是什么?然后它要能捕捉到你感興趣的動態(tài)。所以對于一個細胞,我希望那會是蛋白質(zhì)層面,而且我們不必深入到原子層面。所以當(dāng)然,那就是 AlphaFold 發(fā)揮作用的地方。所以那會是基礎(chǔ),然后你會構(gòu)建這些更高層次的模擬,把那些作為構(gòu)建塊,然后你得到涌現(xiàn)行為。
![]()
「探尋生命的起源」
Lex Fridman:你認為我們能模擬出生命的起源嗎?也就是說,能夠模擬從無生命有機體到第一個生命有機體的誕生?
Demis Hassabis:這是最深刻、最迷人的問題之一。我非常喜歡生物學(xué)的那個領(lǐng)域。有一些人,有一本尼克·萊恩(Nick Lane)寫的很棒的書,他是這個領(lǐng)域的頂尖專家之一,叫《進化的十大發(fā)明》(The Ten Great Inventions of Evolution)。我認為它非常棒。它也談到了“大過濾器”(great filters)可能是什么,它們是在我們之前還是在我們之后?我認為它們很可能在過去,如果你讀那本書,看看有任何生命存在的可能性是多么低。然后從單細胞到多細胞似乎是一個難以置信的巨大飛躍,在地球上好像花了一億年才做到,對吧?所以這顯示了它有多難。
Lex Fridman:對吧?細菌在很長一段時間里都過得非常開心。
Demis Hassabis:在它們不知何故捕獲了線粒體之前,它們過了很長一段時間,對吧?我看不出為什么 AI 不能在這方面提供幫助。某種模擬。再次,這有點像在一個組合空間中進行搜索的過程。這里有你開始時所有的化學(xué)湯,原始湯,也許是在地球上那些熱泉口附近。這里有一些初始條件。你能生成一個看起來像細胞的東西嗎?所以也許那會是虛擬細胞項目之后的下一個階段,就是像那樣的東西是如何從化學(xué)湯中涌現(xiàn)出來的?
Lex Fridman:嗯,如果能為生命的起源找到一個“第 37 手”,我會很喜歡的。我認為那是偉大的謎團之一。我認為最終我們會發(fā)現(xiàn)它們是一個連續(xù)體。在非生命和生命之間沒有一條線。但如果我們能讓它變得嚴謹。
Demis Hassabis:是的。
Lex Fridman:從大爆炸到今天,一直都是同一個過程。如果你能打破我們在腦海中構(gòu)建的那堵墻,那堵關(guān)于從非生命到生命的真正起源的墻,而且它不是一條線,而是一個連接物理、化學(xué)和生物學(xué)的連續(xù)體。沒有那條線。
Demis Hassabis:我的意思是,這就是我一生都在研究 AI 和 AGI 的全部原因,因為我認為它可以成為幫助我們回答這類問題的終極工具。
我真的不明白為什么普通人不多關(guān)心這些事。我們怎么能對生命和非生命沒有一個好的定義,對時間的本質(zhì),更不用說意識和引力,以及所有這些量子力學(xué)的怪異之處?對我來說,這就像一直在我的臉上尖叫,而且聲音越來越大。就像是,這里到底發(fā)生了什么?我指的是更深層次的意義,現(xiàn)實的本質(zhì),那必須是能回答所有這些問題的終極問題。如果你想一想,這有點瘋狂。我們可以一直盯著彼此和所有這些生物。我們可以用顯微鏡檢查它,把它幾乎拆解到原子層面。然而我們?nèi)匀粺o法以一種簡單的方式清楚地回答那個問題。那個如何定義生命的問題。這有點不可思議。
Lex Fridman:是的,生命,你還可以自圓其說不去想它。但意識,我們有這個非常明顯的主觀意識體驗,就像我們是自己世界的中心,感覺像是什么。然后你怎么能不為這所有的謎團而尖叫呢?我的意思是,但實際上人類在很長很長一段時間里都在與他們周圍世界的謎團作斗爭……有很多謎團,比如太陽和雨是怎么回事?那是什么?然后去年我們雨水很多,今年我們沒雨水。我們做錯了什么?人類在很長一段時間里都在問這個問題。
Demis Hassabis:完全正確。所以我猜我們已經(jīng)發(fā)展出很多機制來應(yīng)對這些我們能看到但無法完全理解的深層謎團,我們只能繼續(xù)過日常生活。我們在某種程度上讓自己保持忙碌。在某種程度上,我們是不是讓自己分心了?
Lex Fridman:我的意思是,天氣是人類歷史上最重要的問題之一。我們至今,天氣仍然是閑聊的首選話題。
Demis Hassabis:是的。尤其是在英國。
Lex Fridman:然后,眾所周知,這是一個極其難以建模的系統(tǒng)。即使是那個系統(tǒng),谷歌 DeepMind 也取得了進展。
Demis Hassabis:是的,我們創(chuàng)造了世界上最好的天氣預(yù)測系統(tǒng),它們比傳統(tǒng)的流體動力學(xué)系統(tǒng)更好,那些系統(tǒng)通常在大型超級計算機上計算,需要幾天時間來計算。而我們用神經(jīng)網(wǎng)絡(luò)系統(tǒng),用我們的 WeatherNet 系統(tǒng),模擬了很多天氣動態(tài)。再次,有趣的是,即使是非常復(fù)雜,在某些情況下幾乎接近混沌系統(tǒng)的動態(tài),也可以被這些神經(jīng)網(wǎng)絡(luò)系統(tǒng)建模。
很多有趣的方面都可以被這些神經(jīng)網(wǎng)絡(luò)系統(tǒng)建模,包括最近我們對颶風(fēng)路徑的預(yù)測。當(dāng)然,這對于世界來說超級有用,超級重要,而且非常及時、快速、準確地做到這一點非常重要。我認為這又是一個非常有前景的方向,就是通過模擬來進行前向預(yù)測和模擬非常復(fù)雜的現(xiàn)實世界系統(tǒng)。
![]()
「通往 AGI 之路」
Lex Fridman:你曾估計我們將在 2030 年擁有 AGI,所以關(guān)于這一點有一些有趣的問題。我們實際上將如何知道我們達到了那個地步,以及 AGI 的“第 37 手”可能會是什么?
Demis Hassabis:我的估計是在未來五年內(nèi),大概有 50% 的幾率,比如說在 2030 年之前。所以我認為這很有可能發(fā)生。
一部分原因在于,你對 AGI 的定義是什么?當(dāng)然人們現(xiàn)在正在爭論這個問題,而我的標準相當(dāng)高,并且一直如此,即我們能否匹及大腦所擁有的認知功能?我們知道我們的大腦基本上是近似通用的圖靈機,當(dāng)然我們用我們的頭腦創(chuàng)造了不可思議的現(xiàn)代文明。所以這也說明了大腦的通用性有多強。
為了知道我們擁有一個真正的 AGI,我們必須確保它擁有所有那些能力。它不能是一種“參差不齊”的智能,在某些方面它非常擅長,就像今天的系統(tǒng)一樣,但在其他方面卻有很大的缺陷。這就是我們目前系統(tǒng)的情況。它們不一致。所以你想要那種全面的、一致的智能。
然后我們還有一些缺失的能力,我認為,比如我們之前談到的真正的發(fā)明能力和創(chuàng)造力。所以你希望看到那些。你如何測試那個?我認為你就測試它。一種方法可能是進行一種“暴力”測試,測試成千上萬個人類能做的認知任務(wù)。也許還可以把系統(tǒng)提供給世界上幾百位頂尖專家,每個學(xué)科領(lǐng)域的陶哲軒們,給他們一兩個月,看看他們能否在系統(tǒng)中找到明顯的缺陷。如果他們找不到,那么我認為你可以非常自信我們擁有一個完全通用的系統(tǒng)了。
Lex Fridman:也許可以稍微反駁一下,似乎隨著智能在所有領(lǐng)域的提升,人類真的很不可思議地會把它視為理所當(dāng)然,就像你提到的陶哲軒,這些杰出的專家。他們可能在幾周之內(nèi),就會把所有它能做的不可思議的事情都視為理所當(dāng)然,然后專注于,啊哈,就在那兒。我認為我自己,首先是人類。我認同自己是人類。有些人聽我說話會覺得,“那家伙不擅長說話,結(jié)結(jié)巴巴的。”所以即使是人類,在不同領(lǐng)域也有明顯的局限,甚至在微積分、數(shù)學(xué)和物理學(xué)等領(lǐng)域之外。我不知道是否需要像“第 37 手”那樣的東西,在積極的方面,而不是一連串的一萬個認知任務(wù),可能只需要一兩個,就會讓你覺得,天哪,這太特別了。
Demis Hassabis:所以我認為。完全正確。所以我認為有那種全面的測試來確保你的一致性。但我認為有一些像“第 37 手”那樣的燈塔時刻,是我會尋找的。所以一個可能是發(fā)明一個新的猜想或關(guān)于物理學(xué)的新假設(shè),就像愛因斯坦做的那樣。
所以也許你甚至可以非常嚴格地進行那個的回溯測試,設(shè)定一個 1900 年的截止日期,然后給系統(tǒng)所有寫到 1900 年的東西,然后看看它是否能提出狹義相對論和廣義相對論,對吧?就像愛因斯坦做的那樣。那會是一個有趣的測試。
另一個是,它能發(fā)明一個像圍棋那樣的游戲嗎?不是僅僅想出第 37 手,一個新的策略,而是它能發(fā)明一個像圍棋那樣深刻、美學(xué)上優(yōu)美、優(yōu)雅的游戲嗎?這些是我會尋找的東西。而且可能一個系統(tǒng)需要能夠做到其中好幾樣,才能算得上非常通用,而不僅僅是一個領(lǐng)域。所以我認為那至少是我會尋找的跡象,表明我們有了一個 AGI 級別的系統(tǒng),然后也許為了充實這一點,你還會檢查它們的一致性,確保那個系統(tǒng)里也沒有漏洞。
Lex Fridman:是的,像一個新的猜想或科學(xué)發(fā)現(xiàn)。那會是一種很酷的感覺。
Demis Hassabis:是的,那會很了不起。所以它不只是幫助我們做到那個,而是實際上提出了全新的東西。
Lex Fridman:而你會親身經(jīng)歷那個時刻。
Demis Hassabis:絕對會。
Lex Fridman:可能會在宣布前兩三個月。然后你就會坐在那里,努力不發(fā)推特。
Demis Hassabis:差不多是那樣。完全正確。就像是,這個了不起的新物理學(xué)想法是什么?然后我們可能會和那個領(lǐng)域的世界專家核實它,驗證它,并且審查它的推導(dǎo)過程。我想它也會解釋它的推導(dǎo)過程。是的。那將是一個了不起的時刻。
Lex Fridman:你擔(dān)心我們作為人類,即使是像你這樣的專家,會錯過它嗎?會錯過……
Demis Hassabis:嗯,它可能相當(dāng)復(fù)雜。所以可能是,我給的類比是,我認為對于最優(yōu)秀的人類科學(xué)家來說,它不會完全神秘,但可能有點像,比如說在國際象棋中,如果我和加里·卡斯帕羅夫(Garry Kasparov)或馬格努斯·卡爾森(Magnus Carlsen)交談,和他們下一盤棋,他們走出了一步妙棋,我可能想不出那一步。但他們可以在事后解釋為什么那一步有道理。我們會能在一定程度上理解它,雖然達不到他們那種程度,但如果他們善于解釋——這實際上也是智力的一部分,就是能用簡單的方式解釋你在想什么——我認為對于最優(yōu)秀的人類科學(xué)家來說,那將是非常可能的。
Lex Fridman:但我想知道,也許你可以從圍棋的角度給我普及一下,我不知道馬格努斯或加里是否有過這樣的招法,他們一開始會把它當(dāng)作一步壞棋而忽略掉?
Demis Hassabis:是的,當(dāng)然,有可能。但事后他們會憑直覺搞清楚為什么這招可行。然后從經(jīng)驗上看,關(guān)于游戲的一件好事是,游戲的一大優(yōu)點是它是一種科學(xué)測試。你贏了還是沒贏?然后那會告訴你,好吧,那步棋最終是好的,那個策略是好的。然后你可以回過頭去分析它,甚至對自己多解釋一點為什么。圍繞它進行探索,這就是國際象棋分析之類的運作方式。所以也許我的大腦就是那樣工作的,因為我從四歲起就一直在做這個,這在某種程度上是一種硬核訓(xùn)練。
Lex Fridman:但即使是現(xiàn)在,當(dāng)我生成代碼時,也會發(fā)生一種微妙而迷人的爭論,我可能一開始會認為一套生成的代碼在一些有趣的、細微的方面是不正確的。但我總是要問自己一個問題,這里面是否有更深的洞見,而我才是那個不正確的人?隨著系統(tǒng)變得越來越智能,你將不得不面對這個問題。就像是,你剛剛提出的東西,是 bug 還是 feature?
Demis Hassabis:是的。而且它們會變得非常復(fù)雜,但當(dāng)然,你可以想象也有 AI 系統(tǒng)在生產(chǎn)那些代碼或其他東西,然后人類程序員在看著它,但也不是沒有幫助,而是借助于 AI 工具。所以這將是一種有趣的,也許是不同的AI工具,監(jiān)控工具是生成它的工具。
Lex Fridman:AlphaEvolve 在編程方面,使得像遞歸自我改進這樣的事情成為可能。如果你能想象那個 AGI 系統(tǒng),也許不是第一個版本,而是之后幾個版本,它實際上會是什么樣子?你覺得它會很簡單嗎?你覺得它會像一個自我改進的程序嗎?
Demis Hassabis:有潛 在的可能性。我會說我不確定這是否可取,因為那是一種硬起飛(hard takeoff)的情景。但像 AlphaEvolve 這樣的當(dāng)前系統(tǒng),它們有人類參與其中,決定各種事情,它們是相互作用的獨立的混合系統(tǒng)。可以想象最終能夠端到端地做到這一點。我看不出為什么那是不可能的,但我認為現(xiàn)在的系統(tǒng)在提出代碼架構(gòu)方面還不夠好。
這有點像我們之前討論的提出新猜想或假設(shè)的想法,如果你給它們非常具體的指令關(guān)于你想做什么,它們會做得很好,但如果你給它們一個非常模糊的高層次指令,那目前就行不通了。我認為這和“發(fā)明一個和圍棋一樣好的游戲”這個想法是相關(guān)的,對吧?所以問題是,它能想出一個像 Transformers 架構(gòu)那樣的新飛躍嗎?我不認為有誰的系統(tǒng)能夠明確地展示出那些大的飛躍。
![]()
「規(guī)模法則、算力與能源的未來」
Lex Fridman:你認為規(guī)模法則(scaling laws)在預(yù)訓(xùn)練/后訓(xùn)練/測試時間計算方面依然穩(wěn)固嗎?反過來看,你是否預(yù)見到 AI 的進展會碰壁?
Demis Hassabis:我們當(dāng)然覺得僅僅在規(guī)模化方面還有很大的空間。實際上,所有步驟——預(yù)訓(xùn)練、后訓(xùn)練和推理時間——都有。所以有三種規(guī)模化在同時發(fā)生。再次,這關(guān)乎你能有多創(chuàng)新,我們?yōu)閾碛凶顝V泛和最深厚的研究團隊而自豪。我們有非常了不起的研究人員,比如想出 Transformers 架構(gòu)的 Noam Shazir,以及領(lǐng)導(dǎo) AlphaGo 項目的 Dave Silver 等等。
這個研究基礎(chǔ)意味著,如果需要一些新的突破,比如 AlphaGo 或 Transformers,我會支持我們成為那個實現(xiàn)突破的地方。所以我實際上很喜歡當(dāng)局面變得更困難的時候,對吧?因為那樣它就更多地從純工程轉(zhuǎn)向真正的研究,研究加工程,而那是我們的強項,我認為那更難。發(fā)明東西比快速跟進要難。
所以我們不知道,我會說大概是五五開,是需要新東西,還是把現(xiàn)有的東西規(guī)模化就足夠了。所以,以一種真正的經(jīng)驗主義方式,我們正在盡可能地推動這兩者。新的藍天研究,想法,也許我們大約一半的資源在那上面。然后是最大化地規(guī)模化當(dāng)前的能力。我們?nèi)匀辉诿總€不同版本的 Gemini 上看到一些非常棒的進展。
Lex Fridman:你用深厚的研究團隊來解釋這一點很有趣,如果通往 AGI 的進展不僅僅是擴大計算規(guī)模,也就是問題的工程方面,而更多的是在科學(xué)方面,需要突破,那么你對 DeepMind,也就是谷歌 DeepMind,在那個領(lǐng)域取得優(yōu)異成績充滿信心。
Demis Hassabis:嗯,我的意思是,如果你看看過去十年或十五年的歷史,可能,我不知道,支撐現(xiàn)代 AI 領(lǐng)域今天的突破中,有 80-90% 最初都來自谷歌大腦(Google Brain)、谷歌研究院(Google Research)和 DeepMind。所以是的,我希望那能繼續(xù)下去。
Lex Fridman:那么在數(shù)據(jù)方面,你是否擔(dān)心高質(zhì)量數(shù)據(jù),特別是高質(zhì)量人類數(shù)據(jù)的枯竭?
Demis Hassabis:我不太擔(dān)心這個。部分原因是我認為有足夠的數(shù)據(jù),而且已經(jīng)證明可以讓系統(tǒng)變得相當(dāng)好。這又回到了模擬的話題。你是否有足夠的數(shù)據(jù)來做模擬,從而可以創(chuàng)造更多來自正確分布的合成數(shù)據(jù)?顯然這是關(guān)鍵。所以你需要足夠多的真實世界數(shù)據(jù),才能創(chuàng)造出那種數(shù)據(jù)生成器,我認為我們目前正處在那一步。
Lex Fridman:是的,你們在科學(xué)和生物學(xué)方面做了很多了不起的事情,用不那么多的數(shù)據(jù)做了很多事。我的意思是,數(shù)據(jù)量仍然很大,但我想足夠……
Demis Hassabis:讓它運轉(zhuǎn)起來。完全正確。
Lex Fridman:是的。那么計算規(guī)模的擴大對構(gòu)建 AGI 有多關(guān)鍵?這是一個工程問題。它幾乎是一個地緣政治問題,因為它也整合了供應(yīng)鏈和能源。你非常關(guān)心的一個問題,潛在地是核聚變。所以在能源方面也要創(chuàng)新。你認為我們會繼續(xù)擴大計算規(guī)模嗎?
Demis Hassabis:我認為是這樣的,有幾個原因。
我認為計算,用于訓(xùn)練的計算量,通常需要放在同一個地方,所以實際上數(shù)據(jù)中心之間的帶寬限制都會影響到這一點。所以即使在那里也有額外的限制,而這對于訓(xùn)練你能訓(xùn)練的最大的模型很重要,但也有因為現(xiàn)在 AI 系統(tǒng)已經(jīng)進入產(chǎn)品,被全世界數(shù)十億人使用,你現(xiàn)在需要大量的推理計算。
除此之外,還有思維系統(tǒng),這是去年的新范式,它們變得更聰明,你在測試時給它們越長的推理時間。所有這些都需要大量的計算,我真的不認為這會慢下來,而且隨著AI系統(tǒng)變得更好,它們會變得更有用,對它們的需求也會更大。所以無論是從訓(xùn)練方面,訓(xùn)練方面實際上只是其中的一部分。它甚至可能成為所需整體計算中較小的一部分。
我們有很多有趣的硬件創(chuàng)新,我們有自己的 TPU 產(chǎn)品線,我們正在研究只做推理的東西,只做推理的芯片,以及如何讓它們更高效。
我們對構(gòu)建 AI 系統(tǒng)也非常感興趣,而且我們也做了,來幫助解決能源使用問題,比如幫助數(shù)據(jù)中心的冷卻系統(tǒng)提高效率,電網(wǎng)優(yōu)化,以及最終像幫助核聚變反應(yīng)堆的等離子體約束。我們和 Commonwealth Fusion 在這方面做了很多工作,也可以想象反應(yīng)堆設(shè)計。
然后我認為材料設(shè)計是最令人興奮的之一。新型太陽能材料,太陽能電池板材料,室溫超導(dǎo)體一直在我夢想突破的清單上,還有最優(yōu)化的電池。我認為解決其中任何一個問題都將對氣候和能源使用產(chǎn)生絕對的革命性影響。我們可能很接近了,再次,在未來五年內(nèi),擁有能夠?qū)嵸|(zhì)性地幫助解決這些問題的 AI 系統(tǒng)。
Lex Fridman:如果讓你下注,二三十、四十年后主要的能源來源是什么。你認為是核聚變嗎?
Demis Hassabis:我認為聚變和太陽能是我會下注的兩個。太陽能,我的意思是,它當(dāng)然是天上的聚變反應(yīng)堆,我認為真正的問題在于電池和傳輸。以及更高效,越來越高效的太陽能材料,也許最終在太空,這些戴森球(Dyson Sphere)類型的想法。
我認為聚變絕對是可行的,似乎是這樣,如果我們有正確設(shè)計的反應(yīng)堆,并且我們能足夠快地控制等離子體等等,我認為這兩個問題實際上都會得到解決。所以我們很可能至少擁有這兩個,可能是可再生、清潔、幾乎免費或者也許是免費能源的兩個主要來源。
Lex Fridman:生逢其時啊。如果我一百年后和你一起穿越到未來,如果我們已經(jīng)超過了卡爾達肖夫一級文明,你會感到多驚訝?
Demis Hassabis:如果時間尺度是一百年后,我不會那么驚訝。我的意思是,我認為很清楚,如果我們用我們剛才討論的一種方式解決了能源問題,或者有了非常高效的太陽能,那么如果能源是免費、可再生和清潔的,那就能解決一大堆其他問題。
比如,用水問題就消失了,因為你可以直接用海水淡化。我們有技術(shù),只是太貴了。所以只有像新加坡和以色列等相當(dāng)富裕的國家才真正使用它。但如果它便宜,那么所有有海岸線的國家都可以,而且你還會有無限的火箭燃料。你可以直接用能量把海水分離成氫和氧,那就是火箭燃料。
所以,結(jié)合埃隆(馬斯克)的,了不起的自著陸火箭,那么你可能會像擁有通往太空的公交車服務(wù)。所以這開啟了不可思議的新資源和領(lǐng)域。我認為小行星采礦會成為現(xiàn)實,以及人類向著星辰大海的最大限度的繁榮。這也是我夢想的,就像卡爾·薩根(Carl Sagan)那種將意識帶給宇宙,喚醒宇宙的想法。我認為人類文明如果能把AI搞對,并用它解決其中一些問題,那么在完整的時間意義上,將會做到這一點。
Lex Fridman:是的,我不知道如果你只是一個在太空中飛行的游客,那會是什么樣子。你可能會注意到地球,因為如果你解決了能源問題,你可能會看到很多太空火箭。所以這里會像倫敦的交通一樣,但在太空。只是有很多火箭。然后你可能會看到漂浮在太空中的某種能源,比如太陽能。所以地球表面看起來會更有科技感。然后你會用那種能源的力量來保護自然……
Demis Hassabis:完全正確。因為在人類歷史上,我們將第一次不受資源限制。我認為那對人類來說可能是一個了不起的新時代,不再是零和游戲,對吧?我擁有這片土地,你就沒有。或者如果老虎擁有它們的森林,那么當(dāng)?shù)氐拇迩f就不能,他們要用什么?我認為這會有很大幫助。不,它不會解決所有問題,因為還有其他人類的弱點會繼續(xù)存在,但它至少會消除一個,我認為是一個很大的因素,那就是資源稀缺,包括土地、更多材料和能源。
我們有時應(yīng)該稱之為另一個呼吁,關(guān)于這種“激進富足”(radical abundance)的時代,有大量的資源可以分享。當(dāng)然,下一個大問題是確保這些資源公平地,被公平地分享,并且社會中的每個人都能從中受益。
![]()
「人性與競爭」
Lex Fridman:關(guān)于人性,我有點像《波拉特》(Borat)里說的,我的鄰居,你惹是生非。我們確實會挑起沖突,這就是為什么游戲在整個歷史上,我現(xiàn)在學(xué)到的越來越多,甚至在古代歷史上,都起到了把人們從戰(zhàn)爭,特別是熱戰(zhàn)中推開的作用。所以也許我們能想出越來越復(fù)雜的電子游戲來吸引我們,它們能滿足我們……滿足我們對沖突的渴望,無論那是什么,但我們,我們的人性。
然后避免那些伴隨著日益復(fù)雜的技術(shù)而來的真正的熱戰(zhàn),因為我們現(xiàn)在,我們早就過了我們能創(chuàng)造的武器能直接摧毀所有人類文明的階段了。所以那不再是和你的鄰居開始的好方法了。下盤棋更好。
Demis Hassabis:或者踢足球。我認為現(xiàn)代體育就是這樣,我喜歡看足球,我以前也經(jīng)常踢,它非常本能,具有部落性,我認為它確實把很多那些能量引導(dǎo)到……我認為這是一種人類歸屬于某個群體的需要,但以一種有趣的方式,一種健康的方式,而不是破壞性的方式,一種建設(shè)性的東西。
我認為再次回到游戲,它們之所以對孩子們玩像國際象棋這樣的東西如此出色,也是因為它們是世界很好的微觀模擬。它們也是世界的模擬。它們是某些現(xiàn)實世界情況的簡化版本,無論是撲克、圍棋還是國際象棋,或是外交,都是現(xiàn)實世界的不同方面。
它也讓你能練習(xí)它們,因為你一生中有多少次機會練習(xí)一個重大的決策時刻?選擇什么工作,去哪所大學(xué)?你可能,我不知道,有十幾次關(guān)鍵的決定要做,你必須盡力做好那些決定。而游戲是一種安全、可重復(fù)的環(huán)境,你可以在那里提高你的決策過程,而且它可能還有額外的好處,就是把一些能量引導(dǎo)到更有創(chuàng)造性和建設(shè)性的追求上。
Lex Fridman:嗯,我認為練習(xí)輸和贏也非常重要。這就是我為什么喜歡游戲。這就是為什么我喜歡像巴西柔術(shù)這樣的東西,你可以在一個安全的環(huán)境里一次又一次地被擊敗。它提醒你物理學(xué),提醒你世界運作的方式,關(guān)于有時你輸,有時你贏,你仍然可以和每個人做朋友。但那種輸?shù)母杏X,我的意思是,對我們?nèi)祟悂碚f,要真正理解它是一種奇怪的感覺。那只是生活的一部分。輸是生活的一個基本組成部分。
Demis Hassabis:我認為武術(shù),據(jù)我所知,還有像國際象棋這樣的東西,至少我所理解的方式是,它很大程度上與自我提升、自我認知有關(guān)。就是,好吧,我做了這件事。它不是真的要打敗另一個人,而是要最大化你自己的潛力。
如果你以一種健康的方式來做,你學(xué)會以某種方式利用勝利和失敗。不要因為勝利而得意忘形,以為自己就是世界第一。而失敗讓你保持謙遜,永遠知道總有更多東西要學(xué)。總有更厲害的專家可以指導(dǎo)你。我很確定你在武術(shù)中學(xué)到了這一點。
我認為這也是至少我在國際象棋中受訓(xùn)的方式。所以,同樣地,它可以非常硬核,非常重要,當(dāng)然你也想贏,但你也需要學(xué)會以一種健康的方式處理挫折,把你輸?shù)裟硺訓(xùn)|西時的那種感覺,轉(zhuǎn)化為一種建設(shè)性的東西,比如,下次我要改進這個或者在這方面做得更好。
Lex Fridman:有一種東西是幸福的源泉,是意義的源泉,那就是進步……它與輸贏無關(guān)。
Demis Hassabis:是的,是精通。在某種程度上,沒有比這更令人滿足的了。就像是,哇,這個我以前做不到的東西。現(xiàn)在我能了。再次,游戲和體育運動以及智力運動,它們是衡量……它們很美妙,因為你可以衡量那種進步。
Lex Fridman:是的,我想這就是我為什么喜歡角色扮演游戲的原因,技能樹上的數(shù)字上升,字面上就是我們?nèi)祟愐饬x的來源,無論我們的……
Demis Hassabis:是的,我們對這種數(shù)字上升相當(dāng)上癮。也許這就是我們制作那樣游戲的原因,因為很明顯,我們自己就是爬山系統(tǒng),對吧?
Lex Fridman:是的。如果我們沒有任何機制……那就太可悲了。
![]()
「谷歌與 AGI 競賽」
Lex Fridman:在商業(yè)和領(lǐng)導(dǎo)力方面,過去一年谷歌所做的事情是一個不可思議的故事。所以我認為可以公平地說,一年前谷歌在 LLM 產(chǎn)品方面,Gemini 1.5 算是失敗的。而現(xiàn)在它的新版本在大獲成功。從所謂的“輸”到所謂的“贏”,在一年之內(nèi),需要什么?
Demis Hassabis:是的,嗯,首先,我們擁有一個絕對不可思議的團隊,由 Corey、Jeff Dean 和 Oriole 領(lǐng)導(dǎo),以及我們在 Gemini 上的了不起的團隊。絕對的。所以沒有最優(yōu)秀的人才你是做不到的。當(dāng)然我們也有很多很棒的計算資源。但然后是我們創(chuàng)造的研究文化,以及基本上將谷歌內(nèi)部不同的團隊聚集在一起,那是谷歌大腦,世界級的團隊,然后是舊的 DeepMind,把所有最優(yōu)秀的人和最好的想法匯集起來,圍繞著打造我們能做出的絕對最偉大的系統(tǒng)。
這一直很困難,但我們都非常有競爭力,我們熱愛研究。做這件事非常有趣,看到我們的發(fā)展軌跡很棒。這并非必然,但我們對我們現(xiàn)在所處的位置非常滿意,而且進展速度是最重要的。所以如果你看看我們從兩年前到一年前再到現(xiàn)在的進步,我認為我們稱之為不懈的進步。伴隨著不懈地交付這種進步,一直非常成功,而且整個領(lǐng)域,整個 AI 領(lǐng)域,競爭異常激烈,世界上一些最偉大的企業(yè)家、領(lǐng)導(dǎo)者和公司現(xiàn)在都在競爭,因為每個人都意識到了AI有多重要。看到我們的進步,對我們來說非常令人高興。
Lex Fridman:谷歌是一家巨大的公司。你能談?wù)勗谶@種情況下發(fā)生的自然現(xiàn)象嗎?官僚主義的出現(xiàn)?為了像你說的,交付產(chǎn)品,突破這些的挑戰(zhàn)有哪些?過去幾年交付的 Gemini 相關(guān)產(chǎn)品的數(shù)量是驚人的。
Demis Hassabis:這就是不懈的樣子。我認為這是一個問題,任何大公司最終都會有很多管理層之類的東西,這有點像它的運作方式。但 DeepMind 其實仍然像一個初創(chuàng)公司一樣運作( 和被谷歌收購之前一樣 ),仍然像一個初創(chuàng)公司。一個大公司,但仍然是一個初創(chuàng)公司,以果斷和活力行事,我們試圖兼得兩全,我們擁有這不可思議的,數(shù)十億用戶的界面和不可思議的產(chǎn)品,我們可以用我們的AI和我們的研究來增強它們,那很了不起,世界上很少有地方你能得到那個,一方面做世界級的不可思議的研究,然后第二天就把它接入并改善數(shù)十億人的生活。那是一個相當(dāng)了不起的組合。
我們一直在削減官僚主義,讓研究文化和不懈的交付文化得以繁榮。我認為我們已經(jīng)取得了相當(dāng)好的平衡,同時負責(zé)任地對待它,就像你作為一個大公司必須做的那樣,也考慮到我們擁有的龐大產(chǎn)品界面數(shù)量。
Lex Fridman:你提到的關(guān)于擁有十億用戶的界面,有一件有趣的事,我曾和一位叫 Irvin Finkel 的杰出人士在大英博物館有過一次對話。他是楔形文字的世界專家,那是一種古老的寫在泥板上的文字,他不知道 ChatGPT 或 Gemini,他甚至不知道 AI,但他第一次接觸到這個 AI 是谷歌 Gemini。這提醒我們,世界上有很大一部分人還不知道 AI 這些事。
![]()
Demis Hassabis:是啊,這很有趣。如果你天天刷推特和 X 平臺,至少在我的時間線上,鋪天蓋地都是 AI 的消息。在硅谷或者其他一些特定的圈子里,所有人滿腦子想的都是 AI,但對廣大的普通人來說,他們其實還沒怎么接觸到這個東西。
Lex Fridman:而他們與 AI 的第一次互動,就成了一份巨大的責(zé)任。放眼全球,無論是印度的鄉(xiāng)村,還是世界的任何一個角落……
Demis Hassabis:我們希望這種體驗盡可能地好。在很多情況下,AI 只是在幕后默默工作,讓地圖或搜索這類應(yīng)用變得更好用。理想情況下,對大多數(shù)人來說,這種技術(shù)應(yīng)該是無縫融入的。它就是一種能提高生活效率、提供幫助的新技術(shù)而已。
Lex Fridman:Gemini 產(chǎn)品和工程團隊的很多人都從另一個我?guī)缀鯖]想到的維度上對你給予了極高的評價。我一直覺得你是一位專注的科學(xué)家,關(guān)心的是那些重大的、根本性的科學(xué)問題。但他們也說,你是個非常出色的產(chǎn)品專家,很懂得如何打造出讓大眾喜愛并樂于使用的產(chǎn)品。所以,你能否談?wù)劊獎?chuàng)造一款深受大眾喜愛的 AI 產(chǎn)品,需要具備什么?
Demis Hassabis:這其實要追溯到我設(shè)計游戲的那些年了。人們可能忘了,我曾經(jīng)為數(shù)百萬玩家設(shè)計游戲。所以,我早就有了將最前沿技術(shù)融入產(chǎn)品的經(jīng)驗,九十年代的游戲行業(yè)就是這樣。
所以我真的很享受將尖端研究與產(chǎn)品應(yīng)用相結(jié)合,去驅(qū)動全新的用戶體驗。我認為,這背后需要的是同一種能力,那就是能夠身臨其境地想象用戶的使用感受,并且擁有良好的品味——又回到我們之前談到的話題了。我相信,在科學(xué)研究中有用的那種品味,在產(chǎn)品設(shè)計中同樣至關(guān)重要。
我一直是個喜歡跨界的人,所以我并不認為藝術(shù)與科學(xué),或者產(chǎn)品與研究之間存在什么真正的界限。對我來說,它們是一個連續(xù)體。我喜歡打造那些蘊含尖端技術(shù)的產(chǎn)品。如果一個產(chǎn)品沒有技術(shù)上的創(chuàng)新,我就提不起興趣。它需要那種發(fā)明、創(chuàng)造和突破極限的能力。
Lex Fridman:在你與 Gemini 的互動中,你學(xué)到了哪些具體的東西?比如在大型語言模型方面,它的界面、布局,或者在延遲與響應(yīng)之間的權(quán)衡,該如何呈現(xiàn)給用戶,等待多久,如何展示等待狀態(tài),以及它的推理能力。這里面有很多有趣的新問題,因為正如你所說,這是最前沿的領(lǐng)域,我們還不知道呈現(xiàn)它的最佳方式。你有什么具體的心得嗎?
Demis Hassabis:這是一個瞬息萬變的領(lǐng)域,我們一直在評估這一切。但就目前而言,我們的思路是不斷地簡化。無論是用戶界面,還是你在模型之上構(gòu)建的功能,你都要盡量為模型本身讓路。你可以想象,模型這列火車正沿著軌道飛速駛來,它進步的速度令人難以置信,就是我們之前談到的那種“不懈的進步”。
你看看 Gemini 2.5 相對于 1.5 版本的提升,那是一個巨大的飛躍,我們期待未來的版本也能如此。模型的能力正變得越來越強。
所以,做 AI 優(yōu)先的產(chǎn)品有個很有意思的地方,就是你的設(shè)計不能只看今天技術(shù)能做什么,而是要預(yù)判它一年后能做什么。你必須是一個技術(shù)功底非常扎實的產(chǎn)品負責(zé)人,因為你得有一種敏銳的直覺和感覺,能判斷出:“OK,我現(xiàn)在夢想的這個功能,今天實現(xiàn)不了,但我們的研究路線圖有沒有可能在六個月或一年后,正好能跟上,實現(xiàn)這個設(shè)想?”
你得像是在預(yù)測并攔截這個高速變化的技術(shù)發(fā)展軌跡,同時還要把握那些我們以前沒意識到的、不斷涌現(xiàn)的新能力,正是這些能力讓新的研究成為可能。比如,現(xiàn)在我們有了視頻生成技術(shù),我們該用它來做什么?這些多模態(tài)的能力如何應(yīng)用?
我有一個疑問:我們與 AI 的交互方式,真的會停留在今天這種文本框聊天的形態(tài)嗎?一旦你考慮到那些超級多模態(tài)系統(tǒng),這似乎非常不可能。難道不應(yīng)該更像電影《少數(shù)派報告》里那樣,你和它以一種合作的方式,心意相通地互動嗎?今天的交互方式感覺限制太多了。我想,可能短短幾年后,我們再回頭看今天的這些界面、產(chǎn)品和系統(tǒng),會覺得它們相當(dāng)原始古老了。
所以,我認為無論是在產(chǎn)品端還是研究端,都還存在巨大的創(chuàng)新空間。
Lex Fridman:一個懸而未決的問題是,我們將在何時、多大程度上轉(zhuǎn)向以語音作為與機器互動的主要方式,從而取代打字?
Demis Hassabis:沒錯。即便你打字飛快,鍵盤輸入的帶寬還是太低了。我認為我們將不得不開始利用其他設(shè)備,比如智能眼鏡、音頻耳機,甚至最終可能是某種神經(jīng)接口設(shè)備,從而將我們與 AI 之間的輸入輸出帶寬提升到今天的一百倍左右。
Lex Fridman:我認為界面設(shè)計是一種被低估的藝術(shù)形式。如果你沒有合適的界面,就無法釋放一個系統(tǒng)智能的全部力量。界面是解鎖其能力的鑰匙。如何設(shè)計好界面,是一個非常有趣的問題。所以你說的“為模型讓路”,本身就是一種真正的藝術(shù)。
Demis Hassabis:是的。這有點像史蒂夫·喬布斯一直強調(diào)的那樣,對嗎?我們追求的是簡潔、美感和優(yōu)雅。在我看來,目前還沒有任何產(chǎn)品做到了這一點。而這正是我希望我們能夠達到的目標。
這又讓我想起了圍棋,那是最優(yōu)雅、最美麗的游戲。你能設(shè)計出像圍棋棋盤那樣優(yōu)美的界面嗎?實際上,我認為我們將進入一個由 AI 生成界面的時代。這些界面可以為你量身定制,它會適應(yīng)你的思維方式、你的審美、你的感覺,AI 會根據(jù)不同的任務(wù)為你生成最合適的交互界面。感覺這很可能是我們最終會走向的方向。
Lex Fridman:有些人是高級用戶,他們希望屏幕上能看到所有參數(shù),一切都...
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.