你現在17歲,有人給了你提供了兩個選擇:
選項A:拿下1000萬,別去讀大學
選項B:去劍橋念書
你怎么選擇?給你10秒鐘時間思考。
你可能常常在小紅書、公眾號、虎撲看到這樣的選擇題,大多數人只會想問:我該去哪領錢?
但...這個極端不現實的場景,確實Google AI的負責人在31年前真實面臨的選擇。
![]()
1993年,16歲的Demis Hassabis被劍橋大學錄取了,但因為年紀太小,還不滿足入學的條件,所以需要等一年再去讀大學。
怎么利用這一年的Gap Year呢?
環游世界?還是在家玩游戲?
都不是,從小愛玩游戲的Demis Hassabis選擇去一家游戲公司打「黑工」。
也就是在這一年時間內,他主導設計了一款史上十大最暢銷游戲之一——《主題公園》(Theme Park),這款游戲累計賣出了超過1500萬份。
![]()
Peter Molyneux是全歐洲最好的游戲公司創始人。他提出了一個條件:
給Demis 100萬英鎊,但他不能去讀大學。
那在20世紀90年代是一大筆錢。對于一個17歲的窮小子來說,這是改變命運的機會。
但Demis拒絕了。
他說:"我從一開始就有個計劃。我的計劃一直都是要去劍橋大學讀書。"
Peter至今依然記得送Demis去火車站的那天:"他就如同一粒即將破土而出的小種子,但在牛蛙制作公司,他是無法做到的。我至今依然記得這個小精靈角色消失在那條隧道里的畫面。那是個令人極其傷感的時刻。"
為什么?
一個17歲的天才少年,怎么會有魄力拒絕100萬英鎊?
他在追求什么?
答案要從6年前說起。
![]()
1988年,列支敦士登的一個山間教堂里,12歲的Demis正在參加一場國際象棋錦標賽。
對手是前丹麥冠軍,三十幾歲。比賽持續了10個小時。
到了最后,Demis明明可以逼成平局——只需要放棄皇后,棋局就會陷入僵局。但他太累了,誤以為被將軍是無可避免的,于是認輸了。
對手跳了起來,開始大笑。他問:"你為什么要認輸?這是平局。"然后他立刻用夸張的動作,給Demis演示平局該怎么走棋。
Demis感到很不舒服。但真正讓他開始思考的,不是這次挫敗本身,而是他環顧四周時看到的景象:
教堂里坐著數百名國際象棋棋手。所有人都在全神貫注地對弈,消耗著巨大的腦力。
他突然想到一個問題:
"我們是在浪費頭腦嗎?這就是腦力最好的用武之地嗎?如果可以把那300個大腦連接到一個系統上,那種腦力水平也許能夠用于根治癌癥。"
那一刻,即便熱愛國際象棋,Demis也決定:這不該是他一生的事業。
這個12歲時的問題,成為了他一生的追問:智力的最好用處是什么?
6年后,當Peter Molyneux提出100萬英鎊時,Demis拒絕的原因很簡單:
做游戲不是答案。錢也不是。
他要去找那個答案。
30年后,2024年10月,Demis Hassabis因為用AI解決了50年未解的蛋白質折疊問題,獲得了諾貝爾化學獎。
這篇文章想講的,不只是他怎么拿到諾貝爾獎,而是他怎么找到了那個12歲時的問題的答案。
答案就是一個詞:Simulation(模擬)。
這個詞貫穿了他整個人生。
一、17歲:第一次模擬一個世界
要理解Demis為什么拒絕100萬英鎊,得先知道他是怎么走到那一步的。
Demis 4歲學國際象棋,幾周后就擊敗了父親和叔叔。13歲時達到大師級別(Elo 2300),Under-14年齡組的世界第二。
列支敦士登的那次挫折,讓他開始思考國際象棋之外的可能性。
1990年,他看到雜志上的一個比賽廣告:創作《太空侵略者》的原創版本,獲勝者能去牛蛙制作公司(Bullfrog Productions)工作。
Demis做了一款叫《國際象棋入侵者》的游戲,贏得了比賽。
創始人Peter Molyneux至今記得他第一次見到Demis的場景:"他走進門,看上去大概12歲上下。我心想:'天啊,我們該拿他怎么辦?'"
因為太小不能合法雇用,Demis的薪水都是裝在棕色紙信封里發的。
1994年,17歲的Demis和Peter Molyneux一起設計了那款改變他命運的游戲:《主題公園》。
玩家可以建造主題公園,設計過山車,給炸魚薯條店的東西定價。
但最重要的是:游戲里的游客有自主行為。
Demis設計的AI模擬了真實的人類行為:
如果離驚險的過山車距離太近,過山車上剛吃過東西的人就會嘔吐
當其他人看到地上的嘔吐物時,他們也會嘔吐
這樣就得有很多清掃人員,以便趕在被人們看到前快速清掃干凈
這些細微的模擬動作,Peter Molyneux說,是"前所未有的發明,獨一無二"。
這是Demis第一次用代碼模擬一個世界。他發現了一件事:模擬不只是娛樂,模擬是理解世界的方式。
游戲大獲成功。1500萬份。
Peter看到了Demis的天賦,于是提出了那個100萬英鎊的條件。
但Demis拒絕了。
同學都覺得他瘋了:"你為什么不拿錢?100萬英鎊可是一大筆錢!"
Demis心里很清楚:做游戲很有趣,也能賺錢。但那不是12歲時那個問題的答案。
他要去劍橋,去理解什么是智能,什么是理解。
Demis去了劍橋,學Computer Science。但真正改變他軌跡的,是1997年發生的一件事。
二、劍橋:模擬不是計算,理解才是智能
1997年5月,IBM的"深藍"擊敗了國際象棋世界冠軍卡斯帕羅夫。
![]()
全世界都在歡呼人工智能的勝利,但Demis的反應很不一樣。
他說:"我對'深藍'的印象并不深,卡斯帕羅夫的思維讓我印象更深。"
為什么?
"卡斯帕羅夫在國際象棋上的造詣跟野獸般的機器不分伯仲,但卡斯帕羅夫還能做到人類能做到的其他所有事。這是一項巨大的成就,而'深藍'只會下象棋。它的系統里缺少了我們所認為的智能,即通用性和學習的想法。"
深藍是暴力計算。它每秒評估2億個棋局,靠窮舉,不是理解。
Demis意識到:真正的智能不是計算,是理解。
而理解的核心能力,是模擬。
在劍橋,他接觸到不同學科的人——生物學家、哲學家、藝術家。有人不斷跟他講一個問題:"蛋白質折疊"。
蛋白質是生命的機器。由氨基酸鏈構成,折疊形成特定結構。如果能從氨基酸序列預測蛋白質結構,就能設計出治愈癌癥或分解塑料的新型蛋白質。
這個問題從20世紀60年代起就有人研究,但沒人解決。
Demis當時想:"人類是否真的智慧到能夠折疊蛋白質?我覺得它是可以解決的,但我認為需要人工智能來解決。"
但在創辦AI公司之前,他決定先去理解人類大腦本身是如何工作的。
2005年,他去了UCL(倫敦大學學院),攻讀神經科學PhD。
三、神經科學:大腦如何模擬未來?
Demis在UCL的研究主題是:想象、記憶和失憶癥。
他想搞清楚的核心問題是:人類大腦是如何模擬未來場景的?
他的第一篇論文發表在PNAS上,是個里程碑式的發現:
海馬體****受損的患者,既有失憶癥(無法記憶過去),也無法想象新體驗(無法模擬未來)。
這證明了:記憶和想象是同一個系統。
換句話說,大腦模擬未來的能力,依賴于它存儲過去經驗的能力。
這篇論文被Science雜志評為"2007年度十大科學突破"之一。
但對Demis來說,這個發現的意義遠不止于此。它回答了一個更深層的問題:
什么是智能?
Demis的答案是:智能就是模擬的能力。
一個智能系統,不只是記住過去發生了什么,還要能模擬未來可能發生什么,然后基于這些模擬做決策。
這讓人想起物理學家Richard Feynman說過的一句話:
**"What I cannot create, I do not understand."**(凡是我不能創造的,說明我還不夠理解。)
Demis想明白了:要理解智能,就要能創造智能系統。而創造的方式,就是模擬。
DeepMind后來做的所有事,都是這個思路。
2007年,在UCL的一次演講上,Demis遇到了Shane Legg。
Shane當時在講:"機器真的變得更智能了嗎?有人說是,有人說不是。它們現在的計算速度變得快多了,但在通用智能方面,我們真的在進步嗎?"
兩個人聊完后,Demis感覺:"我們倆守護著一個不為人知的秘密。"
那個秘密是:通用人工智能(AGI)是可能的,而且需要用模擬的方式去實現,而不是深藍那樣的暴力計算。
但在學術界,這個想法是不被接受的。
Demis說:"學術界沒人會支持我們所做的事。幾乎可以說在學術界,'人工智能'一詞是個令人尷尬的詞。如果你說自己在研究人工智能,那顯然你不是一個真正的科學家。"
所以,他說服Shane:正確的做法是創辦一家公司。
四、DeepMind:在模擬中自我進化
2010年,DeepMind成立。前兩年完全隱身,辦公室在秘密地點,沒有網站。
![]()
去面試的人會說:"我剛剛給我妻子發了短信告訴她我要去的具體地方,以防這是個可怕的騙局,我會遭到綁架。"
他們在做什么?
Demis的目標很清楚:建造世界上第一臺通用學習機器。
他們的方法是:讓AI在模擬環境中自我學習。
第一個測試是雅達利游戲。
他們創建了一種叫DQN的算法,結合了強化學習和深度學習。目標是:用同一個系統,玩幾十款不同的游戲。
第一個游戲是Pong(乓)。
![]()
開始時,AI根本不知道要做什么。它只知道得分是好事,其他什么都不知道——不知道自己在控制什么,不知道規則,不知道目標。
Demis當時對Shane說:"也許我們錯了,我們甚至連《乓》都玩不好。"
但突然,它拿到了第一分。
"這是偶然嗎?不,不是。它真的得分了。"
接著它得了一些分,然后贏了第一場比賽。3個月后,沒有人類能擊敗它。
從像素到動作,完全自學。這在當時是第一次有人做到。
然后他們試了《Breakout》(打磚塊)。
300場比賽后,它的水平幾乎和任何人類一樣出色。但他們讓系統又玩了200場比賽,它做了一件很驚人的事:
它發現最佳策略是在一側打通一條通道,把球打到墻后面。
這不是人類教它的。這是它自己在模擬中發現的。
50個游戲之后,DQN可以從頭開始自我訓練,達到人類水平甚至超過。
2014年,Google以4億英鎊收購了DeepMind。
但真正讓全世界震驚的,是2016年發生的事。
五、AlphaGo:模擬出人類從未走過的棋
圍棋被認為是人工智能的圣杯。它的潛在棋譜比宇宙中的原子還多。
多年來,所有用AI試驗圍棋的嘗試都失敗了。
2016年3月,韓國首爾,AlphaGo對戰李世石——過去十年里最偉大的棋手之一,"圍棋界的羅杰·費德勒"。
第37步棋,AlphaGo走了一步沒有哪個人類棋手會走的棋。
專業評論員說:AlphaGo認為,這步棋只有萬分之一的概率是人類會走的。
但它走了。而且是對的。
一位棋手說:"我原以為AlphaGo是基于概率計算的,而且它只是一臺機器。但AlphaGo肯定很有創意。圍棋已經被研究了幾千年,AlphaGo發現了一些全新的東西。"
AlphaGo贏了。李世石投子認輸。
這一刻,全世界意識到:地球上誕生了新事物。
對中國來說,這是"斯普特尼克時刻"——像1957年蘇聯發射人造衛星一樣,引發了全球AI競賽。
但Demis沒有停下來。
2017年,DeepMind發布了AlphaZero。
AlphaGo是基于人類數據訓練的——它先觀看了10萬場厲害的業余棋手的比賽,然后通過強化學習與自己對弈數百萬次。
但AlphaZero完全不需要人類數據。
它剝離了所有人類的知識,完全從零開始,在模擬中與不同版本的自己對弈,從錯誤中學習。
訓練速度有多快?
AlphaGo需要幾個月。
AlphaZero早上開始訓練,完全隨機對弈。到茶歇時達到超人類水平。到晚餐時,成為有史以來最強大的象棋實體。
它成了自己的老師。
Demis一直相信的事得到了證明:真正的智能不是學習人類的經驗,而是在模擬中自我進化。
但他想做的,遠不止游戲。
六、AlphaFold:模擬生命的基礎
![]()
2018年,DeepMind參加了CASP——蛋白質結構預測關鍵評估,每兩年舉行一次,被稱為"蛋白質折疊的奧運會"。
評分標準:超過90分算成功。
CASP13的結果出來了:DeepMind以50%的優勢擊敗了第二名。
但約翰·穆特(CASP的聯合創始人)說了一句話,讓Demis很失望:
"阿爾法折疊沒有獲得足以讓其切實得以被利用的數據。"
諾貝爾獎得主Paul Nurse也說:"比如說像我這樣的人查驗我自己的生理問題——阿爾法折疊做不到。"
Demis后來回憶:"那個時刻讓人感覺有些慚愧。我們覺得自己非常努力,也成功了,而且在一個難住了全世界的問題上我們的表現是最好的。我們知道我們很爛。"
團隊里有人開始質疑:"這在某種程度上是一場愚蠢的冒險。也許考慮人工智能的現狀,那還是太難了。"
有人說了一句話:"最長的梯子并不能幫你登上月球。"
什么意思?用現有的方法優化,可能永遠也到不了目標。需要完全不同的思路。
2019年,Demis做了一個決定:
"從這里開始,我們需要加倍努力并盡快實現。我覺得我們不能再浪費時間了。"
他組建了一個突擊小組,約翰·江珀(John Jumper)擔任組長,加入了生物學專家。
關鍵是:他們重寫了整個數據管道,而不是在原有系統上修修補補。
有人說:"你必須給那些花朵綻放的空間,不能在創作階段強迫它。"
4個月后,進展出現了。
速度突破:CASP13期間1-2天折疊1個蛋白質,現在1秒折疊數十萬個。
質量突破:許多結構達到高精度水平。
2020年11月,CASP14的結果公布了。
約翰·穆特發來郵件:
"你們團隊在CASP14中表現得非常出色,不論是相對于其他組還是在模型的絕對準確性方面。恭喜你們完成了這項工作,真的非常出色。"
約翰·江珀說:"半個世紀之后,我們終于找到了蛋白質折疊問題的解決方案。"
Demis給父母打電話:"嘿,媽媽,我有事要告訴你。我們做了一件事,可能是件大事。"
接下來,Demis做了一個決定:
"我們想將這個公開,不僅確保代碼是公開的,我們還要讓所有人都能便利地獲得這些預測結果。"
他們在一個月內預測了所有已知的序列,公開了2億個蛋白質結構。
發布當天,從655個用戶暴漲到10萬個并發用戶。
Demis說:"這些是饋贈給人類的禮物。"
2024年,Demis Hassabis和John Jumper因為這項工作,獲得了諾貝爾化學獎。
但故事還沒有結束。
七、World Models:模擬世界,才能理解世界
2025年12月,在一次年終訪談中,Demis談到了DeepMind現在在做的事:World Models(世界模型)。
![]()
他說了一段很關鍵的話:
"LLM理解語言,但缺少空間感知。World Models理解物理世界的因果關系。"
這是DeepMind和大多數AI公司的差異。
大多數公司在做什么?
Scaling LLM——讓模型更大,數據更多,訓練更久。LLM學的是語言的統計規律。
但Demis認為,這還不夠。
費曼說過:"凡是我不能創造的,說明我還不夠理解。"
Demis現在要做的,就是創造(模擬)整個物理世界,來真正理解世界。
真正的智能,需要模擬物理世界。
DeepMind現在有兩個系統:Genie和Simma。
Genie生成可交互的虛擬世界,Simma在虛擬世界中探索。
把它們組合起來:Simma在Genie生成的世界中學習,Genie按需生成無限的訓練場景,AI可能實現"自我進化"。
這就像當年的AlphaZero:不需要人類數據,在模擬中自我學習。
但這次模擬的不是圍棋,而是整個物理世界。
Demis說:
"我的夢想是在模擬中重新運行生命進化,觀察意識、社會結構如何涌現,理解我們從哪里來。"
這讓人想起他在劍橋時的那個直覺:蛋白質折疊可以用AI解決。
現在他在追問更大的問題:意識、創造力、情感…這些是可計算的嗎?
他說:
"這是我人生的核心問題:圖靈機的極限在哪里?到目前為止,宇宙中沒有發現任何不可計算的事物。"
"如果我們造出AGI,然后用它模擬人類心智,對比真實心智,就能看出差異在哪里。也許差異是creativity?emotions?dreaming?consciousness?這將回答'人之為人'的本質。"
當AlphaGo擊敗李世石時,Demis說他的感受很復雜:
"我既興奮又有點失落。圍棋是美麗的神秘,我們破解了它。這有點苦樂參半。"
科學家的宿命是:解開謎題的同時,失去神秘感。
但Demis還是選擇了這條路。
尾聲:智力的最好用處
從12歲在列支敦士登的教堂里問出那個問題,到48歲獲得諾貝爾獎,Demis花了36年。
回過頭看,他的整個人生都在圍繞一個核心理念:Simulation(模擬)。
17歲,他模擬了一個主題公園。神經科學PhD,他研究大腦如何模擬想象和記憶。AlphaGo/AlphaZero,在模擬對弈中自我進化。AlphaFold,模擬蛋白質折疊。World Models,模擬整個物理世界。
而他一直在追問的,是那個12歲時的問題:智力的最好用處是什么?
答案是:
用最好的頭腦,去模擬和理解整個世界。
不是為了下好一盤棋,不是為了贏一場比賽,而是為了解決癌癥、阿爾茨海默病、能源危機、氣候變化——那些真正能改變人類命運的問題。
在2025年的那次訪談里,Demis說:
"我的使命是幫助全人類安全地跨越AGI這條線。完成這個任務后,我會好好休個假。"
"我為這個時刻準備了一生。從下棋、做游戲、研究神經科學…都是為了這個時刻。"
"這是我一生一直為之奮斗的時刻。"
也許,這就是智力的最好用處。
主要參考信源:
Demis最近一期播客訪談(The future of intelligence):https://www.youtube.com/watch?v=PqVbypvxDto
DeepMind和Demis的紀錄片(The Thinking Game):https://www.youtube.com/watch?v=d95J8yzvjbQ
非常建議找個下午或者晚上的時間,沐浴更衣,花三個小時時間把這兩個視頻看完。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.