![]()
極客征服AI的方式
是讓它盡情地游戲
文 | 羊羊
編輯 | 羊羊、小小樹
2024年,諾貝爾化學獎破天荒地被授予一位AI公司老板。
你沒看錯,諾貝爾獎也沒弄錯。
這位叫戴米斯?哈薩比斯的男人,帶領名為DeepMind的團隊,開發出AI模型AlphaFold2,解決了困擾生物學界50年的蛋白質結構預測難題。
獲得諾貝爾跨界授獎,實至名歸。
![]()
△ 哈薩比斯獲得2024諾貝爾化學獎
奇聞背后,有一個非常關鍵的問題:他是怎么做到的?
在很多人在質疑AI,至少認定現階段的AI還不夠“聰明”時,哈薩比斯用了什么方法,讓AI超越了世界上最頂尖的科學家?
最近,一部名為《思考之弈》(The Thinking Game)的紀錄電影選擇在油管上發布,免費供所有人觀看。
![]()
問題的答案,就藏在這部電影里。
![]()
免費并不意味著該片“含金量低”,恰恰相反,正因為《思考之弈》中展現的內容太有價值,制片方才想用免費的方式讓盡可能多的人看到。
簡單來說,《思考之弈》講述了一群“計算機科學瘋子”如何將一個近乎狂妄的夢想變為現實的故事——他們想讓AI具備超越人類水平的跨領域學習和推理能力,從而讓AI服務全人類。
這群“瘋子”的領頭人正是哈薩比斯,他召集了當今世界最聰明的一群人,創立了DeepMind,傳奇從此開始。
![]()
△ 哈薩比斯創立了AI界的傳奇公司DeepMind
電影的中文譯名《思考之弈》翻譯得頗為傳神。
首先,哈薩比斯從小就是個國際象棋神童,在研究AI前,他的超高智商在棋盤上已展現得淋漓盡致;另外,“對弈”也正是哈薩比斯訓練AI的獨門秘籍。
沒錯,用下棋訓練AI,甚至讓AI去玩游戲(哈薩比斯曾做過游戲設計師),正是這些頗具娛樂性的訓練方式造就了超越人類的智慧。
![]()
△ DeepMind團隊合影,當時他們帶著AlphaGo成功挑戰了圍棋國手
能想出這種訓練方法的人,必然也是一位有趣的極客。
事實上,早在2017年,《銀翼殺手2049》上映后,哈薩比斯曾與維倫紐瓦導演展開跨界對談。
哈薩比斯那時坦言:
《銀翼殺手》是我一直以來最喜歡的一部電影,它深深打動了年少時代的我,所以我才開啟了自己從事AI研究這條路。
![]()
影迷、棋手、游戲設計師、AI工程師、科技公司老板、諾貝爾獎得主……這些看似互不關聯的標簽在哈薩比斯身上得到了完美統一。
前不久,《時代》雜志公布2025年度人物。
今年的這份榮譽不是授予單獨一個人,而是一個群體——人工智能的締造者們(The Architects of AI)。
八位AI領域的領袖作為代表登上《時代》雜志封面,其中就包括哈薩比斯,他的旁邊是山姆·奧特曼、黃仁勛、馬斯克……
![]()
△ 八位AI領域的領袖登上《時代》雜志封面,右三為哈薩比斯
這些當代最偉大的頭腦里裝了些什么?真讓人好奇!
今天我就借著《思考之弈》這部電影,進入哈薩比斯的頭腦。
里面裝著的奇思妙想,遠比你想象得更加有趣。
一群“瘋子”的集結:
天才少年豪賭AI創業
故事的主角,是一個名叫戴米斯?哈薩比斯的英國男人。
紀錄片開篇,他便坦言自己“有點不安分”,并宣告了一個不同尋常的人生目標。
我的整個生命目標就是解決通用人工智能(AGI)。并在此過程中,將AI作為終極工具,解決世界上所有最復雜的科學問題。
![]()
△ 故事的主角,戴米斯?哈薩比斯
哈薩比斯從小就展現出天才的一面。
他4歲時迷上國際象棋,6歲拿下倫敦8歲以下錦標賽冠軍;9歲成為英國11歲以下國家象棋隊隊長;13歲在14歲以下組國際象棋比賽中斬獲全球第二名,達到國際象棋大師水平。
在紀錄片中,哈薩比斯回憶道,當他一場接一場地比賽時,他開始對自己的獲勝策略進行元認知思考:不僅僅是他的大腦,而是所有人的大腦是如何解決問題、分析信息并幫助人們度過日常生活的?
這種對思維本質的好奇,早早在他心中埋下了種子。
十幾歲時,他癡迷于編程,并獲得了頂尖游戲公司Bullfrog的職位。
![]()
△ 少年時代的哈薩比斯
在那里,他參與開發了模擬經營游戲的鼻祖《主題公園》,負責設計游戲中虛擬小人的AI行為。他致力于模仿有趣的人類行為,讓模擬世界更加生動。
例如,他設計了游客在玩完刺激的游樂設施后會嘔吐,而其他游客看到嘔吐物也會跟著不適,這就需要玩家雇傭清潔工及時清理。這種對復雜系統和自主智能體的早期探索,為他后來的AI研究奠定了基礎。
![]()
△ 哈薩比斯曾參與開發游戲《主題公園》,這段經歷為他研究AI奠定了基礎
正當這位游戲界的新星冉冉升起之時,哈薩比斯卻毅然轉身扎進劍橋大學,攻讀神經科學博士學位。即使游戲公司老板開出一百萬英鎊的巨額年薪,也留不住他。
他的理由很簡單,他需要從“唯一存在的智能樣本”——人類大腦中,尋找構建AI的靈感。他相信,理解大腦是解決智能問題的關鍵。
在21世紀初,當“AI”在學術圈還是個近乎“尷尬的詞匯”,說出來會被認為“不是個嚴肅的科學家”時,哈薩比斯卻堅信這是人類最偉大的征程。
他找到了同樣癡迷于通用人工智能的伙伴謝恩?萊格,并說服萊格,實現他們宏大理想的正確途徑是創辦一家公司,而不是留在學術界。
![]()
△ DeepMind的另一位創始人謝恩?萊格
于是,在2010年,DeepMind誕生了。
他們的目標簡單而又狂妄:“建立世界上第一臺通用學習機器”,也就是AGI。這個聽起來像科幻小說里的情節,自然嚇跑了絕大多數投資者。
![]()
△ 初創期的DeepMind并不被多數人理解
紀錄片中,哈薩比斯生動地回憶起早期融資的窘境,他向投資人描繪著AI如何與大腦連接、為何時機已經成熟,對方卻只關心一個非常世俗的問題:
你的產品是什么?你怎么賺錢?
這讓他哭笑不得:
你難道沒在聽我講什么嗎?
幸運的是,在硅谷,總有愿意為瘋狂夢想下注的人。
PayPal的聯合創始人彼得·蒂爾成為了他們最早的天使投資人之一。隨后,特斯拉的埃隆·馬斯克也加入了投資行列。
![]()
△ 彼得·蒂爾(左)和埃隆·馬斯克(右)先后為哈薩比斯投資
最終,這場豪賭吸引了科技巨頭谷歌的關注。
2014年,谷歌在與Facebook的競購中勝出,以4億英鎊的價格收購了DeepMind。這不僅是資本的勝利,更是對DeepMind愿景的最高認可。
![]()
△ 哈薩比斯帽子上的Noogler是谷歌內部對新入職員工的專屬昵稱
哈薩比斯強調,他們之所以選擇出售,是因為“沒有時間可以浪費”,谷歌能提供他們夢寐以求的“海量計算資源”,這將“極大地加速我們實現AGI的時間表”。
更重要的是,他們爭取到了在倫敦獨立運營的權利,可以專注于純粹的研究,而不必為產品和商業化分心。
就這樣,DeepMind有足夠的資源集結了一批世界最頂尖的科學家,哈薩比斯口中的“AI曼哈頓計劃”得以啟動。
這群“夢想家”在倫敦的一個“秘密地點”開始了長達數年的“閉關修煉”。
紀錄片中,早期員工回憶道,公司最初兩年處于“完全隱身模式”,辦公室地址保密,甚至沒有網站。一位面試者緊張地表示,他來面試前特意給妻子發了地址,以防自己被綁架。
這支團隊的背景、資源和使命,從一開始就注定了他們要做的,絕不是小打小鬧,而是一場將深刻改變世界的思維游戲。
從游戲廳到實驗室:
獨屬AI的“思維游戲”
如何訓練一個一無所知的“數字大腦”?
哈薩比斯給出的答案是:從游戲開始。
他認為,游戲是訓練AI最完美的“健身房”,因為它們提供了一個有明確規則和目標的受控環境。
旅程始于最簡單的雅達利游戲《乓》。這是一款乒乓球游戲,游戲中,玩家的目的就是在模擬乒乓球比賽中奪取高分以擊敗電腦玩家。
![]()
△ 雅達利游戲《乓》是一款模擬乒乓球比賽的極簡風游戲
這種嘗試初期并不順利——AI連最基本的移動都學不會,團隊一度陷入絕望。哈薩比斯甚至對謝恩?萊格說:
也許我們從根本上就錯了,我們連《乓》都搞不定。
他們采用了一種名為“Q-learning”的強化學習方法,并將其與“深度學習”相結合,這在當時是一個創舉。
AI代理被置于游戲環境中,它唯一的目標就是最大化得分,但它不知道規則,不知道如何控制球拍,一切都得從零學起。
就在團隊瀕臨放棄的邊緣,AI打回了第一個球。
從那一刻起,奇跡發生了。它開始得分,贏得第一局,三個月后,沒有任何人類能再打敗它。
這只是開始。
在游戲《打磚塊》中,屏幕上方排列著八排磚塊,玩家的目標是通過反復用球拍擊打磚塊來消除它們。
AI在玩了數百局后,自行發現了一個連人類頂尖玩家都未曾想到的最優策略——從側面挖通一條隧道,讓球在磚塊后方自動反復反彈,高效地清除所有磚塊。
![]()
△ AI在游戲《打磚塊》中發揮出了創造性思維
這一刻,AI展現的不再是模仿,而是頓悟和創造力。
這個過程,對于所有內容創作者來說,都極具啟發性:真正的智能,源于對規則的深度理解和探索,而非簡單的復刻。
DeepMind的算法最終被證明具有通用性,能夠學會在近50種不同的雅達利游戲中達到甚至超越人類水平。
隨后,DeepMind將目光投向了人類智慧的試金石——圍棋,這個“人類發明的最復雜的游戲”,其可能的變化數量比宇宙中的原子總數還要多。
他們開發的AlphaGo,通過“強化學習”與“深度學習”相結合,先是學習了10萬局人類高手的棋譜,然后通過數百萬次的自我博弈進行強化。
![]()
△ AI進行圍棋自我對弈訓練,通過海量計算探索最優策略
在2016年與世界冠軍李世石的世紀對決中,AlphaGo下出了震驚世界的“第37手”。
職業解說員一致認為,沒有任何人類棋手會選擇這一步。AlphaGo自己的分析也顯示,人類下出這一步的概率只有萬分之一。
面對這步棋,李世石陷入長達15分鐘的沉思,這在頂尖棋手對決中極為罕見。據現場報道,他甚至一度離開對局室冷靜情緒。
這一“天外飛仙”式的招式,徹底顛覆了人類數千年來對圍棋的認知,并最終幫助AlphaGo贏得了比賽。
![]()
△ 韓國圍棋國手李在石最終敗給了AlphaGo
紀錄片中提到一個概念——“斯普特尼克時刻”。
1957年10月4日,蘇聯成功發射人類首顆人造衛星“斯普特尼克1號”。
當時正處于冷戰時期,美國受到極大震動。為了扭轉局面,美國后續成立了NASA,推進水星計劃,加大科研與教育投入,進而開啟了美蘇持續20多年的太空競賽。
![]()
△ 蘇聯成功發射人類首顆人造衛星“斯普特尼克1號”,改變了歷史進程
此后,“斯普特尼克時刻”被用來形容某個國家、行業或群體,突然意識到自身在關鍵領域被競爭對手超越,由此產生強烈危機感與緊迫感,并促使其全面審視自身發展,進而通過加大投入、調整戰略等方式奮起追趕的關鍵節點。
AlphaGo的勝利被譽為AI領域的“斯普特尼克時刻”。它向世界宣告,一個新時代已經到來。
但DeepMind并未止步。他們推出了更強大的AlphaZero,它完全拋棄了人類數據,從零開始,通過自我對弈進行學習。
紀錄片展示了其驚人的學習速度:AlphaZero早上還只會隨機亂走,到下午茶時間就達到了超人水平,到了晚飯時間,它已成為地球上最強的國際象棋“棋手”。它甚至發現了人類數百年都未曾探索過的全新攻擊風格。
哈薩比斯興奮地說:
這甚至激勵我重新開始下棋了。
![]()
△ 哈薩比斯(右)本就是棋界神童出身,DeepMind開發的AI繼承了他的天賦
游戲的終極目標是現實世界。DeepMind接著挑戰了更為復雜的即時戰略游戲《星際爭霸2》。
與圍棋不同,《星際爭霸2》信息不完整,你無法看到對手的所有行動,決策是連續的,這更接近真實世界的復雜性。
他們開發的AlphaStar,最初連公司內部的業余玩家都打不過,但通過模仿人類玩家的“下一動作預測”和大規模的自我博弈,它迅速進化。
在與職業選手的對戰中,AlphaStar展現了驚人的微操和戰略大局觀,最終以壓倒性優勢獲勝。
![]()
△ AlphaStar強大到可以在《星際爭霸2》中擊敗所有人類玩家
從雅達利游戲到圍棋,再到《星際爭霸2》,DeepMind訓練的AI一步步從“學徒”進化為“宗師”,其學習和進化速度令人嘆為觀止,也為他們進軍科學領域鋪平了道路。
破解生命密碼:
“諾獎”是AI的起點不是終點
哈薩比斯的夢想始終是“AI輔助科學”。
DeepMind的下一個目標,是困擾了生物學界半個世紀的“蛋白質折疊問題”。
![]()
△ 蛋白質折疊問題是困擾科學界的重大難題,DeepMind決定挑戰它
簡單來說,蛋白質是生命的基石,它們的功能由其復雜的三維結構決定。預測蛋白質的結構,是理解生命運作、攻克疾病的關鍵。
然而,這個問題極其困難,正如哈薩比斯在劍橋的同學所說,這個問題“困擾了成千上萬非常聰明的人”,但始終未能解決。
哈薩比斯堅信,這個問題需要AI幫助才能破解。為此,DeepMind組建了一支由生物學家和AI專家構成的“攻堅隊”,開發了名為AlphaFold的系統。
![]()
△ AlphaFold重新定義了我們理解蛋白質結構的方法
他們的征途并非一帆風順。在第一次參加被譽為“蛋白質折疊界奧運會”的CASP競賽時,盡管他們取得了第一名,但預測的精準度遠未達到能被生物學家實際應用的水平。
團隊成員意識到,他們只是“在全世界都不擅長的問題上做到了世界最好”,離真正解決問題還差得很遠。
這讓團隊中的一些人感到這是“一項愚蠢的差事”,哈薩比斯也開始反思:
也許我錯了,也許這個問題對于AI目前的水平來說還是太難了。
![]()
△ 解決蛋白質折疊問題,可能是DeepMind面對過的最大挑戰
但他們沒有放棄。哈薩比斯決定“加倍下注”,組建了一支“蛋白質折疊突擊隊”,由約翰·江珀領導。他們重構了整個算法,將生物學領域的專業知識更深地融入AI模型中。
在經歷了又一個兩年的埋頭苦干后,新一代的AlphaFold誕生了。在2020年的CASP14競賽中,它取得了歷史性的突破。
競賽組織者約翰·莫爾特在發給團隊的郵件中難掩激動:
我預計你們已經知道,你們團隊在CASP14中表現驚人,無論相對于其他團隊,還是在模型的絕對準確性上。恭喜你們,這真是杰出的工作。
AlphaFold的預測精準度達到了與實驗室相媲美的水平,這意味著,這個困擾了科學界50年的難題,在很大程度上被解決了。
這一成就的意義是顛覆性的。2024年,哈薩比斯和江珀因此榮獲諾貝爾化學獎。
![]()
△ 2024年諾貝爾化學獎得主(從左至右)大衛?貝克、戴米斯?哈薩比斯、約翰?江珀,前者因“計算蛋白質設計”而獲獎,后兩位因“蛋白質結構預測”而獲獎
DeepMind的選擇更為震撼——他們決定將預測出的全部2億個已知蛋白質的結構數據,通過一個公開數據庫向全世界免費開放。
![]()
△ DeepMind對蛋白質結構的預測已經開始造福人類
這相當于為全球的生物學家和藥物研發人員提供了一份詳盡的“生命地圖”,極大地加速了從癌癥到阿爾茨海默癥等多種疾病的研究,以及疫苗和新藥的開發。
正如紀錄片中所說,這成為了“送給全人類的禮物”。
AlphaFold的成功,完美詮釋了哈薩比斯的初心:在通往AGI的路上,創造出能造福人類的革命性技術。
影片結尾,哈薩比斯凝視著一個由鉛筆搭建的脆弱平衡雕塑,AI告訴他,移動任何一根,整個結構都會崩塌。
哈薩比斯決定聽取AI的建議:
那我最好別管它了,這可能是個好主意。
![]()
這似乎是一個隱喻:我們正處在一個由AI開啟的、充滿無限可能但又極其微妙的時刻。AI的發展已經越過了單純模仿的階段,開始進入與人類協同創造、共同探索未知的全新紀元。
我們正在見證的,或許不僅僅是工具的革新,而是一個新物種的誕生,一個將從根本上重塑科學、藝術乃至人類文明本身的“斯普特尼克時刻”。
紀錄片中,哈薩比斯用這樣一段話結尾。
通用人工智能即將到來,很明顯下一代將生活在未來世界。那里的情況將截然不同,因為人工智能。
而你如果想負責任地管理它,每一刻都至關重要,這就是我一生都在等待的時刻。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.