![]()
(來源:MIT TR)
2017 年,剛剛從理論化學博士畢業不久的 John Jumper 聽說,谷歌 DeepMind 正悄然從“打造能擊敗人類的游戲 AI”這條路線轉向一個全新的秘密項目:利用人工智能預測蛋白質結構。他隨即投遞了簡歷。
三年后,他便迎來了足以載入科學史冊的時刻。在 CEO Demis Hassabis 的合作領導下,他共同開發的 AI 系統 AlphaFold2,能夠以接近一個原子寬度的精度預測蛋白質的三維結構——其準確度與實驗室耗時數月的傳統技術相當,卻只需數小時即可得出結果。
AlphaFold2 攻克了生物學界 50 年來懸而未決的一道大題。“這是我創建 DeepMind 的理由。事實上,這也是我整個職業生涯投身 AI 的原因。”Hassabis 曾對筆者表示。
2024 年,Jumper 與 Hassabis 因這一突破共同獲得諾貝爾化學獎。
五年前的這個星期,AlphaFold2 的橫空出世讓科學界震驚不已。如今熱潮已退,它究竟帶來了哪些真正持久的影響?科研人員現在如何使用它?它的下一步又將指向何方?筆者與 Jumper 進行了深入交談。
“這五年非常不真實,”Jumper 笑著說,“我幾乎已經記不得不認識這么多記者的日子了。”
在 AlphaFold2 之后,DeepMind 又推出了能夠預測多蛋白復合體結構的 AlphaFold Multimer,以及速度更快的 AlphaFold3。團隊還將 AlphaFold 應用于全球廣泛使用的蛋白數據庫 UniProt,如今已預測約 2 億種蛋白質結構,幾乎囊括了科學界已知的一切蛋白。
盡管影響巨大,Jumper 對 AlphaFold仍保持著科學家的謹慎:“這不意味著里面的每個預測都是確定無疑的。它是一個預測數據庫,也攜帶著預測本身的全部局限。”
![]()
解開蛋白質之謎,為何如此艱難?
蛋白質是生命的“分子機器”。它們構成肌肉、羽毛、角,負責運送氧氣、傳遞信號;它們讓神經元放電、幫助我們消化食物、驅動免疫系統。這一切功能都依賴于它們折疊成的三維結構。
然而,要從一條氨基酸鏈推斷其最終結構,極其困難。
蛋白可能折疊成天文數量級的結構,預測正確的那一個,就像在宇宙中找一枚硬幣。Jumper 和團隊采用了 Transformer 神經網絡——與大語言模型同源——以捕捉序列中的遙遠關聯。
但 Jumper 認為真正的秘訣是他們迭代速度快:“我們做出了一個能以驚人速度給出錯誤答案的系統。正因為如此,我們才能大膽嘗試各種想法。”
他們盡可能向模型灌注蛋白結構相關信息,如來自不同物種的演化線索。效果遠超預期。“我們確信自己抓住了重大突破,確信這是一次理念上的飛躍。”
他沒有預料到的是,研究人員會直接下載軟件并立即用于如此廣泛的用途。他說:通常來說,真正產生影響的是之后幾代的版本,等一些問題被解決之后。“我對科學家們如何負責地使用它感到非常驚訝。無論是在理解上還是在實踐中,他們使用它的程度恰好與它的可信程度相匹配,既不過度信任也不過低信任。”
![]()
有哪些令他印象深刻的應用?
蜜蜂的抗病研究。Jumper 提到一個團隊,使用 AlphaFold 研究蜜蜂的抗病性:“他們想研究一種與蜂群崩潰有關的蛋白。我從沒想過 AlphaFold 有一天會走進蜜蜂科學。”
“超出適應癥”的創新用法。他特別提到幾類不是 AlphaFold 本來設計用途,但卻因其能力被開辟的新方向。
其一,蛋白設計。華盛頓大學的 David Baker(去年諾獎得主)利用 AlphaFold 的能力加速合成蛋白設計。他們開發了 RoseTTAFold,也嘗試用 AlphaFold Multimer 來提前判斷設計是否可行。“如果 AlphaFold 自信預測出你想要的結構,你就去做;若它猶豫不決,你就不做。光是這點,就讓設計速度提升了十倍。”
其二,把 AlphaFold 當“結構搜索引擎”。兩個研究組曾試圖找出人類精子與卵子在受精時結合的關鍵蛋白。他們已知其中一個卵子蛋白,但不知道精子端的對應物。
于是他們拿已知的卵子蛋白讓 AlphaFold 逐一預測與全部 2000 個精子表面蛋白的結合結構。AlphaFold 自信指出了某一個。隨后的實驗驗證無誤。“以前沒人會做 2000 次結構比對來找一個答案,你現在可以做,這是 AlphaFold 真正改變科研方式的地方。”
AlphaFold2 面世時,筆者曾采訪過幾位早期使用者。五年后,我再次聯系了其中一位,加州大學舊金山分校的分子生物學家Kliment Verba。“毫無疑問,它非常有用。我們每天都在用。”
但它也有明顯的限制。許多科研問題涉及多個蛋白之間或蛋白與小分子之間的復雜互動,而 AlphaFold 在這類預測中的準確度較低。
Verba 說:“有時候你會拿到一個預測,讓你琢磨半天,這到底是真是假?它處在模糊邊界上。”他笑稱:“有點像 ChatGPT——它把真話和胡話都說得同樣自信。”
盡管如此,他們常用 AlphaFold(2 和 3)來做“虛擬實驗”:先在電腦里篩選可能有價值的方向,再決定要不要投入真實實驗室資源。“它沒取代實驗,但確實極大增強了實驗效率。”
![]()
下一波浪潮
如今,許多初創公司和研究機構正在從 AlphaFold 出發,開發更專注于藥物發現的模型
例如今年 MIT 的研究人員與 AI 藥物公司 Recursion 合作,推出了一種名為 Boltz-2 的模型,它不僅能預測蛋白結構,還能預測潛在藥物分子與其靶點的結合效果;上個月,初創公司 Genesis Molecular AI 發布了另一種結構預測模型 Pearl,該公司聲稱 Pearl 在某些與藥物開發相關的問題上比 AlphaFold3 更準確。Pearl 是交互式的,可以讓藥物開發者將任何額外的數據輸入模型,以指導預測。
那新藥會因此更快出現嗎?Jumper 并不樂觀主義過頭蛋白結構預測只是生物研究中的一步。我們不是只差一個結構就能治愈疾病。”
他打比方說:“如果我們真的只差十萬美元(過去確定一個蛋白結構的成本)就能完成某事,那這件事早就被做了。”但他仍希望結構預測能發揮更大作用:“既然我們現在有一把威力巨大的錘子,那就盡量讓它敲更多的釘子。”
![]()
接下來呢?
Jumper 的下一步計劃,是把 AlphaFold 的“垂直深能力”與 LLM 的“橫向理解能力”結合起來。“我們已經有能閱讀科學文獻、能進行部分科學推理的機器了;也有能在蛋白結構預測上達到超人水平的系統。現在的問題是:怎么讓它們協同?”
這讓筆者想到 DeepMind 另一個系統 AlphaEvolve——一個 LLM 生成假設,另一個模型負責篩選。它已在數學和計算機科學領域取得多個實際發現。
我問他是否也在做類似方向,他只是微笑。“我不便多說。但如果未來 LLM 在科學發現中的作用越來越大,我一點也不會意外。這是一個巨大而開放的問題。”
對于下一步的規劃?Jumper 說:“這多少讓我有些不安。我可能是 75 年來最年輕的化學獎得主。”
他補充:“我現在大概處在職業中點。我的策略是從一些小想法開始,慢慢沿著線索往下拉。下一次我發表的成果,不需要是第二個諾獎的候選。我認為那是個陷阱。”
https://www.technologyreview.com/2025/11/24/1128322/whats-next-for-alphafold-a-conversation-with-a-google-deepmind-nobel-laureate/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.