![]()
智東西
作者 江宇
編輯 云鵬
智東西1月29日報道,今日凌晨,2024年諾貝爾化學獎得主、谷歌DeepMind CEO Demis Hassabis帶領團隊研發的AI基因組模型——AlphaGenome,登上了頂級期刊Nature(自然)最新一期封面。這是繼AlphaFold之后,DeepMind又一項重磅生命科學研究登上Nature。
![]()
AlphaGenome旨在解決生物學中一個長期未解的難題:人類基因組中約98%的非編碼區域雖然不直接產生蛋白質,卻調控著基因的開啟、剪接與表達,其變異常常與疾病風險密切相關,但難以用傳統手段解析。
為此,DeepMind研究團隊構建了一個全新AI架構,可輸入百萬堿基長度的DNA序列,并以單堿基分辨率,預測RNA表達量、剪接結構、染色質可及性、轉錄因子結合位點乃至三維結構等近6000項調控特征。
該項目論文題為《Advancing regulatory variant effect prediction with AlphaGenome(借助AlphaGenome技術提升調控變異的效應預測能力)》,也是首次有AI模型實現了對人類基因調控“從序列到功能”的統一建模。
![]()
過去40億年積淀的生命遺傳密碼,如今正被AI工具以“統一建模”的方式重新解碼。
DeepMind在2025年6月曾通過博客預告此項目,彼時AlphaGenome已向科研界開放預覽API,重點在于構建一個更具解釋力和泛化能力的DNA序列模型,作為一種“通用型變異解讀引擎”投入研究使用。
此次正式發表在Nature的版本中,DeepMind團隊不僅完成了全模態性能評估,更在多個疾病變異機制中展示了AlphaGenome的推理能力,包括如何準確預測TAL1致癌突變的激活機制,全面驗證了AlphaGenome在剪接、表達、染色質狀態等關鍵通路上的預測能力。
研究者認為,這一模型將為罕見病致因定位、新型治療靶點發掘、以及合成生物學設計等方向提供強有力的通用工具。
論文鏈接:https://www.nature.com/articles/s41586-025-10014-0
一、百萬級DNA輸入和堿基級預測,突破“長序列”與“高分辨率”難題
AlphaGenome的核心創新之一,是首次將輸入DNA序列長度提升至100萬堿基(1Mb),同時在輸出層保持了堿基級別的預測精度。
這打破了以往模型在“長序列”與“高分辨率”之間的權衡。例如,以往的SpliceAI等模型雖然具備高分辨率,但受限于只能處理1萬堿基以內的短序列,難以捕捉遠距離調控。
而Enformer等模型雖能處理20萬至50萬堿基的長序列,卻需犧牲精度,用128bp等為單位分箱預測,無法精準描摹剪接位點、增強子與啟動子的細粒度結構。
在訓練流程上,AlphaGenome采取了“預訓練+蒸餾”的兩階段架構,通過多個TPU并行處理、序列平行化、U-Net結構和Transformer結合,既保留了細節,又擴大了上下文范圍。
![]()
▲AlphaGenome模型架構、訓練方案和綜合評估性能
在跨24項基因組軌跡任務中,AlphaGenome在22項上超越當前最佳模型;在26項變異效應預測中,有25項達到或超過當前SOTA模型的表現。
![]()
▲研究團隊基因組軌道上的預測性能進行了逐項評估
二、統一預測機制,變異影響“一鍵總覽”
與傳統模型需要分別針對不同任務(如剪接、表達、染色質結構)訓練不同網絡不同,AlphaGenome是第一個可在單次推理中同時輸出11類模態(modality)預測結果的統一模型。
它支持從一段DNA序列中,直接推斷出RNA表達水平、剪接位點及使用情況、染色質可達性、轉錄因子結合位點、組蛋白修飾模式、三維接觸圖譜等調控特征,且適用于人類與小鼠細胞在數千種不同細胞或組織類型中的表現。
這種“多模態聯合”結構為突變解析帶來了全新視角。
研究人員可以對任意一個DNA變異,通過模型快速預測它在多個調控層級的影響,并比較參考與突變版本的差異,進而推斷該變異是否會導致表達上調、剪接改變,或染色質狀態變化。
論文中特別展示了模型如何成功預測致癌突變激活TAL1基因的路徑機制,驗證了其在非編碼區變異解釋中的實際價值。
![]()
▲AlphaGenome對T-ALL中TAL1致癌突變的多模態預測示例
三、剪接預測能力升級,有望推動罕見病研究
RNA剪接異常是諸多罕見病(如脊髓性肌萎縮癥、囊性纖維化)的致病根源,但傳統AI模型往往只能識別剪接位點本身,而難以全面解析剪接使用率及剪接連接模式(splice junction)。
AlphaGenome首次在模型中引入了剪接連接點的直接預測能力(splice junction modeling),結合位點預測與使用率分析,構建出更完整的剪接調控圖譜。
在GTEx等數據集中,該模型成功預測多個已知致病突變對剪接的影響,在ClinVar和MPRA等數據集上亦取得當前最優的評估成績,在7個剪接效應任務中,AlphaGenome在6個上表現最佳。
![]()
▲AlphaGenome在剪接變異效應預測任務中達到SOTA水平
這項能力對于理解非編碼變異如何引發病理剪接、用于新型診斷方法開發具有重要推動作用。
結語:繼AlphaFold之后,DeepMind用AI再解“生命之書”
AlphaGenome的出現不僅為DNA序列建模設立了一個全新技術基線,也為生命科學研究者打開了一扇觀察遺傳調控全貌的新窗口。
其覆蓋廣泛模態、支持長序列輸入、具備單堿基預測精度的能力,使其在解碼基因調控代碼、理解變異影響路徑、指導合成DNA設計等領域具備廣泛前景,下一代疾病機制研究、罕見病診斷及合成生物學提供了通用工具基礎。
隨著模型向學術界開放,AlphaGenome或將成為“基因版AlphaFold”的有力繼任者。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.