人類蛋白組中潛在的真實互作約7.4萬至20萬對,而可能的蛋白-蛋白互作對總數高達2億。如何在如此龐大的搜索空間中準確識別出真實的相互作用,一直是領域內的巨大挑戰。2025年9月,Science雜志發表題為Predicting protein-protein interactions in the human proteome的里程碑式研究成果。
![]()
這項工作系統性地構建了迄今為止最全面的人類蛋白相互作用(PPI)的高精度預測模型,通過整合30PB基因組數據與深度學習技術,系統鑒定了17,849組高置信度蛋白相互作用,其中 3,631 組為首次發現的全新互作關系,不僅大幅拓展了我們對生命分子網絡的認識,更為理解疾病機制、推動精準醫療提供了前所未有的分子藍圖。
![]()
研究團隊開發了omicMSA技術,從2萬多種真核生物的基因組數據中直接組裝蛋白序列,將共進化信號的分析靈敏度提升7倍,相當于為“模糊的星空圖”裝上高分辨率望遠鏡。
![]()
在此基礎上,利用AlphaFold數據庫中的200萬個高質量單體結構,提取出100萬組域-域相互作用,訓練出深度學習網絡 RoseTTAFold2-PPI(RF2-PPI)模型。該模型在保持90%高精度的同時,速度比AlphaFold2快20倍,真正實現又快又準。
![]()
基于上述技術,研究人員系統篩選了2億對人類蛋白對,最終鑒定出17,849組高置信度蛋白互作,其中3,631組為以往未知的新互作。這些預測不僅覆蓋大量跨膜蛋白、免疫相關蛋白等難以實驗檢測的類型,還提供了高質量的三維結構模型,為機制研究打下基礎。
![]()
從“基因變異”到“致病機制”,該模型的預測結果在多個疾病方向上展現出重要價值。比如,首次預測KLRG1與TLR3的相互作用,其界面突變與皰疹病毒腦炎易感性直接相關;發現未表征蛋白C8orf82與電子轉移黃素蛋白復合物結合,為能量代謝障礙提供新機制;揭示CFAP91在精子鞭毛形成復合物中的支架作用,解釋了CATIP突變致病的結構基礎。
![]()
研究團隊已公開所有預測結果和中間數據,這項研究不僅是數據庫的擴充,更是研究范式的轉變——從“假設驅動”轉向“數據驅動”的生物學發現。當然,這項宏大的互作研究也存在明顯的缺陷——沒有實驗驗證。但是,它盡可能地為我們展現了蛋白互作的各種可能性,拓寬了我們對互作的認識和認知。美是一種呈現,好好欣賞。
除了蛋白互作可以做美圖,發頂刊,蛋白與疾病或表型的相關性也可以做美圖,發頂刊。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.