罕見病 診斷一直是醫學界的難題。
傳統方法存在著檢測流程復雜、報告解讀困難等問題,約半數患者因缺乏明確病因治療受阻。
近日,《Nature Genetics》期刊上發布了一項名為“Proteome-wide model for human disease genetics”的研究,哈佛醫學院和巴塞羅那基因組調控中心(CRG)的研究人員開發出一款名為popEVE的AI蛋白質模型。
![]()
該模型是一款結合進化信息和人類群體數據的深度生成模型,能在全蛋白質組范圍內評估變異的有害程度。有望徹底改變遺傳疾病的診斷方式。
為驗證模型效能,團隊分析了超過3.1萬個患有嚴重發育障礙的兒童家庭遺傳數據。
在98%的病例中,popEVE將共同突變標記為最具破壞性的變異,其表現優于谷歌DeepMind團隊AlphaMissense在內的同類工具。
與此同時,popEVE還發現了123個此前被認為與發育障礙無關的基因,其中104個僅在個別病例中出現。
![]()
能判斷“嚴重程度” 無需父母數據
早在2021年,該團隊就發表了變異效應進化模型EVE,當時該模型就能將人類疾病基因中的突變分類為良性或有害,但其分數無法直接在基因間進行比較,并確定哪種對健康影響最為嚴重。
而新推出的popEVE在大型語言蛋白質模型實現提升的基礎上,結合了來自英國生物樣本庫內的海量人類數據,實現了AI輔助罕見病診斷的全新突破。
在測試中,該模型不僅能區分致病變異和良性變異,還能 識別出健康對照組,平均精度比次優模型(AlphaMissense)提升3.2%。并且該模型能僅憑兒童基因組識別可能的因果變異,無需父母數據。
popEVE最大的突破,還是實現了對“嚴重程度”的判斷。
![]()
popEVE的示例輸出。左側和中間面板顯示了圖表和列表格式的變異分數,從最可能致病的深紫色到最不可能的黃色。右側面板描繪了帶有變體分數的蛋白質晶體結構。圖片來源:Marks實驗室
在臨床情況下,一些蛋白的功能受損可能在晚年產生適度影響,而另一些蛋白的破壞在兒童期可能致命。
這 兩種情況都可以被視為“致病”,但在試圖找出嚴重疾病的遺傳原因時,模型必須能夠區分這兩種情況。
![]()
力壓DeepMind不止罕見病診斷
2023年,開發出AlphaFold的谷歌Deep Mind團隊 開發了一款名為AlphaMissense的 模型,作為AlphaFold的一種改進衍生工具,實現對錯義突變的致病性預測。
該模型以接近89%的準確率一鳴驚人,推開了AI模型輔助診斷遺傳疾病的大門。
然而,開發了popEVE的哈佛團隊認為,雖然AlphaMissense在蛋白質穩定性方面準確,但缺乏診斷所需的臨床校準。
統計分析顯示,AlphaMissense預測平均每個人會有五種“致病”變異,而popEVE預測不到一種。這種差異在臨床環境中至關重要,因為過度預測可能導致誤診和不必要的焦慮。
盡管性能有所提升,popEVE仍是一個研究工具尚未獲得FDA批準作為獨立診斷設備使用,目前已開源且可以通過在線門戶直接訪問使用。
![]()
在線門戶:https://pop.evemodel.org/
開源鏈接:https://github.com/debbiemarkslab/popEVE
據悉,該模型未來的應用不僅限于診斷,還將擴展到藥物發現,因為該模型能夠精確定位蛋白質結構中的特定致病機制。
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.