網易首頁 > 網易號 > 正文申請入駐

人工智能（AI）預測化合物發育毒性的大致路徑

2025-09-04 14:06:11　來源: 藥理毒理開發

北京舉報

分享至

妊娠期用藥極為普遍，>90%孕婦至少使用一種處方藥或非處方藥，但<10%的已上市藥物擁有足夠的妊娠期安全性數據，導致胎兒面臨潛在的發育毒性風險。發育毒性指在受孕前、宮內或出生后暴露于毒物導致的發育異常，表現為圍產期死亡、畸形、生長遲緩、功能障礙等。傳統監管要求（如ICH S5(R3)）依賴全面的動物試驗，覆蓋從交配前到出生后各階段，但這些試驗耗時、耗資。

大數據時代與減少動物試驗的需求推動了人工智能（AI）替代方案的快速發展。目前，基于機器學習（ML）和深度學習（DL）的QSAR模型已廣泛用于預測化學物的發育毒性。新興策略通過整合多模態數據與系統毒理學知識，提升預測的可解釋性、透明度和可靠性，以符合ICH等監管框架。

數據來源和整合

AI建模需要多模態數據整合，包括：1）體內動物實驗；2）體外實驗（如全胚胎培養WEC）；3）多組學數據（轉錄組、蛋白組、表觀基因組、代謝組、影像組學）；4）生物標志物（基因、蛋白、代謝物等）；5）胎盤轉運數據（藥物跨胎盤傳遞能力）。數據來源包括以下路徑。

體內動物數據是核心基準，主要因倫理限制，孕期臨床試驗極少，監管機構（如FDA、EMA）要求以動物數據為主評估發育風險。此外，一些數據庫如ToxRefDB與ECHA，收錄符合OPPTS870.3700或OECD414標準的動物實驗數據，提供NOAEL值（未觀察到不良效應劑量）。還有些新型模型，如斑馬魚具備高通量、透明、發育快，基因與人類高度同源的特點。OSU/PNNLSRP數據庫提供500種化學物、12類斑馬魚表型數據（從致死到特定畸形）。

體外實驗可以考慮全胚胎培養（WEC），培養早期胚胎評估致畸性，但體外實驗忽略了母體因素（如肝臟代謝、ADME過程），且數據規模有限。

還有些數據庫可以提供多組學與生物標志物數據。如Drug Matrix & Open TG-GATEs含有大鼠短期/重復給藥后的毒理基因組學與病理數據。LINCS則整合了數萬種擾動劑的轉錄組/蛋白組數據，構建超千億生物效應關聯網絡。CTD包括人工curated文獻數據，關聯化學物-基因-表型-疾病，支持跨組學整合。Exposome-Explorer提供環境暴露（飲食、污染物）的人體生物標志物數據。Marker DB涵蓋化學、蛋白、DNA等類型的診斷/預測/暴露標志物。Marker支持藥物開發的藥效、安全、監測等治療標志物。

發育毒性自然還要關注藥物的胎盤轉運數據。胎盤是母體與胎兒間的核心屏障，可阻擋藥物/毒物（外源物）。其轉運能力受兩類轉運蛋白調控：1）SLC轉運體：介導攝取或雙向轉運（如滋養層細胞攝取）。2）ABC轉運體：外排泵，將外源物泵出細胞。

胎盤轉運這塊，AI建模需要：1）轉運體相互作用數據（與ABC/SLC的結合能力）；2）ADME參數：蛋白結合率、溶解度、脂溶性等；3）胎盤穿透實證數據：臍血-母血藥物濃度比（CM比值），直接反映胎盤屏障通透性。除了“濕實驗”數據，一些數據庫也可以提供支持，如Drug Bank收錄藥物作用機制及與轉運體互作信息。VARIDT包括轉運體表達/功能的調控因素（如微生物組、表觀遺傳、翻譯后修飾）。

將不同來源的數據整合后，就可以開始建模工作。

AI方法分類

利用機器學習（ML）、深度學習（DL）等AI技術，可以在“分子-細胞-個體”多個生物層級上建立發育毒性預測模型。ML和DL各有優缺點，傳統ML適合小樣本高解釋需求，DL適合大數據高預測需求。根據學習范式又可分為監督學習、無監督學習、半監督學習三類。監督學習是目前的主流，用于毒性分類/劑量估算，無監督/半監督學習用于機制探索和樣本聚類。

基于ML與DL的QSAR模型可能大家所見所聞挺多，QSAR模型由藥物化學家提出，通過化學結構特征（輔以log Kow等物化參數）預測生物活性。從傳統統計方法發展為ML/DL驅動的模型，可以顯著提升預測精度、泛化能力和新藥發現效率。比如內分泌干擾物與雌激素受體（ER）、雄激素受體（AR）的激動/拮抗作用，已經可以用ToxCast/Tox21體外HTS數據訓練分類模型對化合物進行分類，而具備雌雄激素活性的化合物本身就具備極高的生殖毒性風險。又如最新QSAR模型預測體外染色體畸變，準確率80.6%。此外，QSAR模型可以預測化合物CI（清除指數）或CM比值，評估藥物/毒物穿越胎盤屏障風險。另外，對斑馬魚胚胎/幼體AC50（半數活性濃度），ML/DL分類準確率接近83%。當然，QSAR模型也有些局限性，如高質量訓練數據稀缺、化學與生物多樣性覆蓋不足，而且發育毒性機制復雜，涉及多靶點/多通路交互。

可解釋的建模揭示發育毒性潛在機制

監管機構要求計算毒理模型給出可解釋預測，即闡明毒性機制。整合多模態數據與系統毒理學知識，已推動可解釋模型的發展，使人工智能能夠揭示化學物誘發發育毒性的復雜生物學機制。簡單講，不僅能預測結果，還要給出解釋。目前這類模型包括AOP框架、基于成像的模型等。

AOP框架

美國環境保護署（EPA）提出的AOP框架通過整合機制信息促進化學物質危害評估。AOP最核心的內容在于規范化和模塊化了從分子、細胞、組織、器官及至最終個體與群體水平的一系列毒性發生事件，并強調以邏輯推理性來確定這些毒性發生事件的前后關系。因為在AOP概念提出之前，毒理學研究的關注點是相對孤立的，缺乏統一性。AOP-Wiki是OECD協調的國際AOP開發工作的主要數據庫，目前包含485個AOPs。

除了遵循AOP框架的實驗性機制研究外，一些與發育毒性相關的虛擬AOP已通過統計和人工智能方法開發出來。例如：Cendoya等人分析了具有發育毒性終點和靶點信息的化合物數據集，確定了65個蛋白質靶點作為與發育毒性相關的潛在分子起始事件（MIEs）。Gou等人開發了Score AOP系統，該系統將體外高通量篩選生物測定作為MIEs，并結合劑量依賴性轉錄組學分析作為關鍵事件（KEs），用于預測由心血管系統功能障礙引起的發育缺陷和死亡。

在一項評估女性生殖障礙的研究中，化學物質的毒性潛力是基于三個獨立深度學習模型的預測結果來評估的。這些模型旨在確定化學物質是否：1）觸發過氧化物酶體增殖物激活受體γ（PPARγ）激活這一MIE；2）降低芳香化酶活性這一關鍵事件1（KE1）；3）破壞雌二醇合成這一關鍵事件2（KE2）。如果某一化學物質在所有三個機制終點的預測結果均為陽性，則表明其存在導致不良生殖結局的路徑，從而被預測為具有生殖毒性。盡管這項研究并不聚焦于發育毒性，但其所用策略提供了寶貴的框架，可適用于發育毒性AOP建模。

近年來，一些研究將AOP整合到深度學習框架中，以提高模型的準確性和可解釋性。例如，有研究開發了一種深度神經網絡（DNN）模型，利用虛擬AOP框架模擬ER激動劑的毒性路徑。在構建DNN架構時，Ciallella等人將57項HTS生物測定分為五個網絡層，分別對應ER通路中的關鍵生物學過程：作為MIE的受體結合，以及作為KE的受體二聚化、DNA結合、轉錄激活和細胞增殖，最終導致體內嚙齒類動物子宮增重活性（uterotrophic activity）這一有害結局（AO）。這種方法能夠準確預測新化合物的嚙齒類動物子宮增重生物活性。

基于圖像的建模

胚胎、胎兒或幼體的形態發育異常是評估化學物質發育毒性的關鍵指標。斑馬魚胚胎/幼體在不同發育階段的圖像是發育形態學分析的主要數據來源。卷積神經網絡（CNNs）作為圖像建模的主要深度學習技術，已被用于構建預測模型，以識別組織和器官的各種異常形態，助力檢測藥物或毒物的潛在致畸作用。

例如，Dong等人提出了一種基于深度學習的形態計量分析流程，能夠識別斑馬魚幼體的8種異常表型和8種形態計量參數。對特定化學物質引起的表型變化的進一步研究表明，結構和作用機制相似的化學物質會誘導相似的表型變化。

生物標志物識別與基于生物網絡的建模

當前的發育毒性研究已產生了大量生物標志物數據。能將分子水平效應與表型終點或系統水平影響關聯起來的有效生物標志物，對于化學物質毒性的早期檢測至關重要，同時也能提供關鍵的機制方面的信息。

基于ML的方法可用于分析高維數據，以揭示異質數據源（如基因和疾病）之間的細微關系，從而提高生物標志物篩選的精準性。例如，Gerbi等人探究了母體血鉛水平與兒童牙本質鉛水平之間的相關性，并將其用于機器學習建模。該模型以兒童牙本質中每周測量的鉛水平作為生物標志物，能高精度預測母體血鉛濃度，有效反映孕期母體的鉛暴露情況。

生物網絡是生物系統內復雜相互作用的圖形化表示，其中節點代表基因、蛋白質、代謝物等生物實體，邊則表示它們之間的相互關系（上圖D）。這一框架有助于研究化學物質暴露在從基因、蛋白質到細胞、器官及整個生物體等不同生物層面的相關生物相互作用。AI技術的最新進展使研究人員能夠利用網絡中的多維信息開展各類發育毒性建模工作，從而增強預測的可解釋性。例如，EDC-Predictor工具通過基于網絡和機器學習的方法生成計算靶標圖譜，隨后用于訓練機器學習模型，以將化合物歸類為內分泌干擾物（EDCs）或非內分泌干擾物。Yu等人進一步利用EDC-Predictor識別出與可能受EDCs干擾的生物學通路相關的關鍵靶標，以及與EDCs活性相關的毒效基團。

總結

有明確證據表明，隨著多模態數據可獲得性的持續增長，AI正對藥物誘導的發育毒性評估產生深遠影響。其應用范圍廣泛，從不同生物層面的毒性潛力基礎預測，到毒性生物標志物識別、生物網絡分析等，最終旨在揭示未知的毒性機制。

盡管AI在該領域的應用已取得顯著進展，但仍存在一些差距和挑戰。AI驅動的發育毒性建模高度依賴于標注完善、機器可讀的數據集，以及整合這些數據進行有效建模的新策略。盡管存在針對多種數據模態的公共數據庫，但數據缺失和數據錯誤為模型開發帶來了挑戰。數據填補策略（如QSAR模型）有助于緩解數據缺口。然而，這些方法也可能引入不確定性，因此需要仔細驗證以確保發育毒性建模的可靠性。另外，許多AI模型的“黑箱”特性使其應用復雜化，尤其是在監管場景中。目前正在探索多種策略以提高模型的透明度和可解釋性，例如整合結構警示，以及通過融合生物學、化學、毒理學和藥理學知識開發機制性深度神經網絡（DNN）架構。

最后，AI在設計和開發更安全藥物方面前景廣闊，但建立強有力的監管參與至關重要，這有助于對這些新興技術進行標準化和監督。

本文引自：Trends in Pharmacological Sciences, June 2025, Vol. 46, No. 6，doi: 10.1016/j.tips.2025.04.005

藥理毒理開發1-6群已滿，7群還有名額，進群的加微信，備注姓名+企業名稱+專長領域。比如王**+A企業+注冊或毒理。名額有限，已經在1-6群的朋友就不要跨群了。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.