抗菌素耐藥性(AMR)已成為全球健康的嚴重威脅,僅2021年就報告了數百萬相關死亡病例。開發新型抗生素以繞過耐藥性,或利用聯合療法恢復現有抗生素療效,是當前的主要策略。然而,新抗生素的發現愈發困難。宿主防御肽(HDPs)及其模擬物——聚合物抗生素,因其可破壞細菌膜、調節免疫等特點而備受關注,但其臨床轉化受限于毒性、穩定性和成本。聚合物抗生素的設計空間廣闊,但傳統的發現方法依賴經驗試錯,效率低下。盡管深度學習在抗菌肽發現中取得進展,但由于聚合物數據稀缺、結構多樣且分子表征復雜,其在聚合物抗生素領域的應用仍然有限。
針對這一挑戰,浙江大學計劍教授、張鵬研究員團隊開發了一個名為PolyCLOVER的深度學習框架。該框架整合了多階段自監督學習、主動學習和高通量實驗,能夠在無需依賴外部標記數據集的情況下,高效探索廣闊的聚合物化學空間,迭代發現具有強效抗菌活性和低毒性的聚合物抗生素。應用于一個包含約10萬個聚(β-氨基酯)的組合庫中,該框架成功發現了三種先導化合物,它們能自組裝成穩定的納米顆粒,對多重耐藥的金黃色葡萄球菌和鮑曼不動桿菌表現出優異的抗菌活性,并能作為抗生素佐劑載體,恢復細菌對青霉素G的敏感性。體內研究證實了其單獨或聯合用藥的治療效果。相關論文以“Iterative discovery of potent polymeric antibiotics via multi-stage and multi-task learning against antimicrobial resistance”為題,發表在
Nature Communications上。
![]()
研究團隊首先構建了一個包含約10萬種聚(β-氨基酯)自組裝納米顆粒(SANPs)的組合庫(圖1b)。他們從庫中隨機選取220個樣本進行實驗,測試其抗耐藥金黃色葡萄球菌活性和溶血性,形成了初始數據集。結果顯示,在龐大的庫中通過隨機采樣找到高效低毒SANPs的概率極低(圖2b),凸顯了機器學習輔助設計的重要性。為了在數據有限的條件下提升模型性能,研究采用了圖神經網絡,并創新性地引入了兩階段自監督預訓練策略(圖2d)。首先在大規模未標記通用聚合物數據上預訓練,然后在目標聚(β-氨基酯)庫上持續預訓練,最后在小規模標記數據上微調。可視化分析表明,預訓練后的模型能更好地捕捉聚合物結構特征,在潛空間形成清晰聚類(圖2e)。與基線方法相比,該策略顯著提升了預測性能(圖2f, g),為后續優化奠定了堅實基礎。
![]()
圖1 | PolyCLOVER概覽。 a, PolyCLOVER工作流程。基于構建的庫,通過兩階段多任務自監督學習預訓練圖編碼器。從庫中采樣初始子集,通過高通量合成及抗菌活性和溶血率表征生成標記數據集。隨后微調圖編碼器,形成由20個基礎學習器組成的集成預測器。預測器評估庫中未標記SANPs的活性和預測不確定性,通過UCB采集函數和K-Means聚類指導迭代選擇新候選物。此過程循環迭代。b, 組合庫構建。該庫基于二丙烯酸酯和胺單體的邁克爾加成反應構建。根據溶解度和成本,從市售來源中選擇了8種二丙烯酸酯和38種胺,包括16種帶有叔胺側基或Boc保護伯胺基的胺、16種帶有疏水側基的胺和6種帶有親水側基的胺。控制B、C、D的比例在適當范圍內以驅動自組裝,形成約10萬種聚(β-氨基酯)SANPs。c, 體外/體內驗證。進行了額外的體外實驗以表征所選SANPs的詳細抗菌活性、細胞毒性和粒徑。在肺炎和腹膜炎模型中驗證了SANPs單獨或與青霉素G聯用的體內治療效果。
![]()
圖2 | 模型訓練與評估。 a, 初始標記數據集中不同類型構建塊的數量。構建塊ID對應的結構見補充表1。b, 初始數據集中抗菌活性和溶血特性的分布。頂部和右側軸的邊緣直方圖顯示各屬性的分布。等高線使用核密度估計繪制,閾值為0.15。坐標軸數值越低表示抗菌活性越強、血液相容性越好。c, 不同骨干網絡在抗菌和溶血特性上的平均測試性能。報告了三次獨立運行的測試均方根誤差平均值。d, 數據預處理和模型架構。圖Transformer依次在未標記聚合物數據集和構建的未標記納米顆粒數據集上進行預訓練,以學習豐富的結構特征。然后使用標記的納米顆粒數據集進行微調,以預測抗菌和溶血特性。e, 由預訓練和未預訓練的圖編碼器生成的表征的t-SNE可視化。每個數據點根據所用二丙烯酸酯的類型著色。f, 所提方法的測試性能。為便于在雷達圖上可視化,皮爾遜相關系數顯示為1-R,其中封閉區域越小表示性能越好。報告了三次獨立運行的測試均方根誤差平均值。g, 所提模型的測量值與預測值關系圖。虛線代表理想情況(y = x)。右下角顯示皮爾遜相關系數。
PolyCLOVER的核心是一個基于貝葉斯優化的主動學習工作流(圖1a)。它利用集成預測器評估庫中剩余未標記SANPs的活性與不確定性,通過上置信界采集函數平衡探索與利用,并結合K-Means聚類篩選出每一輪待實驗驗證的候選者(圖3a)。經過多輪迭代,模型引導的篩選使得候選聚合物的抗菌活性不斷增強,溶血毒性持續降低(圖3b-d)。優化過程也揭示了關鍵結構特征的趨勢,例如疏水性和正電荷比例的變化(圖3e, f),以及特定構建塊(如B10和C16)的出現頻率增加(圖3g)。最終,從庫中成功篩選出多個滿足高效低毒標準的候選SANPs(圖3h)。
![]()
圖3 | 基于貝葉斯優化的主動學習過程。 a, PolyCLOVER篩選SANPs各步驟所耗時間。b, c, 每一輪中抗菌(b)和溶血(c)特性的熱圖。d, 每一輪中抗菌和溶血特性的密度圖。數值越低代表抗菌活性越好、血液相容性越佳。每輪包含 n = 60 個(初始輪 n = 220)結構不同的樣本。等高線顯示核密度估計,白點為中位數,粗條為四分位距,細線為95%置信區間。此可視化方案也用于(e)和(f)。e, f, 平均LogP (e) 和正電荷比例 (f) 在迭代優化輪次中的演變。每個納米顆粒的LogP值根據其構建塊的組成比例加權計算得出。g, 各構建塊在迭代優化輪次中的出現頻率。框內插圖顯示B10和C16的結構。h, 滿足標準的SANPs的最低抑菌濃度值和選擇性指數。虛線上方的樣本代表MIC大于 32 μg/mL。選擇性指數計算為 HC50 與 MIC 的比值。
在發現的候選物中,三種命名為H1、H2和H3的SANPs脫穎而出(圖4a)。它們由特定的二丙烯酸酯和胺類單體以特定比例構成,能自組裝成粒徑約100納米、帶正電的納米顆粒(圖4b)。體外實驗表明,三者均對耐藥金黃色葡萄球菌具有強效殺菌活性,其中H3殺菌速度極快,4分鐘內即可殺滅90%的細菌,遠超需要數小時起效的鏈霉素(圖4c, e)。更重要的是,這些SANPs不易誘導耐藥性產生,在28天傳代實驗中其最低抑菌濃度僅輕微波動(圖4f)。它們對一系列臨床分離的耐藥革蘭氏陽性菌(包括MRSA、VISA等)有效,但對大多數革蘭氏陰性菌活性有限,顯示出選擇性抗菌譜(圖4g)。機制研究表明,這些SANPs通過快速破壞細菌細胞膜發揮殺菌作用,透射電鏡觀察到了明顯的膜解體(圖4h),活/死細菌染色和膜電位探針實驗也證實了其膜靶向特性(圖4i, j)。分子動力學模擬進一步揭示了SANPs通過靜電作用吸附并破壞細菌膜的過程(圖4k)。
圖4 | 已發現SANPs的結構、體外抗菌活性及抗菌機制。 a, 所選已發現SANPs(H1, H2, H3)的詳細信息,包括分子結構、單體比例、MIC值和溶血毒性。b, 已發現SANPs的粒徑分布、Zeta電位和TEM圖像。比例尺:1 μm。c, SANPs和鏈霉素在 32 μg/mL 濃度下孵育 9 小時的殺菌性能。使用單因素方差分析進行統計分析。d, 已發現SANPs在胰蛋白酶大豆肉湯和胎牛血清中MIC值的變化。e, 已發現SANPs和鏈霉素在 32 μg/mL 濃度下100分鐘內的殺菌動力學。f, MRSA在TSB培養基中傳代28天后對已發現SANPs和鏈霉素的耐藥性演變。g, 已發現SANPs對3種參考菌株和11種臨床分離耐藥病原體的MIC值。革蘭氏陽性和陰性菌分別顯示在左右兩側。每個測試進行了三次獨立實驗。h, MRSA與已發現SANPs在 64 μg/mL 濃度下孵育 10 分鐘后的TEM圖像。比例尺:200 nm。i, MRSA與已發現SANPs在 64 μg/mL 濃度下孵育 15 分鐘后的活/死細菌染色。對照:僅用PBS處理;未使用抗菌劑。比例尺:20 μm。j, 已發現SANPs和鏈霉素在 64 μg/mL 濃度下誘導膜電位破壞的熒光分析。使用單因素方差分析進行統計分析。k, H2與細胞膜相互作用的分子動力學模擬。
在小鼠急性肺炎模型中,靜脈注射H1、H2或H3均能顯著降低肺部細菌載量,療效與鏈霉素相當,并有效緩解肺部感染和組織損傷,且未表現出明顯組織毒性(圖5a-d)。熒光標記實驗顯示,注射后SANPs主要集中在肝臟和肺部,表明其能有效遞送至感染部位(圖5e, f)。
![]()
圖5 | 已發現SANPs在體內治療急性肺炎的療效。 a, 小鼠急性肺炎模型構建和治療方案示意圖。第0天,用異氟烷麻醉小鼠,氣管內接種MRSA菌懸液以誘導感染。第1天,通過尾靜脈注射給予已發現的聚合物H1、H2、H3和鏈霉素,劑量為 5 mg/kg。第2天,處死小鼠,取出肺臟進行形態學觀察。肺組織勻漿用于細菌菌落計數。b, 小鼠肺部外觀視覺檢查及組織勻漿細菌培養以評估感染。c, 通過菌落計數對感染小鼠肺細菌載量進行量化。d, 使用H&E、Masson和CD68染色對肺組織進行組織學分析,以評估組織損傷、纖維化和炎癥程度。比例尺:300 μm。e, f, SANPs在小鼠體內分布的定量結果及熒光成像,以確定組織靶向效率。
除了固有的抗菌活性,這些SANPs還展現出作為抗生素佐劑的巨大潛力。棋盤實驗表明,它們與青霉素G(PG)具有顯著的協同作用,尤其是H2與PG的復合物(圖6a)。H2能高效包裹PG,形成穩定的納米復合物,幾乎完全封裝藥物,載藥率接近50%(圖6b)。分子模擬證實了二者之間存在靜電相互作用(圖6c)。在致命的MRSA腹膜炎模型(圖6d)中,單獨使用PG療效甚微,而H2-PG納米復合物則表現出與鏈霉素相當的強大抗感染效力,能大幅降低各器官的細菌載量和炎癥因子水平,并改善組織病理損傷(圖6e-h)。急性毒性評估表明H2及其復合物具有良好的體內安全性。
![]()
圖6 | 已發現SANPs恢復MRSA對青霉素G敏感性的體外機制驗證及體內療效評估。 a, 棋盤實驗評估已發現SANPs與青霉素G對MRSA的抗菌協同作用。右上角顯示FICI值。b, SANPs-PG納米復合物的表征,包括粒徑分布、形態、包封效率和載藥量。c, H2與PG組裝過程的分子動力學模擬。d, 致命性MRSA腹膜炎模型及相應治療策略示意圖。第1天和第3天腹腔注射環磷酰胺以誘導免疫抑制。第4天,腹腔感染MRSA。感染后,腹腔注射給予H2、PG、鏈霉素、H2-PG納米復合物或PBS對照。24小時后處死小鼠,收集血清和組織樣本。e, 肝組織勻漿培養的細菌菌落平板圖像。f, 肝、腎、脾、肺組織中細菌載量的量化。g, 小鼠血清中炎癥細胞因子的濃度。h, 肝、腎、脾、肺切片的H&E染色組織學分析。比例尺:300 μm。
綜上所述,PolyCLOVER框架成功實現了在無需外部數據集的情況下,于超大聚合物化學空間中高效發現兼具強效抗菌活性和低毒性的新型聚合物抗生素。這些抗生素不僅能直接殺菌,還能作為載體恢復耐藥菌對傳統抗生素的敏感性。該研究采用的跨導式多階段學習策略,為數據稀缺條件下的大規模化學庫篩選提供了高效范式。更廣泛地看,PolyCLOVER作為一個可推廣、可擴展的平臺,不僅適用于聚(β-氨基酯),未來還有望擴展到其他聚合物骨架和復雜拓撲結構,通過與內部實驗數據的持續交互,在大化學空間內實現功能聚合物的自主進化與設計,為下一代智能化、自適應聚合物生物材料的發現提供了藍圖。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.