傳統藥物研發是一場漫長而孤獨的賭博。一款新藥從實驗室的靈光一現到最終擺上藥房的貨架,平均需要耗費12至15年的光陰,投入超過20億美元的資金,而成功率卻不足10%。科學家們在數以億計的化合物海洋中“大海撈針”,在復雜的生物體內進行著近乎盲人摸象般的試錯。這種基于經驗主義和偶然性的研發模式,在21世紀的今天,已然觸碰到了效率的天花板。
然而,變革的雷聲已至。隨著 AI 熱潮的再度興起,人工智能(主要是以 DNN 為核心的深度學習技術)輔助藥物發現與設計(AIDD)也成了生物醫藥領域的研究熱點。
![]()
“ AI賦能 ”絕非空談。它在藥物研發的各個關鍵環節都展示出了超越人類直覺的計算能力。 那它究竟解決了哪些具體的痛點?
一、AI在藥物靶標發現與確認中的應用
藥物研發的第一步,是找到“靶標”——即疾病發生的分子開關。如果把藥物比作一把鑰匙,靶標就是那把鎖。而在人體這個由2萬多個基因、數十萬種蛋白質構成的巨大迷宮中,找到那把對的鎖,無異于大海撈針。AI的介入,為我們提供了全景式的導航圖。
1. NLP技術
人類科學家面臨的一個巨大痛點是“信息過載”。每天都有成千上萬篇生物醫學論文發表,海量的知識被淹沒在浩如煙海的文本中。
自然語言處理(NLP)技術成為了不知疲倦的“超級閱讀者”。
?實體識別與關系抽取:NLP算法可以掃描PubMed等數據庫中的所有文獻和專利,精準識別出基因、蛋白質、化合物的名稱,并抽取它們之間的動詞關系(如“磷酸化”、“抑制”、“上調”)。
?知識圖譜構建:結合DNN技術,AI將這些碎片化的信息拼接成一個龐大的動態知識圖譜。通過圖算法,AI可以預測出那些在文獻中從未直接提及、但邏輯上隱含的潛在靶標-疾病關聯。
2. 多組學數據
現代生物學已經進入了“多組學”時代。基因組、轉錄組、蛋白質組、代謝組數據構成了生命的數字孿生。
AI擅長處理這種高維、高噪音的數據:
?差異分析:通過對比患者與健康人的多組學數據,AI利用機器學習(如隨機森林、XGBoost)識別出關鍵的差異表達分子。
?網絡藥理學:AI分析生物網絡(信號轉導網絡、代謝反應網絡、PPI網絡),尋找那些處于網絡樞紐位置(Hub)的關鍵蛋白。攻擊這些樞紐往往能起到牽一發而動全身的治療效果。
3. 高內涵篩選與計算機視覺
除了數字,圖像也是重要的信息載體。基于高內涵篩選(High-Content Screening, HCS)和顯微成像技術,細胞的形態變化往往預示著藥物的作用機理。
深度學習中的卷積神經網絡(CNN)具備超人的視覺能力。它能察覺到人類肉眼無法分辨的細微形態變化——比如線粒體的輕微腫脹、細胞骨架的微小重排或染色質紋理的改變。
表型篩選:AI將細胞圖像轉化為高維特征向量,通過聚類分析,發現具有相似表型效應的基因或化合物,從而推斷潛在靶標的功能。這種方法被稱為“圖像組學”或“細胞繪畫”。
4. 結合親和力的精準預測
在確定了潛在靶標后,還需要驗證小分子是否能與其結合。
傳統的分子對接計算量大且準確率有限。AI模型(如DeepDTA, GraphDTA)將蛋白質序列或結構與小分子結構作為輸入,視為一種“翻譯”問題或“圖像匹配”問題,直接預測兩者的結合親和力。這大大加速了靶標驗證的過程。
二、AI在先導化合物發現中的應用
一旦鎖定了靶標,下一步就是尋找能結合這把鎖的鑰匙——先導化合物。這一階段,AI正引領著從“篩選”到“生成”的革命性轉變。先導化合物發現的手段主要有高通量篩選、虛擬篩選(包括分子對接、分子間相互作用預測、成藥性參數預測)、藥物重定向和基于片段的藥物篩選。
1. 虛擬篩選
傳統的高通量篩選(HTS)需要在實驗室中利用自動化機械臂測試數百萬個實體化合物,耗資巨大,且受限于實體庫的規模(通常在106數量級)。
AI驅動的虛擬篩選將這一戰場轉移到了計算機中。
?超大規模庫篩選:AI模型可以在包含數十億甚至數千億分子的虛擬庫(如Enamine REAL Space)中進行快速搜索。
?藥效團匹配與形狀搜索:AI不僅僅看化學結構,更看分子的3D形狀和靜電勢分布,尋找與靶點口袋完美互補的分子。
?案例:在2020年新冠疫情初期,BenevolentAI利用其知識圖譜和虛擬篩選技術,在短短幾天內就篩選出巴瑞替尼(Baricitinib)可能有效,后經臨床證實并獲批,這在傳統研發中是不可想象的。當然,AI擅長發現科學上的關聯,而藥物的商業再生則需要市場數據的支撐。在AI篩選出老藥候選名單后,借助摩熵數據的上市藥物及一致性評價板塊,快速評估其原研專利狀態及仿制藥競爭格局,能幫助決策者迅速判斷:這究竟是一個值得投入的“新機會”,還是一片無利可圖的“紅海”。
2. 從頭設計(De Novo Design)
我們正處于AI最令人心潮澎湃的變革前沿。傳統的藥物發現長期受限于“篩選”模式——即在有限的已知分子庫中試圖找出符合要求的化合物,如同在大海中撈針。然而,人工智能與計算化學的深度融合,徹底顛覆了這一邏輯,催生了“從頭設計”(De Novo Design)的新紀元。
這一飛躍的核心驅動力,源自生成式AI(Generative AI)技術的爆發式增長。從早期的變分自編碼器(VAE)到生成對抗網絡(GANs),再到如今備受矚目的擴散模型(Diffusion Models),這些算法賦予了計算機理解并重構化學結構的能力。它們不僅僅是在預測性質或結合力(傳統AI的角色),而是致力于在廣闊化學空間中進行導航與繪制,打破了現有類藥數據庫的邊界。
從頭分子設計主要采用兩種策略。
整體生成:從零開始構建分子的完整拓撲結構。這不僅是尋找新藥的利器,更是探索未知化學版圖的指南針,特別適用于缺乏先例的早期發現階段。
迭代生成:以逐步添加原子或片段的方式構建分子。這種策略具備極高的可控性,能夠針對特定生物靶點或材料性能要求,對分子進行精準的定向優化與定制。
案例:Insilico Medicine的突破
一個標志性的案例是Insilico Medicine。他們利用生成式AI平臺Chemistry42,針對特發性肺纖維化(IPF)這一難治疾病,發現了一個全新的靶點,并設計出了一款全新的候選藥物ISM001_055。從靶點發現到提名臨床前候選化合物,僅用時18個月,花費260萬美元,而傳統方式通常需要4-5年和數億美元。這一成果于2024-2025年間在Nature Medicine等頂級期刊發表,并進入了二期臨床試驗,成為了AI制藥的里程碑。
![]()
圖源:摩熵醫藥數據庫
3. 合成路線的同步規劃
藥物化學中有一個經典難題:“設計得出,造不出”。很多AI生成的分子結構極其復雜,難以合成。
現在的AI在設計分子的同時,會同步運行逆向合成預測算法(如MIT開發的ASKCOS或IBM的RXN)。它像一個經驗豐富的老合成師,瞬間規劃出從廉價原料到目標分子的合成路徑,并預測每一步的反應條件和產率。這確保了AI設計的分子不僅好看,而且好做。
三、AI在先導化合物優化中的應用
找到先導化合物只是開始,它往往像一塊璞玉,活性雖好,但可能毒性大、代謝快或溶解度差。將璞玉雕琢成美玉的過程,稱為先導化合物優化。這是一個在多個相互沖突的目標中尋找平衡的藝術。
1. 數據增強與小樣本學習的奇跡
先導化合物優化面臨的最大挑戰是“小數據”。對于一個新的骨架,往往只有幾十個衍生物的活性數據。深度學習通常是“數據饑渴”的,但在藥物化學中,我們往往面臨數據貧乏的困境。
AI通過遷移學習和數據增強技術破局。
?遷移學習:模型先在包含數百萬個分子的通用數據庫(如ChEMBL)上進行預訓練,學習化學鍵、官能團等基本“語法”規則。然后,再用那幾十個特定的先導化合物數據進行微調。這就像讓一個博學的語言學家去學習一門新的方言,遠比從頭學起要快得多。
?低樣本學習:結合元學習算法,AI能從極少量樣本中快速捕捉構效關系(SAR)。
2. 多目標優化的帕累托前沿
一個完美的藥物,必須同時滿足一系列嚴苛的條件:高活性(Potency)、高選擇性(Selectivity)、良好的吸收(Absorption)、合理的分布(Distribution)、適度的代謝(Metabolism)、有效的排泄(Excretion)和低毒性(Toxicity)。這就是著名的ADMET性質。
這往往是一個“按下葫蘆浮起瓢”的蹺蹺板游戲:為了提高活性增加疏水性,可能會導致溶解度下降;為了增加代謝穩定性引入鹵素,可能會增加分子量。
AI模型(如多任務圖神經網絡)可以同時預測幾十種ADMET參數。通過多目標優化算法,AI能在這些相互沖突的目標中找到帕累托最優解(Pareto Optimality),引導化學家設計出綜合性能最優的分子,而不是只有單一指標突出的“偏科生”。
3. 靶點垂釣與脫靶效應預測
藥物進入體內后,除了結合目標靶點,還可能錯誤地結合其他蛋白,導致嚴重的副作用(脫靶效應)。例如,如果藥物意外結合了hERG鉀離子通道,可能會導致心臟驟停。
AI通過靶點垂釣(Target Fishing)技術,反向預測一個分子可能結合的所有潛在靶標。這不僅有助于在早期規避毒性風險,有時還能帶來意外之喜——發現老藥的新用途(藥物重定向),即“老藥新用”。
四、AI在臨床試驗設計中的應用
臨床試驗是新藥研發中最昂貴、耗時最長、失敗率最高的環節,被稱為“死亡之谷”。統計數據顯示,大約只有10%進入臨床的藥物最終能獲批上市。一旦在三期臨床失敗,意味著數十億美元的投入打水漂。AI正在努力填平這座深谷。
1. 智能招募
臨床試驗失敗的一個主要原因(約占30%)是無法招募到足夠數量的合適患者。傳統的招募方式依賴醫生推薦和廣告,效率極低。
?電子健康記錄(EHR)挖掘:利用NLP技術,AI可以掃描醫院系統中數以萬計的非結構化病歷,精準定位符合入排標準(Inclusion/Exclusion Criteria)的患者。
?精準匹配:AI不僅看年齡、性別,還深入分析遺傳數據和生物標志物,篩選出對藥物最可能有響應的特定亞群患者。這不僅加快了招募速度,更大大提高了試驗成功的概率。
?案例:TrialX等公司利用AI技術,通過分析搜索行為和地理位置,實現了臨床試驗的“超個性化”推薦,解決了患者“找不到試驗”和試驗“找不到人”的雙向盲區。
![]()
2. 試驗設計的沙盤推演與模擬
傳統的臨床試驗設計往往依賴經驗,一旦開始就難以更改。而AI可以通過分析歷史臨床數據,進行模擬臨床試驗。
在真實患者入組前,AI就可以模擬不同的給藥方案、樣本量、終點指標,預測不同設計方案的成功率。這就像在戰爭發動前進行的沙盤推演,幫助決策者選擇勝算最大的戰術,避免因設計缺陷導致的無謂失敗。
3. 實時監測與數字孿生
在試驗進行中,AI結合可穿戴設備,實現了對受試者7x24小時的實時守護。
DNN算法實時分析心率、血壓、睡眠等連續生理數據,不僅能比醫生更早發現潛在的嚴重不良事件(SAE),還能監測患者是否按時服藥,保證數據的質量。
更為激進的創新是數字孿生(Digital Twin)和合成對照臂(Synthetic Control Arms)技術的應用。在某些罕見病或致死性疾病的試驗中,招募對照組(服用安慰劑)既困難又不道德。AI可以基于歷史真實世界數據(RWE),生成一組虛擬的對照組患者數據。這不僅解決了倫理難題,還顯著降低了試驗成本和周期。
4. 拯救失敗的試驗
甚至在試驗失敗后,AI也能發揮作用。通過對失敗試驗的數據進行深度挖掘,AI有時能發現藥物在某個特定亞群中其實是有效的。
案例:一個著名的例子是針對阿爾茨海默病的藥物。雖然總體試驗失敗,但AI分析發現,在疾病進展較慢的患者亞群中,藥物顯示出了顯著療效。這為藥物的“起死回生”提供了關鍵線索。
結語
我們正處于藥物研發范式重構的關鍵時刻。AI 技術的演進,正在把藥物發現從一項充滿不確定性的“試錯藝術”,轉化為如芯片設計般嚴謹的“精密工程”。
未來的核心競爭力在于構建實驗室閉環(Lab-in-the-Loop)。通過計算模擬(干實驗)與自動化生物驗證(濕實驗)的實時交互,AI 模型在數據的滋養下不斷自我進化,極大地提升了研發的精度與效率。
當然,技術狂奔的同時不能忽視數據隱私與倫理邊界。我們需要建立更加透明、負責任的 AI 體系。歸根結底,科技的終極價值在于服務人類福祉。在人類直覺與機器算力的雙重驅動下,我們離攻克頑疾、解碼生命的終極目標從未如此接近。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.