![]()
作者 | 論文團隊
編輯 | ScienceAI
「臨床試驗是新藥從實驗室走向患者的關鍵橋梁,但其失敗率高、周期長、成本巨大。我們希望借助人工智能重塑這條橋梁。」
在制藥與醫學研究的世界里,臨床試驗是一項極其核心但也極其困難的工作:跨越多個階段,耗時往往超過十年,平均成本可能高達數十億美元,且成功率通常不足 15%。盡管 ClinicalTrials.gov 等數據庫已經積累了數十萬條歷史記錄,要把這些信息轉化為 AI 可以直接利用的預測任務仍然是一項巨大挑戰。過去的研究多半聚焦于某一個子任務,缺乏一個統一的平臺來承載多模態、多任務的研究與驗證。
為此,香港科技大學(廣州)陳晉泰助理教授聯合南京大學符天凡副教授、IQVIA 、哈佛醫學院等團隊合作構建了TrialBench —— 一個多模態、任務豐富且公開可用的臨床試驗預測平臺,旨在為 AI 研究者和醫學研究者搭建橋梁。
研究論文以《TrialBench:Multi-Modal AI-Ready Datasets for Clinical Trial Prediction》為題發表在Nature 子刊《Scientific Data》上。
![]()
論文地址:https://www.nature.com/articles/s41597-025-05680-8
數據集地址:https://huyjj.github.io/Trialbench/
平臺亮點
TrialBench 匯集了 23 個子數據集,覆蓋 8 大預測任務,具體包括:
- 預測試驗時長,即估計一項臨床試驗從開始到結束可能持續多久。
- 預測病人的退出率,幫助研究者提前識別試驗中可能出現的招募和留存問題。
- 預測嚴重不良事件,提前發現潛在的安全風險。
- 預測死亡事件,評估試驗方案可能帶來的極端風險。
- 預測臨床試驗能否獲得批準或最終成功。
- 識別失敗原因,例如招募失敗、安全問題或療效不足。
- 根據試驗背景信息自動生成入選標準,從而輔助研究者設計更合理的受試者篩選條件。
- 預測合理的給藥劑量,結合藥物分子結構和試驗要素,給出劑量水平建議。
![]()
研究團隊不僅設計了這些任務,還提供了基線模型、評價指標和多模態融合方法,確保數據集「開箱即用」。
更重要的是,TrialBench 整合了 ClinicalTrials.gov 的試驗記錄、DrugBank 的藥物信息和 TrialTrove 的試驗注釋,從而增強了數據的廣度與預測能力。通過圖神經網絡處理藥物分子結構、Bio-BERT 解析臨床文本、基于層級注意力的模型理解疾病編碼,TrialBench 為復雜多模態任務提供了系統化解決方案。
![]()
八大臨床試驗預測問題總結
模型與實驗結果
研究團隊在多個任務上進行了實驗驗證。在 14 個二分類任務中,多模態深度模型有 11 個的 F1 分數超過 0.7,證明了這些任務具備較高的可預測性和實用價值。作者還提供了 Python 和 R 工具包,方便研究者下載數據、運行模型并復現實驗結果。
![]()
數據集效果驗證
![]()
Python 與 R 包的使用
已有應用與驗證
TrialBench 發布不久,已經被業界與學界關注并應用。Google DeepMind 在其最新的 TxGemma 模型 中,就使用 TrialBench 進行不良事件預測的微調示例,相關案例已在 Google Developers Blog 和 TxGemma 的技術論文中公開展示。此外,近期提出的 AUTOCT(Automating Interpretable Clinical Trial Prediction with LLM Agents) 也將 TrialBench 用作基準,用于評估臨床試驗批準與結果預測任務的表現。TrialBench 正逐步成為臨床試驗預測領域的重要基準。
意義與展望
TrialBench 的出現打破了 AI 與醫藥研究之間的隔閡。一方面,它讓 AI 研究者能夠直接切入臨床試驗預測這一復雜而關鍵的領域;另一方面,它為醫學與制藥界提供了一個可直接應用與擴展的工具,推動臨床試驗設計、風險控制與資源配置的智能化。
未來,隨著 TrialBench 的不斷擴展與更新,它有望成為 AI 與臨床試驗研究交叉領域的基石平臺。更多研究者將能夠基于 TrialBench 開發新方法、檢驗新模型,從而加速藥物研發和臨床試驗設計的創新進程。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.