
撰文 | 水王星
腫瘤精準醫學的核心是基于患者基因組生物標志物、癌癥類型及治療史制定個性化治療方案,這一模式的落地高度依賴臨床醫生對海量分子靶向療法及監管批準信息的精準把控。然而,近年來FDA批準的分子靶向療法呈爆發式增長,僅2024至2025年間,MOAlmanac數據庫收錄的FDA批準療法相關關聯就增長了近3 倍,同時臨床指南、期刊文獻、監管機構官網等證據來源高度分散,部分新批準療法缺乏廣泛宣傳,導致臨床醫生尤其是非腫瘤基因組專業的醫師難以及時跟進最新診療進展,知識缺口可能延誤最佳治療時機。傳統大語言模型(Large language models,LLM) 雖在臨床文本總結、醫學考試等場景中展現出接近醫師的能力,卻受限于訓練數據的知識截止期和領域針對性不足, 面對精準腫瘤學中動態更新的知識,常出現推薦滯后、準確性不足等問題,難以直接應用于臨床決策 。
近日,來自美國丹娜-法伯癌癥研究所、哈佛醫學院及麻省理工學院博德研究所等機構的 Eliezer Van Allen 團隊,在 Cancer Cell 期刊發表題為 A context-augmented large language model for accurate precision oncology medicine recommendations 的研究論文。該團隊開發了一套基于檢索增強生成(retrieval-augmented generation,RAG) 技術的LLM框架,通過深度整合MOAlmanac這一專家精選的臨床基因組數據庫,實現了動態補充最新臨床證據的功能,無需修改模型內部權重即可持續更新治療推薦依據。 該框架在234條2024年版MOAlmanac合成查詢中達成95%的精確匹配準確率,在 81條來自15位臨床腫瘤學家的真實世界查詢中準確率高達93%,為精準腫瘤學臨床決策提供了高效、可擴展且高度可靠的智能支持工具 。
![]()
該研究的核心突破在于構建了一套適配精準腫瘤學需求的全流程優化方案,從知識補充、數據格式到檢索機制均實現針對性創新。在知識動態更新層面,RAG 技術通過實時檢索MOAlmanac數據庫中的FDA批準療法信息,完美彌補了傳統 LLM知識滯后的缺陷。當2025年版MOAlmanac新增大量療法關聯后,框架仍能通過數據庫同步實現高效推薦,而無需重新訓練模型。在數據格式優化上,研究團隊對比了非結構化數據 (如藥物說明書的 “適應癥與用法” 章節文本) 與結構化數據 (人工整理的生物標志物, 療法和癌癥類型關聯條目) 的增強效果,發現結構化數據能更精準捕捉三者間的復雜邏輯,使模型在前列腺癌同源重組修復基因 (homologous recombination repair,HRR) 基因突變相關治療推薦中,精確匹配準確率從非結構化數據增強的4%、純LLM的0%提升至63%,同時在 35種癌癥類型、64種基因組生物標志物的廣泛場景中保持穩定性能。檢索機制方面,團隊創新采用混合檢索策略,先通過語義檢索篩選出Top50相關上下文,再利用 Okapi BM25算法進行詞匯相似度重排,通過自適應系數平衡語義與詞匯相關性,最終在真實世界查詢中較單一語義檢索提升3%-9%的準確率,平均多生成4個部分正確的治療推薦。
研究通過系統實驗揭示了多項關鍵發現,為LLM在精準腫瘤學的應用提供了重要參考。在提示詞優化階段,團隊測試了四種策略:基礎提示詞、范圍限制提示詞、系統角色提示詞及組合提示詞,發現基礎提示詞 (“請以指定 JSON 格式提供每條治療方案…… 查詢:{prompt}”) 表現最優,在Mistral NeMo 12B模型中達成82.9%的部分匹配準確率,顯著優于其他三種策略 (69.7%-79.9%) ,且這一優勢在GPT-4o、GPT-4o mini等7種不同規模LLM中均保持一致,其中GPT-4o 在基礎提示詞策略下實現89.3%的部分匹配準確率,成為后續實驗的首選模型。在模型性能驗證中,結構化數據增強的優勢貫穿始終:在2025年版MOAlmanac 的651條合成查詢中,結構化RAG-LLM的精確匹配準確率雖因數據量擴張降至 59%,但仍顯著高于非結構化增強 (約 47%) 和純 LLM (62%-89% 區間下限) ,且精準度、F1 分數分別提升約 90% 和 69%;同時,增加檢索上下文數量 (從 10 條增至 25 條) 進一步優化了模型表現。在真實世界場景中,框架展現出強大的實用性:針對21條驗證查詢和81條測試查詢,涵蓋肺癌、乳腺癌和前列腺癌等多種常見腫瘤及罕見癌癥,混合檢索策略均實現最優性能,尤其在處理復雜臨床場景 (如聯合治療方案推薦、罕見生物標志物匹配) 時,能有效捕捉細粒度治療決策依據。此外,研究還探索了框架的泛化能力,整合 CIViC 數據庫后,雖整體準確率較 MOAlmanac 增強 (53%-76%) 有所下降 (37%-62%) ,但在10條涉及超適應癥或研究性療法的查詢中,表現優于MOAlmanac增強模型,證實了框架在不同數據庫適配中的靈活性。
該研究構建的RAG-LLM框架具有重要的臨床價值與廣闊的應用前景。首先,它有效解決了精準腫瘤學知識碎片化的痛點,將分散于不同來源的FDA批準信息、生物標志物關聯證據整合為統一查詢入口,減少醫生在多個平臺間切換檢索的時間成本。其次,框架降低了精準腫瘤學的應用門檻,無需復雜計算資源即可部署,尤其能為非學術機構的腫瘤科醫生提供專業支持。再者,框架具備高度靈活的適配性,可在FDA與EMA等不同地區監管標準間切換,未來整合區域數據庫后有望實現全球范圍內的個性化推薦,同時通過bias審計、嵌入校準等方式,可進一步提升不同患者群體間的公平性。值得注意的是,研究也指出了當前的局限性,如部分乳腺癌聯合治療方案推薦不完全、對無FDA批準療法的場景可能誤推薦超適應癥藥物等,未來可通過整合臨床指南、臨床試驗數據、電子健康記錄,以及優化嵌入模型、引入思維鏈提示詞等方式持續完善。
![]()
https://doi.org/10.1016/j.ccell.2025.12.017
制版人: 十一
學術合作組織
(*排名不分先后)
![]()
戰略合作伙伴
(*排名不分先后)
![]()
![]()
轉載須知
【原創文章】BioArt原創文章,歡迎個人轉發分享,未經允許禁止轉載,所刊登的所有作品的著作權均為BioArt所擁有。BioArt保留所有法定權利,違者必究。
BioArt
Med
Plants
人才招聘
近期直播推薦
點擊主頁推薦活動
關注更多最新活動!
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.