撰文丨王聰
編輯丨王多魚
排版丨水成文
腫瘤免疫微環境(Tumor Immune Microenvironment,TIME)對癌癥的發展進程和免疫治療響應有著至關重要的影響。多重免疫熒光(mIF)是一種強大的成像方式,可用于解析腫瘤免疫微環境(TIME),但其應用受到高昂成本和較低通量的限制。
近日,微軟研究院潘海峰、微軟研究院/華盛頓大學王晟等人在國際大獎學術期刊Cell上發表了題為:Multimodal AI generates virtual population for tumor microenvironment modeling 的研究論文。
該研究提出了GigaTIME,這是一個通過連接細胞形態和狀態來進行大規模群體腫瘤免疫微環境建模的多模態人工智能框架(該工具已在 Hugging Face、GitHub 和 Microsoft Foundry 免費開源)。
GigaTIME學習了一種跨模態翻譯器,通過在 4000 萬個細胞的配對 H&E 和 mIF 數據 (涵蓋 21 種蛋白質) 上進行訓練,成功實現了 從常規 H&E 病理切片到多重免疫熒光( mIF) 圖像的跨模態轉換。
研究團隊應用GigaTIME技術生成了涵蓋 24 種癌癥類型和 306 種亞型的虛擬 mIF 圖像,從中發現癌癥中的免疫活性、腫瘤侵襲和生存率中的 1234 種關聯,為可擴展的數據驅動型腫瘤學研究開辟了新途徑,也為虛擬患者奠定了基礎。
GigaTIME技術突破了昂貴、低通量的 mIF 技術限制,使得能夠利用現有的、規模龐大的 H&E 切片庫,進行大規模、數據驅動的腫瘤學研究,從而加速癌癥治療及個性化醫療的發展。
![]()
傳統技術的局限與 AI 的突破
腫瘤免疫微環境(TIME)是影響癌癥進展和治療響應的關鍵因素。長期以來,多重免疫熒光(mIF)技術雖然能提供豐富的蛋白質空間表達信息,但由于成本高昂、流程復雜,難以在大規模人群中應用。
相比之下,H&E 染色作為病理學常規檢查,成本低廉且廣泛應用,但其無法直接顯示蛋白質活性。
研究團隊提出了核心問題——能否通過 AI 技術,從 H&E 切片中提取足夠信息來預測蛋白質的空間表達?
GigaTIME技術框架:從細胞到群體
研究團隊首先構建了包含 4000 萬細胞的配對數據集,每個細胞均有對應的 H&E 圖像和 21 種蛋白質的 mIF 表達數據。基于這一寶貴資源,他們開發了基于 NestedUNet 的編碼器-解碼器架構。
GigaTIME的工作流程令人印象深刻:輸入一張 H&E 切片,AI 模型能夠同時輸出 21 個蛋白質通道的虛擬 mIF 圖像,每個像素點都會給出蛋白質激活狀態的預測。這種細粒度的預測能力,使得研究人員能夠在整個切片水平上分析蛋白質激活模式。
大規模驗證:從 1.4 萬患者到虛擬蛋白質圖譜
研究團隊將
GigaTIME應用于普羅維登斯健康系統的 14256 名患者數據,涵蓋了 24 種癌癥類型和 306 種亞型。最終生成了 299376 張虛擬 mIF 圖像,構建了迄今為止最大的腫瘤免疫微環境 (TIME) 虛擬群體。
值得注意的是,
GigaTIME在各項指標上均顯著優于傳統的 CycleGAN 方法。在 DAPI 核染色通道上,
GigaTIME的 Dice 分數達到 0.72,而 CycleGAN 僅為 0.03,這證明了基于配對數據訓練的重要性。
臨床發現的寶庫:1234 個顯著關聯
虛擬群體的創建為大規模臨床發現提供了可能。研究團隊識別了 1234 個統計學顯著的蛋白質-生物標志物關聯,這些發現涵蓋了泛癌、癌癥類型和亞型三個層次。
在泛癌水平,研究證實了 TMB-H 和 MSI-H 基因型與 CD138、CD20 等免疫標志物的正相關,這與已知的抗原介導的免疫激活機制一致。更有趣的是,該研究發現 KMT2D 突變與 CD3、CD8、CD20 等免疫浸潤標志物呈正相關,提示 KMT2D 突變可能增強泛癌水平的免疫浸潤。
空間模式與組合效應:超越傳統分析
GigaTIME的優勢不僅在于預測蛋白質表達,更在于其能夠捕捉空間分布模式。研究團隊評估了熵、信噪比和銳度等空間指標,發現這些指標相比簡單的激活密度能揭示更強的臨床關聯。
此外,研究還探索了蛋白質組合效應。例如,CD138(漿細胞標志物)和 CD68(巨噬細胞標志物)的組合在預測生物標志物時表現出協同效應,這提示漿細胞與巨噬細胞的共定位可能通過抗體介導的機制參與腫瘤免疫。
![]()
臨床應用的廣闊前景
在患者分層方面,
GigaTIME展現出重要臨床價值,整合所有 21 個蛋白質通道的
GigaTIME特征在預測患者生存方面優于單個蛋白質通道,強調了多重分析的重要性。
獨立驗證進一步支持了
GigaTIME的可靠性。在 TCGA 數據庫的 10200 名患者中,虛擬蛋白質激活與普羅維登斯數據高度相關,Spearman 相關系數達 0.88,兩個群體共享 80 個顯著的蛋白質-生物標志物關聯,顯示了良好的可重復性。
未來展望與局限性
未來,研究團隊計劃探索更多蛋白質通道,并整合細胞分割模型來研究細胞間相互作用,進一步揭示腫瘤微環境的“語法規則”。
GigaTIME代表了多模態 AI 在數字病理學中的重要進展,它不僅為研究人員提供了大規模研究腫瘤微環境的工具,更為精準免疫腫瘤學的發展開辟了新途徑。隨著技術的不斷完善,有理由相信,AI 將在癌癥研究和臨床實踐中發揮越來越重要的作用。
這項研究最令人振奮指出或許在于它展示了一個未來圖景——通過 AI 技術,我們能夠以更低的成本、更大的規模,深入探索腫瘤微環境的復雜性,最終為患者帶來更有效的治療策略。
論文鏈接:
https://www.cell.com/cell/fulltext/S0092-8674(25)01312-1
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.