![]()
谷歌發布基于Gemma家族、270億參數的生物學基礎模型Cell2Sentence-Scale,它成功預測并經實驗驗證了一條潛在的癌癥免疫療法新通路,劈柴哥說這標志著AI在科學發現中的一個里程碑
![]()
就在今天,谷歌DeepMind與耶魯大學宣布,正式推出一個專為單細胞分析設計的270億參數新基礎模型,該模型名為Cell2Sentence Scale 27B(簡稱C2S-Scale),構建于Gemma開源模型家族之上
C2S-Scale成功生成了一個關于癌細胞行為的全新假說,并且這一假說已在活細胞實驗中得到驗證。這一發現揭示了一條頗具前景的新路徑,有望用于開發對抗癌癥的新療法。
此項工作建立在谷歌今年早些時候的研究之上,當時他們證明了生物學模型也遵循明確的“縮放定律”(scaling laws)——就像自然語言一樣,更大的模型在生物學任務上表現更好。
但這引出了一個關鍵問題:更大的模型僅僅是把現有任務做得更好,還是能夠獲得全新的能力?
這次的成果給出了答案:規模化的真正潛力在于創造新想法和發現未知
C2S-Scale 27B如何工作
癌癥免疫療法面臨的一大挑戰是,許多腫瘤對人體免疫系統來說是“冷”的——即無法被免疫系統識別。而關鍵策略之一,就是通過一個叫做抗原呈遞(antigen presentation)的過程,迫使這些“冷”腫瘤展示能觸發免疫反應的信號,從而變“熱”
研究團隊給C2S-Scale 27B模型布置了一項任務:尋找一種能充當“條件性放大器”的藥物。
具體來說,這種藥物只有在特定免疫環境陽性的條件下才能增強免疫信號。在這種環境中,已經存在低水平的關鍵免疫信號蛋白——干擾素,但其水平不足以自行誘導抗原呈遞。
這種任務需要模型具備高水平的條件性推理能力,而這似乎是模型規模擴大后才涌現出的能力。團隊之前使用的小規模模型無法解決這種依賴于特定上下文的效應。
為了實現這一目標,研究人員設計了一個雙重上下文虛擬篩選方案,分兩個階段進行:
1.免疫環境-陽性 (Immune-Context-Positive): 向模型提供來自真實患者的樣本數據,這些樣本保留了完整的腫瘤-免疫細胞相互作用和低水平的干擾素信號
2.免疫環境-中性 (Immune-Context-Neutral): 向模型提供孤立的細胞系數據,其中不包含任何免疫環境信息
隨后,團隊模擬了超過4000種藥物在這兩種不同環境下的效果,并要求模型預測:哪些藥物僅僅在第一種陽性環境下才能促進抗原呈遞。
這樣做旨在將篩選偏向于與患者真實情況更相關的場景。在模型篩選出的眾多候選藥物中,一部分(約10-30%)在現有文獻中已有記載,而其余的則是完全出人意料的發現,此前從未被報道過與此相關
AI預測到實驗室驗證
模型的預測結果非常清晰
它發現了一種名為silmitasertib (CX-4945)的激酶CK2抑制劑,表現出驚人的“上下文分裂”效應。模型預測,當silmitasertib應用于免疫環境-陽性設定時,抗原呈遞會顯著增強;而在免疫環境-中性設定中,則幾乎沒有效果。
這個預測之所以令人亢奮,是因為它的新穎性。盡管CK2被認為與多種細胞功能(包括免疫調節)有關,但此前沒有任何文獻報道過通過silmitasertib抑制CK2能明確增強MHC-I表達或抗原呈遞
這表明,模型正在生成一個全新的、可供檢驗的科學假說,而不僅僅是復述已知事實
當然,一個預測只有在臨床應用中得到驗證才有價值。真正的考驗首先來自實驗室
在項目的下一階段,團隊將這個假說帶到了實驗臺上,在人類神經內分泌細胞模型中進行測試——這是一種模型在訓練期間完全沒有見過的細胞類型
實驗結果證明:
單獨使用silmitasertib處理細胞,對抗原呈遞(MHC-I)沒有影響
單獨使用低劑量干擾素處理細胞,效果有限
同時使用silmitasertib和低劑量干擾素處理細胞,則產生了顯著的協同放大效應
值得注意的是,在實驗室測試中,silmitasertib和低劑量干擾素的組合使用,使得抗原呈遞增加了約50%。這將使腫瘤對免疫系統來說變得更加可見。
模型的預測,在體外實驗中得到了多次證實。C2S-Scale成功識別出一種新穎的、干擾素條件下的放大器,揭示了將“冷”腫瘤變“熱”的潛在新通路,有望讓腫瘤對免疫療法更敏感
AI驅動生物學
這一成果不僅為開發使用多種藥物協同作用的組合療法提供了強有力的、經實驗驗證的線索,也為一種新型的生物學發現模式提供了藍圖。
它證明了,通過遵循縮放定律并構建像C2S-Scale 27B這樣的大型模型,我們可以創建出足夠強大的細胞行為預測模型,用于進行高通量虛擬篩選、發現依賴于特定條件的生物學現象,并生成有生物學依據的假說。
目前,耶魯大學的團隊正在進一步探索這一新發現的機制,并在其他免疫環境中測試更多由AI生成的預測。通過進一步的臨床前和臨床驗證,這些假說最終可能加速新療法的開發進程。
上手C2S-Scale 27B
新的C2S-Scale 27B模型及其相關資源現已向研究社區開放。
預印本paper:
https://www.biorxiv.org/content/10.1101/2025.04.14.648850v2
在Hugging Face模型和資源:
https://huggingface.co/vandijklab/C2S-Scale-Gemma-2-27B
在GitHub代碼:
https://github.com/vandijklab/cell2sentence
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.