Crispr/Cas9介導的遺傳學篩選 (Genetic Screens)已成為腫瘤表型與鑒定癌癥進展驅動基因的核心工具。標準流程是將慢病毒 sgRNA 文庫導入細胞或動物模型,經功能性壓力(增殖、轉移、藥物處理)富集或耗竭特定 sgRNA,再通過高通量測序量化豐度變化,即可在無偏好前提下找出與表型相關的必需基因或耐藥基因。
![]()
在Crispr screen技術進步同時,如何分析和發掘Crispr screen得到的數據也是一個巨大的挑戰。與傳統轉錄組、蛋白組數據相比,CRISPR 篩選產生的計數矩陣維度更低、噪聲來源更多(如慢病毒滴度、編輯效率、細胞倍增速率等),且需同時估計 sgRNA 水平與基因水平的競爭適應度,這對統計模型提出迥異的要求。一般至少并行 2–3 種互補策略對Crispr screen數據進行分析,通過一致性評分或投票機制降低假陽性。
![]()
Cancer CRISPR Screening Data Analysis Platform (OncoCRISPRDB)可用于腫瘤Crispr數據再挖掘和分析腫瘤的各種表型下基因功能及通路情況。OncoCRISPRDB整合了多種腫瘤模型及實驗條件下Crispr Screen數據,可以實現多種算法下功能基因篩選、通路分析、通路下基因相互作用分析和跨表型基因和通路的研究,同時支持客制化的分析參數以及可視化方式。
![]()
OncoCRISPRDB有三個核心步驟:數據收集,數據分析和可視化工具。該數據庫整合161個數據集,涵蓋1082個樣本,精心篩選并適配 7 種針對CRISPR Screen數據的算法,實現對數據的基因,通路,表型層面的探索。
![]()
OncoCRISPRDB平臺的數據源自GEO數據庫,涵蓋從2016年2月至2024年9月期間收集的腫瘤基因在CRISPR Screen中的數據。數據經過嚴格的篩選,以確保其質量和相關性。再經過臨床信息分組,基因名的轉化及數據清洗,我們得到了涉及92種細胞系、32種腫瘤類型,50種藥敏相關表型和21種與腫瘤轉移相關表型的腫瘤基因數據。
![]()
在 Crispr Screen 模塊,用戶可以自由選擇3種算法。每種算法均有至少80個數據集可供探索,并提供氣泡圖,火山圖,Rank圖。
![]()
![]()
![]()
通路分析模塊使用了clusterProfiler包中的GSEA算法進行通路得分計算,支持從The Molecular Signatures Database (MSigDB)數據庫中手動挑選的 8691 條常用的腫瘤相關基因集。數據結果可視化支持 GSEA Plot,Ridge Plot,Pathway correlation Plot和Dot Plot 4種形式。
![]()
![]()
相互作用分析模塊,DCE (Differential Causal Effects)算法用于通過比較正常細胞和癌細胞的基因表達數據來檢測信號通路中的異常調控。該方法基于因果推斷的統計框架,能夠 識別在癌癥細胞中異常調控的特定基因相互作用(即通路中的邊),同時考慮混雜因素的影響跨表型基因。該模塊支持KEGG數據庫中 220條KEGG通路下的基因相互作用分析 (注:部分數據部分通路缺失不支持)
![]()
表型相似度分析模塊 使用GSEA算法模擬各類表型之間的相似度。將 各表型下基因得分進行排序,在匯總所有表型的基因集后, 使用GSEA算法對每種表型計算富集得分ES (Enrichment Score)。高ES得分表明該基因集與該表型之間的關聯性較強。該模塊的分析結果以GSEA圖,Ridge圖以及Bar圖的形式呈現。
![]()
跨表型基因分析模塊實現深入探索 不同表型或類似表型下不同實驗組中 功能基因的表現。其對 任意兩個數據集進行Z-score標準化處理,確保數據處于同一尺度,從而消除不同數據集之間的量綱和量級差異。
![]()
通過CRISPR Screen數據分析,挖掘關鍵基因和通路,為腫瘤研究提供新的策略。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.