![]()
掌握單細胞的環境搭建和分析套路后,接下來主要是單細胞數據分析。單細胞數據與單細胞測序平臺密切相關。早期單細胞測序基于熒光分子或者細胞形態篩選細胞,再擴增和測序,往往通量較低,以SMART-seq最具代表性,其數據由三部分組成,可以分別獲取。比如肝癌數據集GSE144028。
![]()
min.features = 200)非特異性細胞分選比較成熟的單細胞高通量測序技術,主要包括Fluidigm的C1平臺,BD Rhapsody平臺和目前使用最廣泛的 10xGenomics 平臺。 上傳到GEO的數據并沒有經過平臺歸一化處理 ,其中無論是芯片數據、二代測序數據還是單細胞數據的格式差異較大,而不像TCGA數據那么歸整。這就導致GEO單細胞數據及其讀取的多樣性。
min.features = 200)GEO數據庫提供的單細胞數據大致分為三類,①原始數據:fastq格式的測序數據;②經過Cellranger標準化后的10X數據;③counts數據。前面分享的主要是第二種數據。對于fastq數據的處理,需要用到Linux和shell ,我們以后再做分享。關于counts數據,仍然屬于下游數據分析,值得嘗試分析。
save(scRNA_all, file = "scRNA_all.Rdata")此外,還有 h5格式等存儲的單細胞數據文件,在很多公眾號上都有詳細的代碼,這里不再贅述。掌握上述代碼,我們基本上能應付GEO數據庫80%左右的單細胞數據了。如果還有其他格式或情況的單細胞數據,我們用到時候再學習也不遲。
參考資料
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.