隨著高通量測(cè)序和多組學(xué)數(shù)據(jù)的爆發(fā)式增長(zhǎng),現(xiàn)代科研已不再是“實(shí)驗(yàn)至上”模式,而是逐步走向“干濕結(jié)合、數(shù)據(jù)驅(qū)動(dòng)”的新路徑。說(shuō)來(lái),我們已分享很多生信文章,也解讀很多頂刊前沿文獻(xiàn),但是并沒(méi)有很好地回答干濕結(jié)合的思路和關(guān)鍵技能。我們結(jié)合一篇直播課件與兩篇經(jīng)典文獻(xiàn),系統(tǒng)梳理如何從公共數(shù)據(jù)出發(fā),挖掘關(guān)鍵基因并完成功能與機(jī)制驗(yàn)證,形成一篇完整的研究論文。
![]()
關(guān)于為什么我們要學(xué)數(shù)據(jù)挖掘,我們很早就做過(guò)回答了!很多同學(xué)在面對(duì)實(shí)驗(yàn)瓶頸、缺乏研究方向時(shí)感到迷茫,數(shù)據(jù)挖掘恰恰能提供“課題靈感”和“驗(yàn)證方向”。不再完全依賴(lài)實(shí)驗(yàn)室前期積累,而是直接從海量公共數(shù)據(jù)庫(kù)(GEO、TCGA、GTEx等)中挖掘差異表達(dá)基因或關(guān)鍵基因。同時(shí),不需要自己測(cè)序,即可獲得大量樣本的表達(dá)譜、生存數(shù)據(jù)、臨床信息。通過(guò)生信分析,可以初步判斷目標(biāo)基因的表達(dá)模式、預(yù)后價(jià)值、信號(hào)通路富集情況,降低實(shí)驗(yàn)盲目性。問(wèn)題的關(guān)鍵不是要不要生信,而是如何學(xué)好生信,用好生信!
![]()
數(shù)據(jù)挖掘的基本思路核心是表達(dá)有差異 → 差異影響表型 → 表型可驗(yàn)證 → 機(jī)制可闡明。比如這篇題為UBQLN4 is activated by C/EBPβ and exerts oncogenic effects on colorectal cancer via the Wnt/β-catenin signaling pathway的研究論文,清晰展示了“生信引導(dǎo)實(shí)驗(yàn)”的全流程,是生信學(xué)習(xí)和干濕結(jié)合入門(mén)的范本論文。
![]()
差異表達(dá)分析。使用TCGA數(shù)據(jù)發(fā)現(xiàn)UBQLN4在結(jié)直腸癌中高表達(dá),并通過(guò)GEO數(shù)據(jù)庫(kù)、臨床樣本qPCR和WB驗(yàn)證。IHC結(jié)果進(jìn)一步確認(rèn)其表達(dá)與腫瘤大小、分期、淋巴結(jié)轉(zhuǎn)移正相關(guān)。預(yù)后與診斷價(jià)值,Kaplan-Meier分析顯示高表達(dá)UBQLN4患者預(yù)后更差。ROC曲線表明UBQLN4具有診斷潛力(AUC > 0.7)。
![]()
表型驗(yàn)證(功能實(shí)驗(yàn))。增益功能實(shí)驗(yàn):過(guò)表達(dá)UBQLN4促進(jìn)細(xì)胞增殖、遷移、侵襲(MTS、克隆形成、Transwell、劃痕實(shí)驗(yàn))。缺失功能實(shí)驗(yàn):敲低UBQLN4抑制上述表型,并在小鼠模型中驗(yàn)證其抑瘤作用。
![]()
機(jī)制探究。通過(guò)雙熒光素酶報(bào)告基因、ChIP實(shí)驗(yàn)證實(shí)C/EBPβ直接結(jié)合UBQLN4啟動(dòng)子并激活其轉(zhuǎn)錄。GSEA通路富集分析提示W(wǎng)nt/β-catenin通路富集,WB驗(yàn)證UBQLN4上調(diào)β-catenin和c-Myc表達(dá)。敲低c-Myc可逆轉(zhuǎn)由UBQLN4過(guò)表達(dá)引起的促癌表型,確認(rèn)其下游作用。
![]()
腫瘤生信論文中必備的實(shí)驗(yàn)技能
同樣,在題為Endothelial cell-specific molecule 1 drives cervicalcancer progression的論文中(Cell Death & Disease, 2022),作者遵循類(lèi)似路徑,并結(jié)合RNA-seq篩選下游靶基因SYT13,揭示ESM1促進(jìn)EMT的新機(jī)制。
![]()
很多果友誤以為生信分析是終點(diǎn),其實(shí)恰恰相反!生信是科研的起點(diǎn),幫助我們定位目標(biāo)基因,驗(yàn)證功能與機(jī)制。兩者結(jié)合,才能形成完整的證據(jù)鏈,支撐起一篇扎實(shí)的SCI論文。如果你剛接觸生信,建議按照“純生信 → R語(yǔ)言基礎(chǔ) → GEO/TCGA分析 → 單細(xì)胞分析”三步走策略。同時(shí),堅(jiān)持精讀高質(zhì)量文獻(xiàn),學(xué)習(xí)其分析邏輯與實(shí)驗(yàn)設(shè)計(jì)。因?yàn)椋胖皇枪ぞ撸季S才是引擎。
![]()
推薦生信作業(yè):①掌握 R 語(yǔ)言基礎(chǔ)與ggplot2繪圖;②學(xué)會(huì)GEO/TCGA數(shù)據(jù)下載、清洗、差異分析和富集分析;③結(jié)合1-2篇示例文獻(xiàn)(如上述論文),模仿其分析流程;④設(shè)計(jì)并開(kāi)展實(shí)驗(yàn)驗(yàn)證,完成“干濕閉環(huán)”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.