![]()
染色質三維結構通過 構建 遠端調控元件之間的空間互作精細調控基因 轉錄 , 在 決定細胞身份、組織發育和疾病發生 等生物學過程 中 扮演重要角色【1–3】。基于染色體構象捕獲( 3C )的 Hi-C 技術實現了全基因組尺度染色質互作圖譜的繪制,并陸續揭示了 A/B compartment 、拓撲關聯結構域( TAD )以及染色質環( chromatin loop )等 人類基因組折疊的基本規律 及其在 發育、 疾病 和衰老過程 中的作用【4,5】。然而,高質量 Hi-C 圖譜的產出對樣本量、測序深度和實驗成本均有較高要求,尤其在單細胞與空間尺度上, Hi-C 數據的 獲取仍 存在顯著瓶頸。
為緩解這一問題,近年來相繼出現了多種基于深度學習的 Hi-C 圖譜預測方法,如 Akita 、 C.Origami 、 Epiphany 、 ChromaFold 等。然而,當面向單細胞與空間組學數據時,現有方法仍存在 多方面的 局限:( 1 ) 訓練需要 同一樣本同時具備 ATAC-seq 、 CTCF ChIP -seq 等多組學輸入;( 2 )難以 泛化到未見過的 細胞類型;( 3 )未充分考慮單細胞與空間數據中固有的稀疏性和測序深度的高度異質性。
針對上述挑戰, 2026 年 4 月 14 日 , 北京大學臨床醫學高等研究院(細胞穩態與衰老性重大疾病北京研究中心) / 北京大學腫瘤醫院 吳華君 、北京大學第三醫院 徐明 和北京大學腫瘤醫院 王玉娟 共同通訊 在 Nature Communications 上發表了題為 Hi-Compass: a depth-aware deep learning framework for predicting cell-type-specific 3D genome organization from single-cell to spatial resolution 的研究論文,提出了一個跨測序深度的三維基因組預測深度學習框架Hi-Compass,能夠從ATAC-seq數據出發,跨bulk、單細胞、空間等多尺度預測細胞類型特異性的Hi-C接觸圖譜。
![]()
文中提出的 Hi-Compass 是一個基于 CNN-Transformer 架構的深度學習框架,以 ATAC-seq 信號 為唯一的細胞類型特異性輸入,結合 DNA 序列、泛細胞類型 CTCF 結合 譜以及 ATAC-seq 的測序深度,預測細胞類型特異性的 Hi-C 接觸圖譜。為兼容 bulk 、單細胞和空間組學中差異極大的測序深度,作者在訓練階段引入多種測序深度的 ATAC-seq 輸入,并通過深度嵌入( depth embedding )將當前輸入的測序深度告知模型,使其在不同數據尺度下均可生成合理預測。
![]()
在此基礎上,作者將 Hi-Compass 與 Akita 、 C.Origami 、 Epiphany 、 ChromaFold 等代表性方法進行了系統性 benchmark 比較,在 Hi-C 圖譜整體相關性、高置信染色質環的恢復、以及 TAD 邊界與 insulation score 一致性等多個維度上評估了各方法的預測性能,結果顯示 Hi-Compass 在跨細胞類型泛化場景中的預測精度優于現有方法。 在多細胞類型聯合訓練策略下, Hi-Compass 對訓練集之外的細胞類型同樣具備 zero-shot 預測能力。
進一步地,作者將 Hi-Compass 應用于外周血單核細胞( PBMC ) 的 scATAC -seq 和胚胎心臟發育的 multiome 數據集,解析了不同免疫細胞亞群與發育階段細胞類型特異性的染色質互作圖譜。基于所預測的細胞類型特異性染色質環信息, Hi-Compass 進一步支持將 GWAS 非編碼變異 系統性地連接到其候選靶基因,為復雜疾病的功能解讀提供了三維基因組學視角。
在空間尺度 上 ,作者將 Hi-Compass 接入 spatial ATAC-seq 數據,在 人類 海馬組織 中實現了空間分辨的染色質互作預測,刻畫了組織空間位置與細胞類型特異性三維基因組結構的對應關系。此外,作者通過對小鼠基因組的 fine-tuning 進一步展示了 Hi-Compass 的 跨物種應用能力 。
綜上,該研究工作為細胞類型特異性三維基因組預測提供了一個覆蓋bulk—單細胞—空間多尺度并支持跨物種應用的統一深度學習框架。Hi-Compass 的提出將有力推動三維基因組學在發育、免疫、神經及疾病研究中的廣泛應用,并為非編碼遺傳變異的功能解讀提供 新 的工具。
本論文的 共同通訊作者 為北京大學臨床醫學高等研究院(細胞穩態與衰老性重大疾病北京研究中心) / 北京大學腫瘤醫院 吳華君 研究員、北京大學第三醫院 徐明 教授 和北京大學腫瘤醫院 王玉娟 博士 ;北京大學腫瘤醫院 孫源辰 、北京大學第三醫院蔣文杰和北京大學腫瘤醫院蔡康文為本文的共同第一作者。
原文鏈接:https://www.nature.com/articles/s41467-026-71877-z
制版人: 十一
參考文獻
1. Bonev B, Cavalli G. Organization and function of the 3D genome.Nature Reviews Genetics2016, 17: 661–678.
2. Dekker J, Mirny L. The 3D genome as moderator of chromosomal communication.Cell2016, 164: 1110–1121.
3. Hafner A, Boettiger A. The spatial organization of transcriptional control.Nature Reviews Genetics2023, 24: 53–68.
4. Lieberman-Aiden E, et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome.Science2009, 326: 289–293.
5. Rao SSP, et al. A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping.Cell2014, 159: 1665–1680.
學術合作組織
(*排名不分先后)
![]()
戰略合作伙伴
(*排名不分先后)
![]()
![]()
轉載須知
【非原創文章】本文著作權歸文章作者所有,歡迎個人轉發分享,未經作者的允許禁止轉載,作者擁有所有法定權利,違者必究。
BioArt
Med
Plants
人才招聘
點擊主頁推薦活動
關注更多最新活動!
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.