編輯丨王多魚(yú)
排版丨水成文
RNA修飾是“表觀轉(zhuǎn)錄組學(xué)”的核心研究對(duì)象,廣泛參與 RNA 穩(wěn)定性、剪接和翻譯等生物學(xué)過(guò)程,精準(zhǔn)調(diào)控 RNA 命運(yùn)。牛津納米孔技術(shù)(ONT)推出了直接RNA測(cè)序(DRS)方案,無(wú)需擴(kuò)增直接對(duì) RNA 分子進(jìn)行測(cè)序,通過(guò)捕捉其穿過(guò)納米孔時(shí)產(chǎn)生的電信號(hào)差異,并借助計(jì)算建模區(qū)分不同修飾類型,從而實(shí)現(xiàn)在單次實(shí)驗(yàn)中同時(shí)檢測(cè)多種 RNA 修飾。隨著該技術(shù)的應(yīng)用,大量用于解析 DRS 數(shù)據(jù)中修飾信號(hào)的算法不斷涌現(xiàn)。
然而,這些算法的性能究竟如何?能否準(zhǔn)確區(qū)分不同的修飾類型?面對(duì) DRS 技術(shù)的持續(xù)迭代,計(jì)算工具應(yīng)如何適應(yīng)?這些問(wèn)題始終懸而未決。
2025 年 12 月 10 日,同濟(jì)大學(xué)史偈君教授團(tuán)隊(duì)在Nature Methods期刊發(fā)表了題為 :Systematic Evaluation of Computational Tools for Multitype RNA Modification Detection Using Nanopore Direct RNA Sequencing 的研究論文。
該研究構(gòu)建了高質(zhì)量、單堿基分辨率的基準(zhǔn)數(shù)據(jù)集作為“金標(biāo)準(zhǔn)”,并從準(zhǔn)確性、生物學(xué)合理性、跨樣本泛化能力及計(jì)算效率四個(gè)維度出發(fā),設(shè)置了十余項(xiàng)評(píng)估指標(biāo),對(duì) 86 種基于直接RNA測(cè)序(DRS)技術(shù)的RNA修飾檢測(cè)算法進(jìn)行了迄今為止最系統(tǒng)全面的“大比武”。研究涵蓋了 m6A、假尿嘧啶(Ψ)、m5C、A-to-I 編輯,m1A 和 m7G 這六種重要RNA修飾,不僅揭示了現(xiàn)有工具的性能差異與局限,還通過(guò)大規(guī)模重訓(xùn)練,展示了模型的遷移能力。
![]()
本研究的主要發(fā)現(xiàn)包括:
1)模型重訓(xùn)練策略顯著提升檢測(cè)性能:僅使用體外轉(zhuǎn)錄(IVT)RNA 訓(xùn)練的工具在應(yīng)用于真實(shí)生物樣本時(shí)表現(xiàn)不佳。而將兩者結(jié)合進(jìn)行重訓(xùn)練,能極大提升工具的預(yù)測(cè)準(zhǔn)確性和跨數(shù)據(jù)集泛化能力,尤其對(duì) Ψ、m5C 和 A-to-I 等非 m6A 修飾效果明顯。
2)m6A檢測(cè)工具整體表現(xiàn)優(yōu)異,非m6A工具仍面臨挑戰(zhàn):Dorado 和 SingleMod 模型在 m6A 的定性和定量分析中均表現(xiàn)突出。然而大多數(shù)非 m6A 修飾檢測(cè)工具在定量準(zhǔn)確性和跨樣本泛化方面仍明顯不足。
3)生物學(xué)合理性是重要試金石:理想的檢測(cè)工具不僅需具備高準(zhǔn)確性,其預(yù)測(cè)結(jié)果也應(yīng)符合已知的生物學(xué)規(guī)律。研究發(fā)現(xiàn),部分工具所預(yù)測(cè)的修飾位點(diǎn)分布與真實(shí)分布存在偏差。此外,m6Anet 模型憑借其多示例學(xué)習(xí)(MIL)模塊的合理設(shè)計(jì),在區(qū)分野生型與酶敲除樣本方面表現(xiàn)優(yōu)異,凸顯了算法設(shè)計(jì)對(duì)提升生物學(xué)解釋力的重要性。
4)工具難以區(qū)分相同堿基上的不同修飾:研究首次系統(tǒng)揭示,當(dāng)前工具在單堿基分辨率下仍難以可靠區(qū)分發(fā)生在同一堿基上的不同修飾(例如同樣位于腺苷的 m6A、m1A 和 A-to-I 編輯),易導(dǎo)致“模糊預(yù)測(cè)”,是未來(lái)算法優(yōu)化的重要方向。
5)重訓(xùn)練模型可適配DRS技術(shù)迭代:隨著 DRS 技術(shù)從 RNA002 升級(jí)至 RNA004,測(cè)序通量得到提升,但電信號(hào)特征的變化使舊版算法無(wú)法直接遷移。該研究提出的重訓(xùn)練模型可有效適配 RNA004 數(shù)據(jù),緩解了新版本數(shù)據(jù)分析工具短缺的現(xiàn)狀。
![]()
為促進(jìn)領(lǐng)域發(fā)展,研究團(tuán)隊(duì)發(fā)布了全面的算法性能總結(jié)與在線資源平臺(tái)——NaRMBench,將每個(gè)工具的 12 項(xiàng)關(guān)鍵性能指標(biāo)整合為交互式雷達(dá)圖(平臺(tái)地址:https://jiejunshi.github.io/NaRMBench_radar),方便用戶根據(jù)需求進(jìn)行選擇與比較。該工作不僅為實(shí)驗(yàn)學(xué)者篩選適用分析工具提供了實(shí)用依據(jù),也為算法開(kāi)發(fā)指明了優(yōu)化方向,為完善 RNA 修飾檢測(cè)方法學(xué)奠定了重要的基準(zhǔn)資源與權(quán)威指導(dǎo)。
![]()
同濟(jì)大學(xué)生命科學(xué)與技術(shù)學(xué)院史偈君教授為論文通訊作者,課題組研究生羅婷婷與徐默萍為共同第一作者,研究生王淼、陳發(fā)迎亦對(duì)該研究做出重要貢獻(xiàn)。該研究獲得國(guó)家自然科學(xué)基金資助。
論文鏈接:
https://www.nature.com/articles/s41592-025-02974-y
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.