RNA病毒是遺傳多樣性最豐富、進化速度最快的一類微生物,能夠引發多種人類、動物和植物感染性疾病,對全球公共衛生與生物安全構成持續威脅。解析RNA病毒蛋白的三維結構,是理解病毒感染與免疫逃逸機制、指導抗病毒藥物和疫苗研發的關鍵基礎。然而,受限于蛋白結構解析技術等因素的限制,目前實驗解析的RNA病毒蛋白結構仍然十分有限。
近日,上海交通大學等團隊合作在bioRxiv預印平臺發布了“RNA病毒蛋白結構數據庫”(RNA Viral Protein Structure Database,RVPSD)。該數據庫基于人工智能結構預測技術,系統整合了大規模RNA病毒蛋白三維結構數據,填補了RNA病毒蛋白結構資源分散、缺乏統一平臺的空白,為病毒結構生物學研究提供了專業、開放的一站式資源平臺。RVPSD數據庫訪問地址:https://virus.9itsg.net/#/home。
![]()
RVPSD共收錄154,716個RNA病毒蛋白結構,覆蓋5,263種RNA病毒和149個病毒科,是目前最大的RNA病毒蛋白結構數據庫。所有蛋白結構均基于AlphaFold2預測獲得,其中84.9%的結構具有較高結構置信度(pLDDT>70)。數據庫在分類和功能注釋層面均具有廣泛覆蓋,既包括黃病毒、小RNA病毒、冠狀病毒等公共衛生高度關注的病毒科,也涵蓋大量研究較少的新發現或未充分注釋表征的RNA病毒。
為了方便用戶使用的、面向下游結構分析,RVPSD數據庫整合了病毒分類信息、核酸與蛋白序列、功能注釋及結構預測結果,并支持基于序列和結構的雙模式檢索。用戶可通過BLASTP進行序列比對,也可利用Foldseek進行結構相似性搜索,并在網頁端通過交互式三維可視化工具直接查看蛋白結構細節。數據庫還提供PDB格式文件下載,滿足多樣化研究需求。
![]()
圖. 基于AlphaFold2的結構預測流程、pLDDT值分布及RVPSD應用示例
作為首個整合跨RNA病毒類群、大規模高置信度AI預測蛋白結構的專業數據庫,RVPSD將病毒分類信息、核苷酸/蛋白序列、功能注釋與蛋白三維結構數據有機整合,為RNA病毒的結構生物學研究奠定了基礎。該數據庫的上線,不僅為病毒進化、宿主相互作用研究提供了全新的支撐資源,也將為抗病毒藥物和疫苗開發提供重要的結構數據,助力全球新發及再發病毒性傳染病防控。
上海交通大學史衛峰教授、師詠勇教授和山東第一醫科大學李娟教授為論文的共同通訊作者,上海交通大學楊強震博士、科研助理田忠帥和山東第一醫科大學胡弢教授為共同第一作者。上海交通大學碩士生婁江溶、助理研究員劉恒聰為本論文合作者,悉尼大學Edward C. Holmes教授對本研究提供了指導。本研究得到上海交通大學醫工交叉重點項目(YG2023ZD01)、國家自然科學基金(32325003、32370724、82472254)、國家重點研發計劃(2023YFC2307503)等項目的資助。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.