“我們身體內(nèi)絕大多數(shù)生命活動(dòng)都直接或間接依賴于蛋白質(zhì)。如果基因突變或表達(dá)異常,就會(huì)造成人體產(chǎn)生‘問題蛋白’,繼而引發(fā)疾病。分子膠的獨(dú)特之處在于,它像‘膠水’一樣,能誘導(dǎo)細(xì)胞內(nèi)的E3連接酶與‘問題蛋白’粘合。E3連接酶猶如‘質(zhì)檢員’,會(huì)給‘問題蛋白’貼上‘清除標(biāo)簽’,使其被機(jī)體識(shí)別并自動(dòng)降解。”談起分子膠,青島海洋生物醫(yī)藥研究院(以下簡(jiǎn)稱“海藥院”)秦沖團(tuán)隊(duì)成員王霄向記者解釋。
分子膠功效突出,但難點(diǎn)在于,分子膠作用機(jī)制依賴復(fù)雜的蛋白-蛋白相互作用,導(dǎo)致分子膠降解劑類藥物的發(fā)現(xiàn)具有較大的偶然性,或者依賴于大通量篩選。正因如此,海藥院科研團(tuán)隊(duì)通過系統(tǒng)整合研究數(shù)據(jù),構(gòu)建了全球首個(gè)分子膠數(shù)據(jù)庫(kù),并運(yùn)用人工智能技術(shù),與數(shù)據(jù)庫(kù)中的新藥候選分子深度“對(duì)話”,實(shí)現(xiàn)分子膠降解劑的理性設(shè)計(jì)與預(yù)測(cè),從而有效推動(dòng)了該領(lǐng)域新藥發(fā)現(xiàn)的進(jìn)程。
打破“數(shù)據(jù)孤島”,提供一站式科研工具
面對(duì)“問題蛋白”,傳統(tǒng)的小分子藥物通常結(jié)合在目標(biāo)蛋白的活性位點(diǎn),像一把“鑰匙”堵住鎖眼,抑制其功能。但“問題蛋白”并未因此而消失,這就需要藥物分子持續(xù)占據(jù)靶點(diǎn),一旦抑制作用消失,“問題蛋白”就會(huì)很快恢復(fù)功能。近年來,以蛋白降解靶向嵌合體(PROTACs)和分子膠降解劑(MGDs)為代表的靶向蛋白質(zhì)降解(TPD)技術(shù),正在改變這一局面,它的目的不是“抑制”而是“清除”目標(biāo)蛋白,已成為創(chuàng)新藥物發(fā)現(xiàn)的前沿領(lǐng)域。
“與PROTACs相比,分子膠降解劑具有分子量更小、成藥性更優(yōu)等獨(dú)特優(yōu)勢(shì)。近年來全球已有30余個(gè)分子膠進(jìn)入臨床試驗(yàn),取得了矚目的進(jìn)展,展現(xiàn)出巨大應(yīng)用潛力。”王霄表示。
分子膠領(lǐng)域的研究發(fā)展不是一蹴而就的。2007年是一個(gè)重要節(jié)點(diǎn)。當(dāng)時(shí)華盛頓大學(xué)的研究團(tuán)隊(duì)發(fā)現(xiàn),細(xì)胞內(nèi)E3連接酶給“問題蛋白”貼上“清除標(biāo)簽”繼而使其自動(dòng)降解的過程,可以被一些小分子“劫持”,發(fā)揮誘導(dǎo)或增強(qiáng)的效果。正是因?yàn)檫@類小分子起到了“膠水”的作用,能夠促進(jìn)E3連接酶與“問題蛋白”粘合,導(dǎo)致后者被降解,該研究團(tuán)隊(duì)創(chuàng)造性地提出了“分子膠”的概念。2014年是又一個(gè)重要節(jié)點(diǎn)。隨著科技的進(jìn)步,科研團(tuán)隊(duì)在分子水平上解析分子膠與一種重要的E3連接酶的明確關(guān)鍵相互作用。這一發(fā)現(xiàn)極大推動(dòng)了“靶向蛋白降解”這一前沿藥物研究領(lǐng)域,進(jìn)一步促進(jìn)了分子膠領(lǐng)域研究發(fā)展。
“反映到分子膠的公開學(xué)術(shù)研究文獻(xiàn)數(shù)量上,2001年有1篇,2007年又出現(xiàn)一篇,隨后緩慢提高,2014年達(dá)到6篇,2024年開始進(jìn)入爆發(fā)式發(fā)展階段,數(shù)量達(dá)到60篇。2025年的數(shù)據(jù)還未完全統(tǒng)計(jì),但會(huì)進(jìn)一步提高。”王霄說。
盡管研究熱度不斷上升,但從數(shù)量上來說,全球分子膠數(shù)量并不算多。這是因?yàn)椋嗄陙矸肿幽z的發(fā)現(xiàn)與理性設(shè)計(jì)面臨巨大挑戰(zhàn)。分子膠作用機(jī)制依賴復(fù)雜的蛋白-蛋白相互作用,其發(fā)現(xiàn)往往依賴偶然發(fā)現(xiàn)或大規(guī)模篩選。系統(tǒng)整合研究數(shù)據(jù),為分子膠的理性設(shè)計(jì)提供支撐,是該領(lǐng)域亟待解決的問題。
長(zhǎng)期以來,分子膠領(lǐng)域的研究數(shù)據(jù)分散在各類文獻(xiàn)、專利及數(shù)據(jù)庫(kù)中,缺乏統(tǒng)一的整合平臺(tái),導(dǎo)致科研人員難以高效獲取和利用信息。針對(duì)這一痛點(diǎn),海藥院科研團(tuán)隊(duì)針對(duì)分子膠領(lǐng)域長(zhǎng)期存在的研究分散、數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一等痛點(diǎn),打破“數(shù)據(jù)孤島”,構(gòu)建了全球首個(gè)分子膠數(shù)據(jù)庫(kù)。
該數(shù)據(jù)庫(kù)整合了2001年1月至2025年5月期間241篇學(xué)術(shù)研究文獻(xiàn),包含1840個(gè)條目、1629個(gè)獨(dú)特分子膠、28個(gè)招募蛋白和94個(gè)靶點(diǎn)。數(shù)據(jù)庫(kù)涵蓋化學(xué)結(jié)構(gòu)、結(jié)合親和力、降解能力、生物活性、理化性質(zhì)等,為靶向蛋白降解領(lǐng)域提供了一站式科研工具,可極大促進(jìn)分子膠降解劑的理性設(shè)計(jì)與藥物發(fā)現(xiàn)。
建立分子膠AI預(yù)測(cè)模型,快速預(yù)測(cè)生物活性
人工智能(AI)憑借其處理高維數(shù)據(jù)、識(shí)別復(fù)雜模式的能力,越來越成為藥物發(fā)現(xiàn)的重要輔助工具。2025年,海藥院主辦人工智能與藥物發(fā)現(xiàn)學(xué)術(shù)研討會(huì),深入探討人工智能技術(shù)特點(diǎn),探索人工智能技術(shù)在醫(yī)藥開發(fā)中的科學(xué)有效應(yīng)用。這進(jìn)一步彰顯了其發(fā)力AI+制藥的鮮明趨勢(shì)。
AI+制藥是指將機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語(yǔ)言處理和大數(shù)據(jù)等人工智能技術(shù)與傳統(tǒng)制藥環(huán)節(jié)相結(jié)合,通過從頭生成、虛擬篩選和數(shù)據(jù)交叉比對(duì)等方式,提升新藥研發(fā)效率的制藥方式。現(xiàn)階段,人工智能技術(shù)主要聚焦新藥研發(fā)早期,在新藥發(fā)現(xiàn)、降本增效等方面展現(xiàn)巨大潛力。
“我們建設(shè)全球首個(gè)分子膠數(shù)據(jù)庫(kù),就是為AI+制藥提供基礎(chǔ)數(shù)據(jù)支撐。”王霄說。他們建立了分子膠AI預(yù)測(cè)模型,并利用數(shù)據(jù)庫(kù)中已統(tǒng)計(jì)的全球1000多個(gè)分子膠進(jìn)行訓(xùn)練,通過從已知的“分子結(jié)構(gòu)-生物活性”數(shù)據(jù)中學(xué)習(xí)規(guī)律,讓模型能夠快速預(yù)測(cè)新分子結(jié)構(gòu)的生物活性,成為強(qiáng)大的預(yù)篩選和設(shè)計(jì)指導(dǎo)工具,節(jié)省大量實(shí)驗(yàn)成本和時(shí)間。
科研人員用一組數(shù)據(jù)舉例。近年來,課題組自主構(gòu)建了含500多個(gè)新型分子膠的化合物實(shí)體庫(kù),其中已有100多個(gè)被證實(shí)具有生物活性。基于這些數(shù)據(jù)建立的分子膠AI預(yù)測(cè)模型,在對(duì)新分子進(jìn)行篩選時(shí),能夠在有限推薦的候選分子中顯著富集潛在活性分子,其篩選效果明顯高于隨機(jī)篩選水平,體現(xiàn)出良好的實(shí)用性和工程價(jià)值。隨著數(shù)據(jù)規(guī)模的不斷擴(kuò)大和算法的持續(xù)優(yōu)化,該模型有望進(jìn)一步提升篩選效率,為新藥研發(fā)按下“加速鍵”。
由此來說,首個(gè)分子膠數(shù)據(jù)庫(kù)的上線,不僅為全球科研人員提供了高效的研究工具,而且為藥物研發(fā)的數(shù)字化轉(zhuǎn)型奠定了基礎(chǔ)。在該數(shù)據(jù)庫(kù)之外,2025年,海藥院還成功構(gòu)建海洋天然產(chǎn)物EMNPD數(shù)據(jù)庫(kù)I期,提取了數(shù)萬(wàn)個(gè)海洋來源化合物的標(biāo)準(zhǔn)化化學(xué)信息、生物活性數(shù)據(jù)及來源物種的生態(tài)信息。通過內(nèi)置的機(jī)器學(xué)習(xí)接口,研究者可調(diào)用預(yù)訓(xùn)練模型進(jìn)行類藥性預(yù)測(cè)和虛擬篩選,為“藍(lán)色藥庫(kù)”的系統(tǒng)性開發(fā)提供新一代數(shù)字基礎(chǔ)設(shè)施。
當(dāng)前,AI+制藥日漸火熱,而算力、算法、數(shù)據(jù)是驅(qū)動(dòng)其進(jìn)步的“三大支柱”。其中,數(shù)據(jù)是基本要素,誰(shuí)能以更合規(guī)、更創(chuàng)新的方式建立高質(zhì)量數(shù)據(jù)獲取與治理能力,就能為構(gòu)建更強(qiáng)大的算法(如生成模型)提供先機(jī)。2025年,海藥院全球首個(gè)分子膠數(shù)據(jù)庫(kù)、自主開發(fā)的海洋天然產(chǎn)物EMNPD數(shù)據(jù)庫(kù)I期等2個(gè)數(shù)據(jù)庫(kù)成功構(gòu)建并實(shí)現(xiàn)應(yīng)用,為新藥發(fā)現(xiàn)架起人工智能接口。在浩如煙海的數(shù)據(jù)中,科研人員與候選分子深度“對(duì)話”,加快探索穿越千難萬(wàn)險(xiǎn)的成藥之路。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.