賴斯大學科學家利用人工智能與大型DNA文庫,繪制并預測基因電路功能,助力生物技術與療法發展。
![]()
科學家開發出一種可能徹底改變治療性與生物技術應用DNA設計方式的新技術。合成生物學領域長期面臨一個難題:雖然能編程細胞使其按特定方式運作,但要找到實現該功能的正確DNA序列卻極其困難。
賴斯大學的科學家卡萊布·巴肖爾解釋說:"實現任何既定功能都可能存在無數設計方案,尋找正確方案猶如大海撈針。"
如今,賴斯大學的研究團隊提出一項解決方案,可大幅擴展設計流程的關鍵環節。該研究通過結合機器學習與大型DNA設計文庫,能更精準預測哪些序列能使細胞按科學家期望的方式運作。
基因設計能力實現重大突破
這項名為"CLASSIC"的新技術,全稱為"長短讀長測序結合解析基因復雜性技術"。借助該技術,科學家能一次性生成數十萬至數百萬個DNA設計方案,遠超以往水平。
巴肖爾表示:"我們創建的新技術可同時生成前所未有的海量DNA設計。"作為賴斯大學生物工程與生物科學助理教授、合成生物學研究所副主任,他領導的研究旨在建立DNA序列(即基因電路)與細胞行為之間的映射關系。
研究團隊通過構建巨型基因電路庫,并將每個電路與它在人體細胞內的實際表現關聯起來。CLASSIC成功的關鍵在于融合兩種測序方法:長讀長測序可一次性讀取數千個堿基,捕獲完整電路設計;短讀長測序則在短片段上更快更精準。共同第一作者羅南·奧康奈爾指出:"多數研究者只采用其中一種方法,但我們發現兩者結合能突破文庫構建與測試的瓶頸。"
研究人員采用標記追蹤技術,將基因電路植入經過改造的人胚胎腎細胞,當特定基因激活時細胞會發出熒光。熒光強度越高表明電路活性越強。隨后通過短讀長測序識別各組細胞中每個電路設計的條形碼序列,從而建立DNA序列與細胞表現的關聯數據庫。
人工智能設計引領未來
這些海量數據集可用于訓練機器學習模型,識別最可能產生預期效果的DNA設計,進而預測尚未實際測試的設計性能。奧康奈爾解釋道:"我們用數據訓練模型來理解整個設計圖景,并預測尚未生成實驗數據的設計方案。"初步驗證顯示預測準確率極高——40個預測序列與手動測試結果完全吻合。
CLASSIC生成的數據規模至關重要,它為機器學習模型提供了足夠的信息以做出可靠預測。共同第一作者克希蒂吉·拉伊強調:"這是首次能運用人工智能分析基因電路并準確預測未測試電路,因為此前無人能構建如此規模的文庫。"
研究還發現實現功能的基因電路常存在多種可行方案,而非單一最優設計。這種靈活性將幫助工程師構建更穩健的生物系統。研究團隊表示,高通量數據與人工智能建模的結合有望加速細胞療法及其他合成生物學應用的發展。
該研究成果已發表于《自然》期刊。
如果朋友們喜歡,敬請關注“知新了了”!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.