![]()
![]()
行業定義
AI蛋白質設計是指利用人工智能技術(如深度學習、生成模型和強化學習),結合蛋白質序列、結構和功能數據,對蛋白質進行預測、設計和優化。
蛋白質設計旨在從頭設計或優化蛋白質的序列,以實現特定功能或提高天然蛋白質的性能。傳統計算蛋白質設計通常采用能量函數和特定的搜索優化算法獲得設計的序列。近年來,隨著先進算法的發展、大數據的積累和計算機硬件算力的增長,人工智能技術得到了蓬勃發展,并逐漸應用于蛋白質設計領域。
![]()
AI在蛋白質設計中的應用主要體現在結構預測、功能優化、相互作用預測和高效篩選等方面。通過深度學習模型,根據氨基酸序列準確預測蛋白質的三維結構,這為理解其功能提供了重要依據。此外,AI還能夠優化蛋白質功能,設計具備特定功能的分子,如高效催化酶或抗體,極大地加速了藥物研發和生物技術應用。
AI在預測蛋白質-蛋白質相互作用方面也表現突出,通過分析大量數據,AI能夠識別潛在的藥物靶點,推動疾病機制研究。結合高通量篩選技術,可以在海量候選分子中快速找到最具潛力的蛋白質,減少實驗驗證的成本和時間。
此外,人工智能自我迭代能力使得設計過程能夠實時優化,提升設計精度和效率。通過這些技術,極大地推動了蛋白質工程的發展,尤其在藥物發現、工業生物催化和生物制品開發等領域具有廣泛應用。
AI蛋白質設計的上中下游可以從數據收集、模型訓練、設計生成、實驗驗證等多個層面進行細分,整體流程涉及多個環節,每個環節都依賴于高效的人工智能技術與傳統生物學知識的緊密結合。
在上游階段,首先是數據的收集與處理。這一階段的核心任務是為AI模型提供足夠豐富和高質量的輸入數據。這些數據主要來源于已知的蛋白質數據庫(如PDB和UniProt),包含了大量的蛋白質序列、結構和功能信息。此外,高通量實驗數據、基因組學數據以及臨床數據等也為AI提供了支持。數據處理的過程包括清洗、去噪和結構化,確保數據能夠在后續步驟中發揮最大效用。
進入到中游階段時,AI的主要工作是對這些數據進行建模與訓練。這一過程通常依賴于深度學習和其他機器學習技術,利用算法來預測蛋白質的三維結構、功能和其他關鍵性質。此時,AI模型可以根據蛋白質的氨基酸序列預測其空間折疊結構,或者通過其他生物信息學工具預測蛋白質與目標分子之間的相互作用。通過這種方式,不僅可以提升蛋白質設計的效率,還能在預測蛋白質功能、優化現有蛋白質性能等方面提供精準的指導。
在下游階段,AI所設計或優化的蛋白質將進入實驗驗證的環節。盡管AI能夠模擬和預測蛋白質的性質,但最終是否具備預期的生物活性、穩定性或其他功能性,仍需通過實驗驗證。這一階段通常包括蛋白質的合成、表達和功能驗證,如通過高通量篩選實驗、酶活性測試、結合親和力實驗等方式來確認設計的有效性。如果實驗結果不符合預期,AI模型需要通過反饋學習進行優化,從而迭代生成新的蛋白質設計方案。
這三個階段在AI蛋白質設計的流程中形成了一個循環反饋機制。上游的數據收集和處理為中游的模型訓練提供了基礎,而中游的設計與優化又為下游的實驗驗證提供了初步的指導。下游的實驗反饋進一步優化了上游數據的選擇和中游模型的訓練,形成了一個閉環。這種層層遞進的過程使得AI蛋白質設計在蛋白質工程與藥物發現領域展現了巨大的潛力。
盡管存在數據、計算和實驗驗證的挑戰,但隨著技術的發展,將在設計效率和應用范圍上進一步突破,推動生命科學邁入一個智能化的新時代。
睿獸分析整理近年來相關公司的融資情況,2019至2021年AI蛋白質設計領域融資事件快速增長,2021年達到36起的峰值,顯示出投資熱潮。2022年后融資事件銳減,2024年觸底至18起。數據或表明AI蛋白質設計作為新興領域,其融資趨勢在經歷了快速增長后,可能進入了一個篩選整合的階段。
![]()
![]()
相關企業
途深智合
途深智合是一家新銳AI蛋白質設計企業,其自研的ProteinEngine平臺可以實現通用、快速的蛋白質設計與改造,應用在合成生物和生物醫藥等多個領域。目前已與國內外多家合成生物及醫藥企業建立商業合作。
途深智合致力于為客戶提供通用、輕量、可控的蛋白質設計和生成式AI平臺,加速合成領域蛋白質工程的研發,降低合成生物和醫藥領域中開發新產品的難度、周期和成本。能夠幫助下游的合成生物、產品公司、生物制藥公司實現定位突變、體外酶改造、酶從頭設計、抗體結構設計、復合蛋白設計、全新序列設計、結構設計等任務,并進行產品聯合開發或研發合作。
近日,途深智合宣布完成天使+輪融資,投資方包括錫創投和上海艾特海浦。2024年3月,其完成數百萬人民幣天使輪融資,由誠美資本投資,該輪所得資金將用于進一步加強AI+蛋白質平臺的研發。
![]()
分子之心
北京分子之心科技有限公司成立于2022年1月,其自主研發了AI大分子優化與設計平臺“MoleculeOS”,運用數據驅動的深度學習方法,幫助生物技術專家識別和產生蛋白質,以將實驗室研究成果規模化投射到工業級應用。這一平臺既可用于多肽、抗體、酶和小蛋白的研究和設計,將大分子創新藥的研發變成可預測、可編程,為藥物研發全流程提效;也可應用于化學、材料、工業、農業等領域蛋白質優化與設計。
核心技術產品層面,分子之心研發了一款一站式AI蛋白質預測、優化與設計工具——MoleculeOS平臺,采用先進的機器學習和深度學習算法,能夠幫助科研人員快速發現和改造蛋白質,通過精確的計算和建模,大幅提升實驗室研究的轉化效率。此外,分子之心自主研發的AI蛋白質生成大模型NewOrigin模型,綜合序列、結構、功能和進化等多個領域,可針對產業應用需求在幾小時內、甚至是分鐘級“定制”具有特定功能的蛋白質,大大降低實驗室的篩選和驗證成本,提高蛋白質優化設計整體效率。人才層面,分子之心涵蓋一批來自MIT、耶魯、加州理工、清華、北大等頂尖高校及藥明、諾維信、Meta、亞馬遜、百度、阿里、字節、Discovery Studio等頭部公司的人才。
2024年9月消息,分子之心宣布完成A輪數億元人民幣融資,由謝諾投資與深創投聯合領投,國香資本和久奕投資跟投。本輪融得的資金將主要用于人才團隊擴展、技術平臺完善以及推動AI蛋白技術的產業化。
![]()
百奧幾何
北京百奧幾何生物科技有限公司是一家生成式AI驅動的蛋白質設計研發平臺公司,通過打造生成式人工智能(AIGC)大模型理解生命語言,搭建自然語言與蛋白質語言多模態大模型,重新構建蛋白質藥物發現及設計過程,打造可編程的蛋白質,應用于生物醫藥和生物制造。
團隊方面,其核心團隊是生成式AI在分子生成領域的開拓者,早在2021年就將擴散模型用于分子的三維結構生成 ,是最早將擴散生成模型用于分子三維結構生成的團隊,其中關鍵論文GeoDiff是2022年AI領域引用量排名前50的論文之一。
基于自研生成式AI大模型,百奧幾何研發了GeoBiologics一站式蛋白質設計平臺,目前已經與多家國內外藥企關于該平臺達成授權合作。另外,百奧幾何也與多家上下游企業達成了戰略合作,共同推進生成式人工智能在生物制造領域落地,其中包括與阿里云共建人工智能生物制造智能化解決方案,與三優生物、佰君生物等共建抗體設計生成式AI大模型,以及與祥耀生物、引加生物等推進蛋白、抗體藥物產品的共同開發。
2024年6月,百奧幾何完成Pre-A輪融資,本輪融資由將門創投領投,智譜AI、盛景嘉成跟投,老股東高榕創投持續追加投資。融資資金主要用于加速生成式AI大模型在生物制造領域落地,以及推進自有產品的開發。
![]()
![]()
熱點訊息
2024年10月,諾貝爾化學獎再次花落人工智能!AlphaGo之父等三人獲獎
北京時間10月9日下午,2024年諾貝爾化學獎正式揭曉。瑞典皇家科學院決定將 2024 年諾貝爾化學獎一半授予 David Baker,以表彰其對計算蛋白質設計的貢獻,另一半則共同授予 Demis Hassabis 和 John M. Jumper,以表彰其對蛋白質結構預測的貢獻。2024年的諾貝爾化學獎金為1100萬瑞典克朗,約合750萬元人民幣。
2024年9月,DeepMind推出首個AI蛋白質設計模型,親和力提升300倍
Google DeepMind宣布推出AlphaProteo,首個專為設計新型高強度蛋白質結合劑的AI模型。值得注意的是,AlphaProteo成為DeepMind首個經過濕試驗驗證的AI蛋白質模型。經過濕試驗驗證,AlphaProteo可以為多種靶蛋白產生新的蛋白質結合劑,包括與癌癥和糖尿病并發癥相關的VEGF-A。這是AI工具首次能夠成功為VEGF-A設計蛋白質結合劑。
2024年5月,谷歌AlphaFold 3首發Nature:成功預測所有生命分子結構和相互作用
新一代 AlphaFold——由Google DeepMind和Isomorphic Labs研究團隊推出的革命性人工智能(AI)模型 AlphaFold 3——登上了權威科學期刊Nature。據介紹,AlphaFold 3以前所未有的精確度成功預測了所有生命分子(蛋白質、DNA、RNA、配體等)的結構和相互作用。
![]()
來源:Nature
與現有的預測方法相比,AlphaFold 3 發現蛋白質與其他分子類型的相互作用至少提高了 50%,對于一些重要的相互作用類別,預測準確率甚至提高了一倍。
2024年4月,世界首個完全由AI設計的CRISPR基因編輯器,已成功編輯人類DNA,且免費開源
2024年4月22日,AI蛋白質設計公司Profluent宣布推出OpenCRISPRTM計劃,發布了世界首個開源人工智能生成基因編輯器—OpenCRISPR-1。
![]()
就像基于大語言模型的ChatGPT生成一篇新文章一樣,大語言模型也能生成全新的蛋白質。而現在,Profluent展示了一種完全由人工智能從頭設計的基因編輯器,并進行了首次成功的人類基因組精確編輯。值得一提的是,OpenCRISPR-1是開源的,不僅可以免費用于科學研究,而且可以免費用于商業用途。
2023年4月,AI設計蛋白質新方法登Science,利用強化學習,直接根據預想優化結構
RoseTTAFold 團隊獨創性方法,利用強化學習、自上而下設計蛋白質復合物結構,登上最新一期 Science。利用該方法,團隊設計出了上百個蛋白質結構。經電子顯微鏡等觀測證實,這些結構大部分都能在實驗室中合成。而且預期納米結構和實際納米結構之間的平均偏差小于單個原子直徑,即實現了精確原子級設計。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.