<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      西湖大學發布SaprotHub,讓生物學家輕松訓練調用蛋白質語言模型

      0
      分享至



      作者 | 論文團隊

      編輯 | ScienceAI

      如同人類擁有語言,生命世界也有一套由氨基酸序列構成的「分子語言」—— 蛋白質 。近年來,人工智能領域的蛋白質語言模型(PLMs)展現出解碼這套語言的強大能力,能夠精準預測蛋白質的結構與功能。

      然而,這些尖端模型的訓練與使用,往往需要深厚的機器學習專業知識和編程能力,這在 AI 開發者與廣大生物學家之間形成了一道鴻溝。

      為了打破這一壁壘,西湖大學原發杰團隊首先提出了一種新穎的蛋白質表征方法 —— 將蛋白質一維序列與三維結構相結合形成「結構感知」詞匯表并據此訓練出了蛋白質語言大模型 Saprot。

      在此基礎上,團隊進一步推出了 SaprotHub 開源平臺 。該平臺旨在將 Saprot 等一系列先進蛋白質語言模型的能力開放給生命科學領域研究者,它也是開放蛋白質模型聯盟(Open Protein Modeling Consortium, OPMC)為推動全球科研協作、共建開源社區而邁出的關鍵第一步。

      這項研究成果已于近期發表在國際頂尖期刊《自然?生物技術》(Nature Biotechnology)上,論文題為《Democratizing Protein Language Model Training, Sharing and Collaboration》。



      論文地址:https://www.nature.com/articles/s41587-025-02859-7

      蛋白質研究的挑戰:從模型「孤島」到協作「藍海」

      蛋白質是生命活動的基石,而近年來,以 AlphaFold2 為代表的蛋白質語言模型(PLMs)在預測蛋白質結構與功能方面取得了革命性突破。然而,這些強大的 AI 工具如同精密的專業設備,其訓練和部署通常需要深厚的機器學習知識,這為廣大從事實驗研究的生物學家設置了難以逾越的技術鴻溝。從復雜的編程環境配置,到海量數據的預處理,再到模型訓練和評估,整個流程充滿了挑戰。這不僅限制了 AI 技術的普及,也減緩了其在醫藥、生物技術等領域的創新應用進程。



      圖 1. Saprot 模型架構

      SaprotHub:三大支柱構建的開源協作新范式

      為了應對這一挑戰,團隊構建了以 SaprotHub 為核心的一站式解決方案,它不僅是一個平臺,更是一個融合了前沿 AI 大模型技術、開源工具和全球社區的完整生態系統:

      • 核心引擎 — Saprot 語言模型:Saprot 是本項工作的基石。它開創性地提出了一種「結構感知」(Structure-Aware)詞匯表,將蛋白質的一維氨基酸序列與其三維局部結構信息進行聯合編碼,從而構建出一種全新的蛋白質「語言」。同時,研究團隊基于 AlphaFold2 預測的數千萬個蛋白質結構,采用了 64 塊 NVIDIA A100 GPU,經過數月訓練完成了 Saprot 模型的訓練。其性能在數十項蛋白質功能預測任務中得到了充分驗證,并成功超越了如 ESM-2 等業界頂尖模型。自發布以來,Saprot 模型在學術界與工業界獲得了廣泛的關注和應用。相關論文被引用已超過 200 次,模型累計下載量逾 70 萬次,并獲得了大量來自社區的真實生物實驗驗證,彰顯了其作為基礎模型的影響力。值得一提的是,Saprot 于 2024 年 5 月登頂 ProteinGym 蛋白質突變效應預測排行榜,并在此后近半年的時間里持續排名第一。
      • 開源工具 — 「一鍵式」蛋白質語言模型訓練平臺 ColabSaprot:為了將 Saprot 的能力釋放給生命科學領域的研究者,團隊基于免費的 Google Colab 云平臺,通過數月開發,上萬行的代碼編寫,實現了 ColabSaprot「一鍵式」開源訓練平臺。它將原本需要編寫繁瑣代碼才能進行的蛋白質語言模型微調、功能預測等任務,簡化為用戶在網頁上的幾次鼠標點擊,讓不具備編程背景的生物學家也能輕松訓練前沿蛋白質語言模型,實現從想法到驗證的快速迭代 。為了方便研究者快速上手,團隊錄制了詳細的教程視頻,涵蓋了從模型訓練到使用等各個方面。

      ColabSaprot鏈接:https://colab.research.google.com/github/westlake-repl/SaprotHub/blob/main/colab/SaprotHub_v2.ipynb

      教程鏈接:

      https://www.bilibili.com/video/BV1Y1i9YBEhv

      https://www.youtube.com/watch?v=nmLtjlCI_7M



      圖 2. ColabSaprot 在線平臺,具備細致的操作介紹以及簡易的使用步驟

      • 全球協作 — OPMC 成員共建的開放社區:SaprotHub 不僅僅是蛋白質語言模型的共享中心,更是開放蛋白質模型聯盟(OPMC)理念的先行者。該聯盟匯聚了來自西湖大學、麻省理工學院(MIT)、首爾大學、哈佛大學、慕尼黑工業大學、微軟等全球數十家頂尖科研機構的研究力量 ,旨在共同推進蛋白質領域的蓬勃發展。為了實現開源共建的良性生態,團隊采用低秩適應矩陣(LoRA)的方式保存模型權重,并建立了 SaprotHub 模型與數據倉庫。通過將 ColabSaprot 開源平臺與 SaprotHub 進行無縫耦合,OPMC 成員和全球研究者可以便捷地分享、下載和迭代模型。目前,SaprotHub 已經存儲了數十種不同類型的蛋白質訓練數據集以及可供研究者直接預測的蛋白質語言模型。為了方便研究者快速檢索,團隊針對性地開發了相應的搜索引擎,允許研究者根據關鍵詞直接檢索到相關的數據和模型。

      SaprotHub 模型與數據倉庫:https://huggingface.co/SaProtHub

      搜索引擎:https://huggingface.co/spaces/SaProtHub/SaprotHub-search



      圖 3. SaprotHub 利用 LoRA 技術存儲模型權重,實現模型的便利共享

      從虛擬到現實:計算機模擬性能驗證與多項濕實驗驗證

      SaprotHub 的價值不僅在于其便捷性,更在于其預測準確性。在團隊開展的用戶研究中,12 位沒有 AI 背景的生物學研究者使用該平臺,取得了與 AI 研究者相媲美的成果。



      圖 4. 生物研究者利用平臺能夠訓練出和 AI 研究者相媲美的成果

      更進一步,平臺預測的有效性在一系列生物濕實驗中得到了驗證:

      • 工業酶改造:一家生物技術公司利用 ColabSaprot 對一種工業用木聚糖酶進行改造,成功將酶的活性提升了 2.55 倍。
      • 基因編輯工具優化:研究人員利用該平臺對 TDG 基因編輯工具進行優化,預測出的多個新版本在實驗中展現出翻倍的編輯效率。
      • 熒光蛋白設計:平臺還被用于設計更亮的綠色熒光蛋白(GFP),其中一個新設計的蛋白,其熒光亮度達到了原始版本的 8 倍以上。

      這些成功案例證明,SaprotHub 能夠將 AI 的預測能力轉化為現實世界中的生物學功能突破。

      核心突破

      1.全新蛋白質語言模型:發布了具備技術創新(結構感知詞匯表)的 Saprot 蛋白質語言大模型。其在 14 項基準測試中性能超越了 ESM-2 等現有經典模型,已在該領域展現了其作為基礎模型的影響力。

      2.開源協作范式:作為開放蛋白質模型聯盟(OPMC)的第一步,匯聚了來自 MIT、哈佛、牛津、首爾大學等全球頂尖機構的智慧,為蛋白質領域建立了集模型訓練、分享、合作、迭代于一體的開源社區平臺。

      3.蛋白質語言模型技術民主化:通過「一鍵式」的 ColabSaprot 工具,將先進蛋白質語言模型的復雜訓練和使用流程民主化,賦能全球不具備編程背景的生物學家,使其從 AI 的「使用者」轉變為「創造者」和「貢獻者」。

      4.真實場景驗證:平臺的有效性在工業酶改造、基因編輯工具優化等多個真實的濕實驗場景中得到驗證,展示了其通過計算機模擬輔助現實生物學突破的能力。

      結語與展望

      SaprotHub 的發布,不止是提供了一個工具。它以一個創新的自研蛋白質語言模型(Saprot)為基礎,通過開源平臺(ColabSaprot)來催化一個全球性的科研協作網絡(OPMC)。這為 AI 輔助的生命科學研究提供了一種可持續發展的「開源、共建、共享」模式。目前,該生態已進一步集成了 ESM-2、ProtT5 等更多業界主流模型 ,開啟了蛋白質科學的「大航海時代」。

      西湖大學原發杰實驗室現有 2026 年博士研究生招生名額,有意向者可將個人簡歷(含教育背景、科研經歷、成果證明等)及相關材料投遞至指定郵箱,郵件主題請注明「2026 博士申請 + 姓名」。

      投遞郵箱:yuanfajie@westlake.edu.cn

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中國為何一定要加入CPTPP?背后6大挑戰,決定了今后會很難

      中國為何一定要加入CPTPP?背后6大挑戰,決定了今后會很難

      吃瓜局
      2025-12-11 20:26:35
      俄羅斯網紅為博流量將10歲兒子塞進密封袋抽走空氣,僅2秒后孩子就哭喊“媽媽”

      俄羅斯網紅為博流量將10歲兒子塞進密封袋抽走空氣,僅2秒后孩子就哭喊“媽媽”

      大象新聞
      2025-12-11 11:46:06
      《人民日報》:這70個中國文化基本常識,建議收藏起來慢慢看……

      《人民日報》:這70個中國文化基本常識,建議收藏起來慢慢看……

      每日一首古詩詞
      2025-12-11 07:07:07
      上海松江連夜瘋挖銀元,專家提醒別挖了,都是國家的,當地介入!

      上海松江連夜瘋挖銀元,專家提醒別挖了,都是國家的,當地介入!

      眼光很亮
      2025-12-12 04:32:35
      強得可怕!吉林4名男子在飯店聚餐一共喝了120啤酒,引發網友熱議

      強得可怕!吉林4名男子在飯店聚餐一共喝了120啤酒,引發網友熱議

      火山詩話
      2025-12-11 20:53:47
      26歲在美中國博士涉嫌破壞同學電腦被捕,教授:裝隱蔽攝像頭,拍到他用工具破壞電腦,火花飛濺

      26歲在美中國博士涉嫌破壞同學電腦被捕,教授:裝隱蔽攝像頭,拍到他用工具破壞電腦,火花飛濺

      揚子晚報
      2025-12-11 23:13:32
      美國要組建C5,全世界大吃一驚

      美國要組建C5,全世界大吃一驚

      牛彈琴
      2025-12-12 07:37:00
      訂單漲不動、庫存壓頂,小米中國區的“自救式調整”來了

      訂單漲不動、庫存壓頂,小米中國區的“自救式調整”來了

      互聯網品牌官
      2025-12-10 14:45:42
      浙江大學26歲博導引關注,網友爆料他高考加分讀鄭大,確有此事嗎

      浙江大學26歲博導引關注,網友爆料他高考加分讀鄭大,確有此事嗎

      平老師666
      2025-12-11 21:49:24
      廣州一商戶窗邊懸掛火焰LED屏,引來5輛消防車“救援”,街道辦回應:系商戶自行設置的屏幕引發誤會,已責令業主關閉

      廣州一商戶窗邊懸掛火焰LED屏,引來5輛消防車“救援”,街道辦回應:系商戶自行設置的屏幕引發誤會,已責令業主關閉

      極目新聞
      2025-12-12 09:49:26
      73勝紀錄注定被打破?無敵雷霆完美復刻昔日勇士:已創多項神跡

      73勝紀錄注定被打破?無敵雷霆完美復刻昔日勇士:已創多項神跡

      羅說NBA
      2025-12-11 20:00:55
      一炮命中副司令?46名官兵當場斃命,36萬泰軍戰備,洪森迎來危機

      一炮命中副司令?46名官兵當場斃命,36萬泰軍戰備,洪森迎來危機

      諦聽骨語本尊
      2025-12-11 23:28:33
      87歲的范曾,竟然還是37歲徐萌的第一任老公!新公司徐萌持股51%

      87歲的范曾,竟然還是37歲徐萌的第一任老公!新公司徐萌持股51%

      荊楚寰宇文樞
      2025-12-11 22:04:40
      遠不如國足!卡帥執教烏茲別克后大倒苦水:面臨3大困難

      遠不如國足!卡帥執教烏茲別克后大倒苦水:面臨3大困難

      邱澤云
      2025-12-11 17:38:55
      48歲的王治郅剛收到NBA寄來的退休金,每月7200元穩穩到賬

      48歲的王治郅剛收到NBA寄來的退休金,每月7200元穩穩到賬

      歲月有情1314
      2025-12-11 07:22:35
      大爆冷!開拓者23分慘敗,楊瀚森傷缺,西部倒數第一終結7連敗

      大爆冷!開拓者23分慘敗,楊瀚森傷缺,西部倒數第一終結7連敗

      老侃侃球
      2025-12-12 11:37:26
      中央明確:普通高中、優質本科擴招

      中央明確:普通高中、優質本科擴招

      第一財經資訊
      2025-12-11 20:06:08
      色膽包天啊!一年輕女子在麗江入住酒店遭遇強奸,嫌疑人已被刑拘

      色膽包天啊!一年輕女子在麗江入住酒店遭遇強奸,嫌疑人已被刑拘

      火山詩話
      2025-12-12 06:40:15
      還打個屁啊!7個聯盟第1!總冠軍+狀元簽我都要!8.22億真沒白花

      還打個屁啊!7個聯盟第1!總冠軍+狀元簽我都要!8.22億真沒白花

      毒舌NBA
      2025-12-11 14:19:37
      143-120!鵜鶘爆冷大勝開拓者,聯盟墊底終結7連敗,楊瀚森虧大了

      143-120!鵜鶘爆冷大勝開拓者,聯盟墊底終結7連敗,楊瀚森虧大了

      球場沒跑道
      2025-12-12 11:33:23
      2025-12-12 11:56:49
      ScienceAI incentive-icons
      ScienceAI
      關注人工智能與其他前沿技術
      1177文章數 221關注度
      往期回顧 全部

      科技要聞

      凌晨突發!GPT-5.2上線,首批實測感受來了

      頭條要聞

      曾因監獄疫情防控不力被免職 解維俊5年多后又被查

      頭條要聞

      曾因監獄疫情防控不力被免職 解維俊5年多后又被查

      體育要聞

      15輪2分,他們怎么成了英超最爛球隊?

      娛樂要聞

      濮存昕外孫女演短劇遭吐槽

      財經要聞

      美國要組建C5,全世界大吃一驚

      汽車要聞

      插混四驅法拉利?849 Testarossa國內發布516.8萬起

      態度原創

      健康
      藝術
      教育
      時尚
      家居

      甲狀腺結節到這個程度,該穿刺了!

      藝術要聞

      嶺南畫派畫雪

      教育要聞

      2026年退役大學生士兵專項碩士招生計劃發布

      12月的奇跡,是“白”給的!

      家居要聞

      溫潤質感 打造干凈空間

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 免费看的一级毛片| 亚洲一区二区三区播放| 亚洲2022国产成人精品无码区 | 亚洲小说区图片区| 中国少妇BBW| 色综合天天综合网天天狠天天| 乱女伦露脸对白在线播放| 无码国产成人午夜电影在线观看 | 日日插插| 天天拍夜夜添久久精品大| 日韩a无v码在线播放| 成人午夜电影福利免费| 亚洲日韩在线中文字幕| 叙永县| 国产福利萌白酱在线观看视频| 国产精品内射后入合集| 一本色道婷婷久久欧美| 99999精品| 亚欧美国产色| 久久国产精品无码一区二区三区 | 四虎成人在线观看免费| 77777AV| 亚洲一卡二卡| 午夜阳光精品一区二区三区| 国产无遮挡猛进猛出免费软件| 高跟熟女中文字幕在线亚洲| 国产视频九九| 国产日韩精品欧美一区喷水| 国产精品青青在线观看爽香蕉| 亚洲区中文字幕| 精品人妻无码中文内容| 国产午夜伦鲁鲁| 黄页网址大全免费观看| 天天综合91| 男女毛多水多亚洲| av片在线观看| 亚洲香蕉伊综合在人在线| 午夜社区| 一本本月无码-| 国产成人av三级在线观看| 亚洲国产精品成人网站|