<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek論文發表16天后,國內團隊已經寫出了模型的「生物字典」

      0
      分享至





      機器之心編輯部

      今年 1 月,DeepSeek 發布了一項名為 Engram(條件記憶)的技術,在大模型圈子里掀起不小波瀾。

      它的核心思想很簡單:別讓模型死記硬背常識,直接給它一個「外掛記憶庫」。

      具體做法是:把常見的 N-gram,比如「人工智能」、「光合作用」,預先存進一個哈希表,模型需要時查表即可,省下大量算力專注推理。

      這個思路,能不能用在其他領域的模型訓推上?答案是:能,且效果驚人。

      就在 Engram 論文(《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》)發布僅 16 天后,同樣 base 在杭州的一支研發團隊,推出Gengram(Genomic Engram)模塊,把「外掛字典」搬進了基因組世界。



      • 代碼鏈接: https://github.com/zhejianglab/Gengram
      • 模型鏈接: https://huggingface.co/ZhejiangLab/Gengram
      • 論文鏈接: https://github.com/zhejianglab/Gengram/tree/main/paper

      傳統方法的困境:為每個堿基「重復造輪子」

      當前,主流的基因組基礎模型(Genomic Foundation Models, GFMs),如 Deepmind 的 AlphaGenome 等,普遍采用一種叫「單堿基分詞」的策略,也就是把 DNA 序列拆成一個個單獨的字母(A/T/C/G)來處理。

      這聽起來非常符合生物學邏輯,并且操作精度更高,然而代價也是巨大的。

      首先是效率低下。要識別一個關鍵功能片段(比如啟動子或剪接位點),模型得靠多層注意力機制,從零開始「拼湊」出像「TATAAAA」這樣的經典堿基組合(Motif)。

      其次是容易迷失。在動輒幾萬甚至幾十萬堿基的長序列中,模型常?!钢灰姌淠?,不見森林」,何況人類的基因組是一串長達 30 億字符的連續序列。

      用更容易理解的方式來打個比方:人類學習「魑魅魍魎」時,一眼就能理解這是個成語。但傳統的基因組模型卻得先分析每個「鬼」字究竟是什么鬼…… 既要區分又要預測,最終結果就是既費力,又不準。

      Gengram 是怎么工作的?

      Gengram 的核心邏輯承襲自 Engram:將「靜態的 Motif 識別」與「動態的上下文推理」進行解耦處理

      Gengram 預先構建了一個可微分的哈希表,存儲所有長度為 1 到 6 的 DNA 片段(稱為 k-mer,如「ATG」、「CGTA」)對應的語義向量。這些 k-mer 很多就是已知的生物學功能單元(比如轉錄因子結合位點),相當于給 AI 配了一本《基因組學實用短語手冊》。

      與其他領域相比,DNA 只有 4 個字母(A/T/C/G)及少量未知堿基(N)構成,整個字符集極小。Gengram 無需承擔復雜的 Tokenizer 壓縮負擔,查表速度極快,幾乎不增加計算開銷。

      事實上,由于功能重要性不同,并非所有 Motif 都需要這本「字典」的加持。為此,Gengram 引入了動態門控機制

      模型可以結合上下文語境自主決定何時「查字典」:在遇到外顯子、啟動子等關鍵 Motif 區域時激活檢索功能;在通過非編碼背景區域時關閉檢索,依賴推理,優化資源。

      經團隊測試,這個門控目前已經掌握了「什么時候該查詢參考資料,什么時候該獨立思考」的判斷能力。

      小模塊,大提升

      事實上,Gengram 只是一個僅約 2000 萬參數的輕量化插件,對于百億級規模的模型來說微不足道,但它帶來的性能提升卻令人振奮。

      在 8k 和 32k 兩個上下文版本中,同等訓練設定下,應用了 Gengram 的模型幾乎在所有任務里領先未應用的版本。

      其中,剪接位點預測 AUC 提升了16.1%(從 0.776 到 0.901),表觀遺傳預測任務(H3K36me3) AUC 提升了22.6%(從 0.656 到 0.804)。

      這種跨越式的性能飛躍,賦予了模型驚人的數據杠桿效應。

      在與多款主流 DNA 基礎模型的橫向測評中,集成 Gengram 的模型僅需極小規模的訓練數據,和較小的激活參數量,便能在核心任務上媲美乃至超越訓練數據規模領先其數十倍的公開模型,大幅提升了模型訓練的數據能效比。

      同時,Gengram 展現出了卓越的通用適配能力,能夠跨越 Dense(稠密) 與 MoE(混合專家) 等不同模型架構實現無縫部署。

      無論采用何種注意力機制變體,Gengram 均能在有效降低訓練損失的同時,顯著加速模型收斂。特別是針對 MoE 架構中專家負載失衡這一頑疾,Gengram 通過吸收局部高頻噪聲,顯著改善了專家負載均衡,實現了模型性能與架構效率的協同跨越。



      跨稀疏度負載均衡:在 Top-2 / 128、64 和 32 專家配置下,使用與不使用 Gengram 模塊的負載均衡損失曲線對比,表明其在多種稀疏度設置下均能實現穩定性能。

      此外,模型開始「涌現」出對 DNA 物理本質的理解。

      當團隊為 Gengram 局部聚合窗口(Local Window Aggregation)測試窗口大小策略時,結果顯示:窗口大小參數設置為 21bp 時,其性能達到峰值

      為什么偏偏是 21?

      因為 DNA 雙螺旋結構每 10.5 個堿基旋轉一圈,而 21 個堿基正好對應兩個完整的螺旋周期。這意味著,每相隔 21bp 的堿基在物理空間上其實位于螺旋的同一側,具備相似的生化環境和特征。

      換句話說,Gengram 在沒有學習過任何結構生物學知識的前提下,通過計算自己悟到了 DNA 序列信息和空間相位規律。



      DNA 雙螺旋結構示意圖展示了 B 型 DNA 的結構參數,DNA 雙螺旋每 10.5 個堿基對旋轉一圈。



      不同 Gengram 窗口大小下的驗證損失,由此選擇了 21 寬度的窗口

      范式啟示:Gengram 為 AI 科學模型提供新探索路徑

      Gengram 的成功,遠不止于解決基因組建模的特定難題。它更像一個精巧的概念驗證,為如何構建新一代懂科學的 AI 探索了一種新的模式。

      從「暴力記憶」到「結構化知識外掛」:效率范式的轉變。傳統 AI 模型增強能力主要靠擴張參數與數據,本質是讓網絡更費力地「記住」 一切。Gengram 則將領域內確鑿的、結構化的先驗知識(如功能 Motif)做成一個輕量、可查詢的外部知識庫。這讓核心模型能從繁瑣的模式記憶中解脫,專注于更高級的上下文推理與組合創新。這預示著,未來科學基礎模型的架構,可能是「通用模型核心+多個領域專用插件」的協同形態。

      「歸納偏置」注入:生物物理規律的「硬編碼」。通過將 B 型 DNA 雙螺旋每 10.5 個堿基完成一個旋轉周期(即約 21 bp 的雙圈周期)這一結構特性,顯式轉化為模型內部的局部窗口機制,Gengram 成功地將這種物理空間相位的周期性作為先驗知識注入模型,使其能夠捕捉特定相位的立體化學模式和蛋白質綁定偏好。

      可解釋性的內生設計:讓 AI 的「思維過程」透明化。模型不再僅僅進行隱式的統計擬合,而是通過顯式的 Hash 查詢和門控記憶通路,在淺層即展現出對 TATA-box、poly (T) 等關鍵功能基元的高度敏感性,其內部殘差強度的峰值與基因組功能邊界精準對齊,實現了從「黑盒計算」向「具備生物學認知足跡」的演進。

      解決長程依賴的新路徑:從局部最優到全局洞察。實驗證明,Gengram 使得僅在 8K 長度上訓練的模型,卻獲得了處理 32K 長序列的優異能力。這為基因調控元件預測、表觀遺傳學分析、跨物種進化分析以及復雜的多組學建模等復雜長序列問題,開辟了精細化局部感知驅動全局理解的新途徑。

      Gengram 建立了一種將領域特有規律轉化為顯式架構約束的創新范式,證明了通過精細化的局部結構化感知可以有效彌補標稱上下文長度的局限,實現低成本且高效的長程依賴建模。

      低調的 Genos Team 是啥背景?

      盡管論文署名低調地使用了「Genos Team」,但從開源代碼庫的 Zhejianglab 和 BGI-HangzhouAI 能夠推斷出這支團隊的硬核背景:一家是坐落在杭州的專注于智能計算的新型研發機構之江實驗室,另一家是杭州華大生命科學研究院。

      兩個團隊的融合,構建起「AI + 生命科學」的交叉創新壁壘,這是純 CS 團隊或純基因團隊無法比擬的優勢。

      論文里的實驗,大多基于人類基因組基礎模型 Genos 實現,從可公開獲取的信息來看,Genos 多數指標都超越了目前的業界頂流 Evo-2

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      賭王女兒顏值大比拼:二三房出大美人,四房女兒少了幾分貴氣

      賭王女兒顏值大比拼:二三房出大美人,四房女兒少了幾分貴氣

      小霍霍
      2026-02-01 12:51:52
      《太平年》5大忠臣結局:水丘昭券慘死,馮道被郭榮棄用后被封王

      《太平年》5大忠臣結局:水丘昭券慘死,馮道被郭榮棄用后被封王

      掠影后有感
      2026-02-01 10:02:04
      我剛調任局長去食堂吃飯,一老干部拍著桌子吼:你知道我是誰嗎!

      我剛調任局長去食堂吃飯,一老干部拍著桌子吼:你知道我是誰嗎!

      星宇共鳴
      2026-01-28 09:05:49
      李亞鵬身后的“木訥茶老板”:落魄時的陪伴,才是成年人最硬底牌

      李亞鵬身后的“木訥茶老板”:落魄時的陪伴,才是成年人最硬底牌

      鋒哥與八卦哥
      2026-01-31 17:23:59
      郎平也沒想到,當年留給前夫在美國長大的女兒,如今成了她的驕傲

      郎平也沒想到,當年留給前夫在美國長大的女兒,如今成了她的驕傲

      娛說瑜悅
      2026-01-29 15:29:12
      愛潑斯坦檔案大曝光!蓋茨染病 / 安德魯牽俄女 / 馬斯克狂野派對

      愛潑斯坦檔案大曝光!蓋茨染病 / 安德魯牽俄女 / 馬斯克狂野派對

      黃勝友
      2026-01-31 15:52:02
      廖錫龍將軍去世!他曾怒罵谷俊山:我死都不怕,還怕一個貪官?

      廖錫龍將軍去世!他曾怒罵谷俊山:我死都不怕,還怕一個貪官?

      帝哥說史
      2026-01-29 22:15:39
      Tesla特斯拉中國招聘(最新)!15薪!

      Tesla特斯拉中國招聘(最新)!15薪!

      實習僧
      2026-01-29 16:41:17
      我媽逼我每周給博導姨媽家搞衛生,考博復試五個考官四個是她學生

      我媽逼我每周給博導姨媽家搞衛生,考博復試五個考官四個是她學生

      蘭姐說故事
      2026-01-30 05:25:03
      一架美戰機在南海被中國神秘武器擊落?特朗普:很快就會知道結果

      一架美戰機在南海被中國神秘武器擊落?特朗普:很快就會知道結果

      悅心知足
      2026-01-31 16:02:49
      聯盟重磅官宣!喬治被禁賽25場:球員本人已緊急發布道歉聲明

      聯盟重磅官宣!喬治被禁賽25場:球員本人已緊急發布道歉聲明

      移動擋拆
      2026-02-01 02:01:54
      賈寶玉做夢與秦可卿云雨,醒來后陪侍的四個丫頭,為何消失一人?

      賈寶玉做夢與秦可卿云雨,醒來后陪侍的四個丫頭,為何消失一人?

      談史論天地
      2026-01-30 10:05:05
      布里吉特:施瓦辛格的舊愛,史泰龍的噩夢,麥當娜的仇人,54歲給小15歲老公生女

      布里吉特:施瓦辛格的舊愛,史泰龍的噩夢,麥當娜的仇人,54歲給小15歲老公生女

      小魚愛魚樂
      2026-01-31 23:44:27
      哈馬斯指揮官逃出地道時被以色列抓獲

      哈馬斯指揮官逃出地道時被以色列抓獲

      桂系007
      2026-01-31 05:16:56
      2036奧運中國連表格都不填,省下200億美刀干什么?

      2036奧運中國連表格都不填,省下200億美刀干什么?

      南權先生
      2026-01-28 15:52:11
      今年中超算是回光! 居然有德甲+意甲球員加盟聯賽

      今年中超算是回光! 居然有德甲+意甲球員加盟聯賽

      80后體育大蜀黍
      2026-01-31 23:46:59
      曝西米奇加盟泰山內幕:三方默契演出、雙贏劇本,只有球迷當真了

      曝西米奇加盟泰山內幕:三方默契演出、雙贏劇本,只有球迷當真了

      體壇小鵬
      2026-02-01 09:36:32
      梅蘭芳二夫人有多美?熬死原配,逼退孟小冬,美得叫人挪不開眼

      梅蘭芳二夫人有多美?熬死原配,逼退孟小冬,美得叫人挪不開眼

      萬物知識圈
      2026-01-10 09:14:17
      安徽一男子參加公司年會,先后抽中10萬元彩票和蘋果17ProMax,公司人士:純運氣,無暗箱操作

      安徽一男子參加公司年會,先后抽中10萬元彩票和蘋果17ProMax,公司人士:純運氣,無暗箱操作

      極目新聞
      2026-02-01 13:10:29
      聯合國四常已攤牌,中方無憂,九天后高市交權?

      聯合國四常已攤牌,中方無憂,九天后高市交權?

      觀察者海風
      2026-01-31 11:56:48
      2026-02-01 13:48:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12226文章數 142560關注度
      往期回顧 全部

      科技要聞

      騰訊元寶宣布:10億現金紅包,今日開搶

      頭條要聞

      媒體:寶可夢十年間三次踩線 可不是簡單的"工作失誤"

      頭條要聞

      媒體:寶可夢十年間三次踩線 可不是簡單的"工作失誤"

      體育要聞

      鎖喉吃紅牌+扇耳光 英超15人打群架

      娛樂要聞

      馬年春晚第三次聯排,多位明星現身

      財經要聞

      黃仁勛臺北"夜宴":匯聚近40位臺企高管

      汽車要聞

      新款賓利歐陸GT S/GTC S官圖發布 V8混動加持

      態度原創

      房產
      旅游
      家居
      時尚
      藝術

      房產要聞

      藏不住的小城大事,海澄新城執掌自貿港風口,進階兌現美好生活新篇

      旅游要聞

      “嘉禾望崗”整出廣州文旅的“活人感”

      家居要聞

      藍調空舍 自由與個性

      上年紀的女人買“上衣”:避開3個坑,這樣選時髦又顯氣質

      藝術要聞

      明代隱藏的“草書高手”,他的字無人能模仿

      無障礙瀏覽 進入關懷版