<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      突破萬次連續編輯極限!中科院提出首個理論保穩的知識保留方法

      0
      分享至


      新智元報道

      編輯:LRST

      【新智元導讀】LyapLock首次讓大模型在上萬次知識更新中穩住舊記憶、精準學新知。它用「虛擬隊列」實時監控遺忘風險,動態平衡新舊知識,理論保證長期不崩盤,編輯效果比主流方法提升11.89%,還能賦能現有模型,讓AI真正學會「持續成長」。

      大型語言模型通常包含事實上不正確或過時的知識,這催生了用于實現精確知識更新的模型編輯方法。然而,由于缺乏適當的長期知識保留機制,當前主流的「先定位后編輯」方法在連續編輯過程中表現出漸進式的性能下降。

      為了解決這個問題,中科院信工所的研究人員提出了LyapLock,將連續編輯建模為一個受約束的隨機規劃問題。鑒于累積保留誤差約束以及逐漸揭示的編輯任務所帶來的挑戰。


      論文鏈接: https://arxiv.org/pdf/2505.15702

      LyapLock整合了排隊論和李雅普諾夫(Lyapunov)優化,將長期的約束規劃分解為易于處理的逐步子問題,從而實現高效求解。

      這是第一個具備嚴格理論保證的模型編輯框架,在滿足長期知識保留約束的同時,實現了漸近最優的編輯性能。

      實驗結果表明,該框架將連續編輯的能力擴展到了10,000次以上,在穩定模型通用能力的同時,其平均編輯效果比當前最先進(SOTA)的基線方法提升了11.89%。此外,該框架還可以被用來增強現有基線方法的性能。

      研究背景

      目前主流的「先定位后編輯(Locate-then-edit)」范式(比如大名鼎鼎的ROME和MEMIT)在單次知識更新上極其精準。為了讓它們適應連續編輯,近期的研究(如RECT、AlphaEdit)嘗試在參數搜索時加入正則化或零空間投影等啟發式約束 。

      痛點在于:這些方法本質上都是短視的。

      • 它們大都只專注于眼前的單步增量優化,缺乏一個嚴謹的理論框架來管控連續編輯在長期帶來的累積效應 。

      • 每次編輯似乎只破壞了一點點原有知識,但一萬次編輯之后,累積的保留損失(Preservation Loss)會呈現單調上漲的失控態勢 。

      • 實驗殘酷地證明了這一點:在連續編輯10,000個樣本后,所有主流基線方法在下游任務上的性能幾乎全部掉到了零點(圖1)。


      圖1:基線方法Preservation Loss爆炸和下游任務F1歸零的折線圖

      研究方法

      既然頭痛醫頭腳痛醫腳不行,那就必須從全局視角重新定義問題。

      LyapLock 沒有繼續在單步損失函數上縫縫補補,而是直接把連續編輯建模成了一個帶長期約束的隨機規劃問題(圖2)


      圖2:傳統的單步雙目標優化與 LyapLock 約束長期優化的核心區別公式對比圖

      用「剝洋蔥」的方式來說,直覺(Intuition)是這樣的:

      • 引入虛擬隊列(Virtual Queues)充當「蓄水池」:設計了一個虛擬隊列 ,用來實時監控累積的記憶遺忘情況 。如果編輯某條知識導致原有知識破壞過大,超出了設定的紅線閾值 ,這個隊列的水位就會上漲 。

      • 動態博弈的李雅普諾夫優化(Lyapunov Optimization):這是控制論中的經典方法 。當隊列水位 升高時,系統會自動拉響警報,增加損失函數中「知識保留(Preservation Loss)」的懲罰權重 。此時,模型的首要任務變成了「保護老知識」。

      • 張弛有度:而當水位下降(即近期編輯對老知識破壞不大,處于安全區)時,權重減小,系統又會把計算資源傾斜給「學習新知識(Editing Loss)」 。

      通過這種方式,研究人員在理論上證明了:只要虛擬隊列保持強穩定,模型在無限次連續編輯中的平均保留損失就一定會被死死鎖在紅線之內 。

      詳細結果

      用真實的實驗數據來說話,在LLaMA-3(8B)、GPT-J(6B) 等多個模型上進行了極限測試 。

      破萬次編輯,通用能力不崩盤

      在連續編輯10,000次后,所有的基線方法(ROME, MEMIT, PRUNE, RECT, AlphaEdit)在 GLUE 六大下游任務上全軍覆沒,性能暴跌至0%。而LyapLock穩如泰山,甚至當把壓力測試拉高到20,000次編輯時,模型依然保持著極佳的通用語言能力。同時,在其他基線方法的Preservation Loss類似指數上升的同時,LyapLock方法將其限制在了一定的閾值內(圖3,圖4)。


      圖3:GLUE下游任務抗跌對比


      圖4:Preservation Loss穩定在閾值內的對比圖

      知識更新性能霸榜

      不僅老知識護得好,新知識也學得精。相比于第二強的基線AlphaEdit,LyapLock的平均編輯效力(Efficacy)硬生生拔高了11.89%。在LLaMA3-Counterfact場景下,泛化能力更是拉開了19.71%的巨大差距 。


      圖5:主實驗結果

      即插即用的外掛神器

      LyapLock的理論框架不僅能單打獨斗,還能向下兼容!把它和MEMIT、PRUNE等現有方法結合,能夠直接讓它們的編輯性能提升9.76%,下游任務表現更是暴漲41.11%


      圖6:結合 LyapLock 后基線方法性能提升的雷達圖

      總結與展望

      LyapLock第一次利用Lyapunov優化為連續編輯套上了一層帶理論保證的「鎖」。它證明了,只要控制好長期損失的累積,LLM完全有潛力像人類一樣,在漫長的生命周期中持續學習和修正認知,而不至于「學了新知識,忘了自己是誰」 。

      當然,目前的工作也還有進步空間。

      比如評測主要集中在自然語言理解(NLU)任務上,未來在代碼生成、復雜數學推理等領域,這種連續編輯的鎖還能不能鎖得這么穩?更大的十萬、百萬級編輯量極限又在哪里?這些都非常值得社區繼續深挖 。

      參考資料:

      https://arxiv.org/pdf/2505.15702

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      子宮薄如紙、發際線后移,43歲千億兒媳徐子淇,終于還是“垮了”

      子宮薄如紙、發際線后移,43歲千億兒媳徐子淇,終于還是“垮了”

      素衣讀史
      2026-03-10 16:53:15
      耗資12億建世界最高佛,如今水喝不起拜不起

      耗資12億建世界最高佛,如今水喝不起拜不起

      時光流轉追夢人
      2026-02-20 13:09:13
      小S再度開炮,槍口還是對準汪小菲!

      小S再度開炮,槍口還是對準汪小菲!

      達文西看世界
      2026-02-04 11:43:26
      《好好的時光》大結局,莊好好改嫁方亮,單寶坤至死不認親子

      《好好的時光》大結局,莊好好改嫁方亮,單寶坤至死不認親子

      小丸子的娛樂圈
      2026-03-11 08:20:03
      福布斯公布名人富豪榜:斯皮爾伯格71億登頂,喬丹43億仍排前三

      福布斯公布名人富豪榜:斯皮爾伯格71億登頂,喬丹43億仍排前三

      陳意小可愛
      2026-03-11 17:23:58
      住家保姆喝光雇主六瓶52年茅臺,雇主沒讓她賠錢,一句話讓她崩潰

      住家保姆喝光雇主六瓶52年茅臺,雇主沒讓她賠錢,一句話讓她崩潰

      民間精選故事匯
      2026-03-10 17:59:56
      廣西一女子打賞主播54萬,丈夫起訴全額返還被駁回,法院:打賞呈小額、多次、長期特征,符合日常娛樂消費,未超出夫妻家事代理權范疇

      廣西一女子打賞主播54萬,丈夫起訴全額返還被駁回,法院:打賞呈小額、多次、長期特征,符合日常娛樂消費,未超出夫妻家事代理權范疇

      極目新聞
      2026-03-11 15:54:30
      近八百架無人機導彈奔襲莫斯科等地!烏克蘭對俄發動最大規模攻擊

      近八百架無人機導彈奔襲莫斯科等地!烏克蘭對俄發動最大規模攻擊

      項鵬飛
      2026-03-10 16:56:37
      亞冠東亞區四強:町田澤維亞、神戶勝利船、柔佛新山和武里南聯

      亞冠東亞區四強:町田澤維亞、神戶勝利船、柔佛新山和武里南聯

      懂球帝
      2026-03-11 21:26:38
      小米YU9“閃現”!攬勝“輾轉反側”

      小米YU9“閃現”!攬勝“輾轉反側”

      手機評測室
      2026-03-09 11:50:20
      子宮薄如紙、發際線后移,43歲千億兒媳徐子淇,終于還是“垮了”

      子宮薄如紙、發際線后移,43歲千億兒媳徐子淇,終于還是“垮了”

      往史過眼云煙
      2026-03-10 19:39:26
      影史第一恐怖片,首次國內上映

      影史第一恐怖片,首次國內上映

      南風窗
      2026-03-10 14:01:55
      232家合作機構編織催收“天羅地網”,一場訴訟撕開微眾銀行管理失范的冰山一角

      232家合作機構編織催收“天羅地網”,一場訴訟撕開微眾銀行管理失范的冰山一角

      經理人雜志
      2026-03-11 15:57:16
      別被忽悠了!Openclaw取代打工人?我搭了一次發現驚人真相

      別被忽悠了!Openclaw取代打工人?我搭了一次發現驚人真相

      雷科技
      2026-03-10 10:55:29
      梅婷寵著、閆妮護著,長得不帥氣卻讓大咖輪流作配,他到底啥來頭

      梅婷寵著、閆妮護著,長得不帥氣卻讓大咖輪流作配,他到底啥來頭

      洲洲影視娛評
      2026-03-11 21:01:20
      兩會日程預告丨3月12日:十四屆全國人大四次會議閉幕

      兩會日程預告丨3月12日:十四屆全國人大四次會議閉幕

      環球網資訊
      2026-03-11 21:29:16
      48小時內,亞洲三國給中國送大禮,美專家痛心疾首:特朗普犯大錯

      48小時內,亞洲三國給中國送大禮,美專家痛心疾首:特朗普犯大錯

      現代小青青慕慕
      2026-03-11 14:14:28
      蔚來盈利了,但換電的墳場也到了

      蔚來盈利了,但換電的墳場也到了

      大嘴説
      2026-03-11 10:43:15
      鄧文迪攜女兒亮相默多克95歲壽宴,狀態氣質雙絕

      鄧文迪攜女兒亮相默多克95歲壽宴,狀態氣質雙絕

      述家娛記
      2026-03-11 08:32:30
      中超升班馬票價太高!球迷怒了 俱樂部門口放韭菜抗議 黃健翔炮轟

      中超升班馬票價太高!球迷怒了 俱樂部門口放韭菜抗議 黃健翔炮轟

      念洲
      2026-03-11 10:39:58
      2026-03-11 23:11:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14696文章數 66682關注度
      往期回顧 全部

      科技要聞

      騰訊"養蝦"暴漲后,百度急得在門口"裝蝦"

      頭條要聞

      聯合國16位專家呼吁日本道歉 外交部回應

      頭條要聞

      聯合國16位專家呼吁日本道歉 外交部回應

      體育要聞

      郭艾倫重傷,CBA下半賽季還能期待些什么

      娛樂要聞

      蔡少芬曬全家福照,兩女兒成最大亮點

      財經要聞

      喚醒10萬億存量資金 公積金改革大潮來了

      汽車要聞

      蓮花糾偏, 馮擎峰的“收”與“守”

      態度原創

      親子
      藝術
      數碼
      本地
      公開課

      親子要聞

      媽媽不求你多優秀,只愿你這一生平安、順遂、有人疼、有人愛。

      藝術要聞

      這組剪紙太美了!

      數碼要聞

      分析師“自我辟謠” 第二代MacBook Neo取消換裝觸控屏計劃

      本地新聞

      這檔韓國玄學綜藝,讓多少人看得頭皮發麻

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版