<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AAAI 2026 | 首個抗端到端攻擊的大模型加密指紋 / 水印方案

      0
      分享至



      本研究由史蒂文斯理工學院(Stevens Institute of Technology)的 IntelliSys Lab 團隊以及休斯頓大學(University of Houston) 的 ANTS Lab 團隊的相關研究人員共同完成,主要研究方向包括無服務器計算、高性能計算、AI 安全、聯邦學習、LLM 代理系統、隱私保護及分布式智能系統等領域。

      隨著大語言模型(LLM)的商業價值快速提升,其昂貴的訓練成本使得模型版權保護(IP Protection)成為業界關注的焦點。然而,現有模型版權驗證手段(如模型指紋)往往忽略一個關鍵威脅:攻擊者一旦直接竊取模型權重,即擁有對模型的完全控制權,能夠逆向指紋 / 水印,或通過修改輸出內容繞過指紋驗證。

      在此背景下,史蒂文斯理工學院(Stevens Institute of Technology)王灝老師團隊的第二年級博士生熊子洵同學提出了 iSeal。該工作已被 AAAI 2026 主軌道以 poster 形式錄用。

      iSeal 是首個面向「端到端」模型竊取場景設計的加密指紋方案。它通過引入加密機制,使得指紋可抵御擁有模型完全控制權的攻擊者所發起的「合謀遺忘攻擊」(Collusion-based Unlearning)與「響應篡改攻擊」(Response Manipulation),并在 12 個主流 LLM 上實現了 100% 的驗證成功率。



      • 論文標題:iSeal: Encrypted Fingerprinting for Reliable LLM Ownership Verification
      • 論文鏈接
      • https://arxiv.org/pdf/2511.08905

      研究問題與背景

      大語言模型的訓練往往耗費數百萬美元的算力與數據資源,使得訓練后的模型權重成為了極具價值的知識產權。為了確權,研究人員通常采用「模型指紋」(Model Fingerprinting)技術,即在模型中植入「觸發器」(Trigger),當輸入特定樣本時輸出特征化響應,以此證明模型所有權。

      然而,現有指紋技術普遍基于一個不現實的假設:默認驗證者面對的是黑盒 API,或攻擊者無法干預推理過程。

      在現實中,高級攻擊者往往直接盜取模型權重并在本地部署,從而擁有「端到端控制」(End-to-End Control)。在這種情況下,攻擊者可以發動更強的攻擊,包括:

      • 合謀遺忘(Collusion-based Unlearning):攻擊者收集部分指紋觸發樣本與其響應,通過微調或反向訓練使模型遺忘特定指紋特征。



      • 響應篡改(Response Manipulation):攻擊者實時監控模型輸出,一旦檢測到疑似指紋響應,立即使用同義詞替換、句式重組或 paraphrasing 進行篡改,從而繞過驗證。



      實驗表明,在這些高級攻擊下,傳統指紋方案(如后門式指紋)大多迅速失效,驗證成功率接近 0%,無法提供有效保護。

      方法與創新:

      iSeal 的加密指紋框架



      針對上述挑戰,iSeal 提出了一套全新的加密指紋驗證框架。其核心思想不是植入一個靜態后門,而是將指紋驗證過程轉化為一個安全的加密交互協議。主要設計包括以下三個方面:

      • 加密指紋(Encrypted Fingerprinting)與外部編碼器

      iSeal 采用加密的指紋植入機制,并引入外部編碼器(External Encoder)來解耦指紋與模型權重,使得指紋特征不再以顯式形式存儲在模型參數中,從而防止攻擊者通過分析權重逆向指紋。

      • 抗遺忘設計:Confusion & Diffusion 綁定機制

      iSeal 通過 Confusion & Diffusion 機制,將指紋特征通過條件概率深度綁定到模型的核心推理能力之中。指紋不再是可單獨剝離的附加結構,且多個指紋之間不互相糾纏,因此攻擊者即使嘗試遺忘部分指紋,也無法破壞整體指紋系統。

      • 抵御響應篡改:基于相似度的動態驗證

      針對推理階段的輸出篡改,iSeal 采用基于相似度的驗證策略(Similarity-based Verification)和糾錯機制(Reed-Solomon Code)。即使攻擊者使用 paraphrasing 或同義詞替換,驗證算法也能從語義與概率分布中恢復指紋信號。

      實驗結果

      研究團隊在包括 LLaMA、OPT 等在內的 12 個主流大語言模型上評估了 iSeal。結果顯示,在提供強指紋保護的同時,iSeal 不影響模型的原始任務性能。

      • 防御微調與合謀攻擊

      研究者模擬了攻擊者利用盜取的模型權重執行 SFT 微調與合謀遺忘攻擊。即使攻擊者利用已知指紋樣本反向訓練以擦除指紋:

      • iSeal 的驗證成功率(FSR)始終保持在 100%;

      • 傳統指紋方法在經過少量微調后即完全失效(FSR ≈ 0%)。 這是因為 iSeal 的指紋互不糾纏,使得攻擊者無法通過遺忘部分指紋來破壞整個驗證結構。



      • 防御響應篡改攻擊

      針對同義詞替換、句式改寫和 LLM 派生潤色等篡改方式,iSeal 的相似度驗證與糾錯機制依然能夠從潛在語義中識別指紋信號,因此驗證成功率仍然維持在 100%。相比之下,基于精確匹配(Exact Match)的傳統方法在此類攻擊下完全失效。



      • 消融實驗

      研究者對 iSeal 的關鍵組件進行了消融實驗,以驗證其必要性。



      • 凍結編碼器(Freezing the Encoder):若訓練時不凍結編碼器(iSeal w/o freezing),模型無法穩定收斂,FSR 直接降低為 0%。

      • 可學習編碼器(Learned Encoder):將可學習編碼器替換為傳統加密算法(如 AES,即 iSeal w/o encoder)后,FSR 降至 0%–2%。說明傳統加密機制無法有效實現 iSeal 所需的指紋嵌入與語義恢復能力。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      特朗普徹底放棄歐洲,德國戰車正式啟動,歐盟去美國化開始了

      特朗普徹底放棄歐洲,德國戰車正式啟動,歐盟去美國化開始了

      聽風聽你
      2025-12-07 12:27:03
      中國的備戰備荒已經做到了讓外人覺得喪心病狂的地步

      中國的備戰備荒已經做到了讓外人覺得喪心病狂的地步

      南權先生
      2025-12-08 17:40:09
      既然全世界都承認臺灣是中國的,那為什么中國收回臺灣這么難呢?

      既然全世界都承認臺灣是中國的,那為什么中國收回臺灣這么難呢?

      扶蘇聊歷史
      2025-12-07 09:50:03
      200萬人血本無歸,全網關注的鑫慷嘉暴雷案

      200萬人血本無歸,全網關注的鑫慷嘉暴雷案

      楓冷慕詩
      2025-11-11 18:37:44
      中國工程院院士、蘇州大學原校長應漢杰有新職

      中國工程院院士、蘇州大學原校長應漢杰有新職

      澎湃新聞
      2025-12-08 15:38:27
      性能力與壽命關系被發現!男性40歲后,睪酮越高,死亡風險越低

      性能力與壽命關系被發現!男性40歲后,睪酮越高,死亡風險越低

      藥師說健康
      2025-12-05 09:47:10
      39歲何潔不忍直視,腋下勒出副乳肚子三層肉,要養4個娃操勞疲憊

      39歲何潔不忍直視,腋下勒出副乳肚子三層肉,要養4個娃操勞疲憊

      林雁飛
      2025-12-08 21:13:54
      所有人都在看騎虎難下的日本極右翼女首相,如何把日本引向深淵

      所有人都在看騎虎難下的日本極右翼女首相,如何把日本引向深淵

      鷹視狼顧之天下
      2025-12-02 11:22:49
      19+5!遼籃新星海外聯賽爆發 出色表現令對方球員砸球泄憤

      19+5!遼籃新星海外聯賽爆發 出色表現令對方球員砸球泄憤

      胖子噴球
      2025-12-08 13:19:30
      1949年,老蔣逃往臺灣,起飛前發下最后一道密令:炮轟劉文輝公館

      1949年,老蔣逃往臺灣,起飛前發下最后一道密令:炮轟劉文輝公館

      抽象派大師
      2025-12-08 13:05:21
      王藝迪舉動奏效!林詩棟如有神助掀翻張本智和,未來一哥位置穩了

      王藝迪舉動奏效!林詩棟如有神助掀翻張本智和,未來一哥位置穩了

      三十年萊斯特城球迷
      2025-12-07 22:02:41
      法國“虛偽”,匈牙利“無恥”,歐盟為烏克蘭籌集資金越來越困難

      法國“虛偽”,匈牙利“無恥”,歐盟為烏克蘭籌集資金越來越困難

      山河路口
      2025-12-08 20:09:23
      NBA球員代言球鞋出10代有多難?現役聯盟僅6人做到,兩人超過18代

      NBA球員代言球鞋出10代有多難?現役聯盟僅6人做到,兩人超過18代

      你的籃球頻道
      2025-12-08 12:10:46
      云南旅居養老熱潮,到底養了誰?又“老”了誰?

      云南旅居養老熱潮,到底養了誰?又“老”了誰?

      易觀彩云之南
      2025-12-08 17:45:21
      夏奇拉為《瘋狂動物城2》獻聲,48歲的她為何越來越年輕

      夏奇拉為《瘋狂動物城2》獻聲,48歲的她為何越來越年輕

      時光派健康抗衰
      2025-12-08 17:40:06
      “只要給錢什么都行”,43歲保姆的話,讓62歲的我破防了

      “只要給錢什么都行”,43歲保姆的話,讓62歲的我破防了

      新時代的兩性情感
      2025-12-03 12:59:07
      泰柬邊境局勢升級:泰國出動F-16戰斗機,柬埔寨發射火箭彈,兩國均稱對方先動手

      泰柬邊境局勢升級:泰國出動F-16戰斗機,柬埔寨發射火箭彈,兩國均稱對方先動手

      紅星新聞
      2025-12-08 18:58:27
      連夜注銷!攜程牽手柬埔寨旅游局,網友:這是要電詐園區一日游?

      連夜注銷!攜程牽手柬埔寨旅游局,網友:這是要電詐園區一日游?

      奇思妙想草葉君
      2025-12-04 23:53:54
      成都樓市回歸主城,天府新區市場進入冷卻期

      成都樓市回歸主城,天府新區市場進入冷卻期

      林子說事
      2025-12-08 15:07:05
      中方軍機對日亮劍后,不到24小時,高市打破沉默:中方必須立保證

      中方軍機對日亮劍后,不到24小時,高市打破沉默:中方必須立保證

      小小科普員
      2025-12-08 20:50:47
      2025-12-08 22:11:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11873文章數 142510關注度
      往期回顧 全部

      科技要聞

      外面有人挖,家里有人跑:蘋果亂成了一鍋粥

      頭條要聞

      美高官齊發聲:中國一直在遵守承諾

      頭條要聞

      美高官齊發聲:中國一直在遵守承諾

      體育要聞

      一位大學美術生,如何用4年成為頂級跑者?

      娛樂要聞

      章子怡被說拜高踩低 主動和卡梅隆熱聊

      財經要聞

      百億金融爆雷 浙商大佬"朋友圈"也不靈了

      汽車要聞

      純電全尺寸大六座 凱迪拉克"小凱雷德"申報圖曝光

      態度原創

      藝術
      游戲
      旅游
      時尚
      數碼

      藝術要聞

      一棵樹的力量

      《刺客信條:影》副總監:將重拾跑酷元素 會深挖雙主角設計

      旅游要聞

      廣西南寧:冬日花海醉游人

      伊姐周日熱推:電視劇《超感迷宮》;電視劇《風與潮》......

      數碼要聞

      VGN推出蜻蜓F2 Pro Max/F2 Ultra+三模電競鼠標

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲一级网此| 麻江县| 人妻少妇精品系列| av无码免费| 影音先锋人妻啪啪av资源网站| 91丨九色丨人妻丨白浆| 潘金莲高清dvd碟片| 国产欧美一区二区精品仙草咪| 大帝AV| 久久精品人人做人人爽97| 六月婷婷久香在线视频| 天长市| 色哟哟www网站入口成人学校| 日韩久久无码免费毛片软件| 获嘉县| 亚洲中文字幕免费| 久久男人av资源网站无码软件| 久久久久久AV| 亚洲AV高清一区二区三区尤物| 日韩成人大屁股内射喷水| 在线成人www免费观看视频| 92成人午夜福利一区二区| 亚洲精品久久久口爆吞精| a级免费视频| 台东县| 午夜国人精品av免费看 | 亚洲AⅤ色无码乱码精品| 99久久精品美女高潮喷水| 久久无码字幕中文久久无码| 久久精品国产久精国产| caopor在线| 欧洲无码AV| 国产福利精品一区二区| 亚洲老妈激情一区二区三区| 色秘?乱码一码二码三码熟女| 69亚洲精品| 国产成人片无码视频在线观看| 午夜成午夜成年片在线观看| 热久久美女精品天天吊色| 久久精品亚洲| 国产午夜亚洲精品不卡下载|