<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      ICLR 2026 | PIL:基于線性代理的不可學習樣本生成方法

      0
      分享至



      不可學習樣本(Unlearnable Examples)是一類用于數據保護的技術,其核心思想是在原始數據中注入人類難以察覺的微小擾動,使得未經授權的第三方在使用這些數據訓練模型時,模型的泛化性能顯著下降,甚至接近隨機猜測,從而達到阻止數據被濫用的目的。

      例如,對于攝影師公開發布的作品或用戶分享的個人照片,在添加擾動后,圖像在視覺上幾乎不發生變化;但若這些數據被用于訓練圖像分類模型,其測試準確率可能會從 90% 降至 10% 左右。

      隨著深度模型對大規模數據依賴程度的不斷提升,不可學習樣本逐漸成為數據隱私與模型安全領域的重要研究方向。然而,現有方法在實際應用中仍面臨顯著的效率瓶頸。



      • 論文鏈接: https://arxiv.org/abs/2601.19967
      • 代碼已開源: https://github.com/jinlinll/pil

      現有方法的效率瓶頸

      當前主流的不可學習樣本生成方法大多依賴深度神經網絡(DNN)作為代理模型。其典型流程包括:

      1. 訓練一個復雜的深度模型(如 ResNet、VGG)作為代理;

      2. 在代理模型上通過對抗攻擊方法(如 PGD)迭代優化擾動;

      3. 利用擾動在其他模型上的遷移性實現防護效果。

      這種對深度模型的依賴帶來了若干問題:

      • 計算開銷高:生成一次擾動往往需要大量 GPU 資源。例如,REM 方法在 CIFAR-10 數據集上的擾動生成時間超過 15 GPU 小時;
      • 擴展性受限:當應用于高分辨率圖像或大規模數據集(如 ImageNet)時,時間成本迅速上升;
      • 模型復雜度冗余:深模型的強非線性表達能力并非不可學習樣本生成的必要條件,反而增加了優化難度。

      核心觀察:不可學習樣本與模型線性化

      我們關注到一個關鍵現象:不可學習樣本的作用機制,本質上是誘導深模型退化為近似線性的行為模式。

      我們評估了多種現有不可學習樣本方法(包括 EM、REM、TAP、SP、AR 等),發現一個一致現象:無論方法設計多么復雜,最終均會誘導深度模型呈現更強的線性特征(通過 FGSM 的成功率度量)



      表 1:不同 FGSM 攻擊步長下不可學習樣本導致的額外準確率下降百分比(擾動比例 50%)

      從這一角度出發,如果最終目標是使深模型表現出線性特性,那么使用復雜的深度模型作為代理并非必要。相反,直接利用線性模型生成擾動,可能更直接地作用于這一核心機制。

      基于此,我們提出PIL(Perturbation-Induced Linearization): 通過線性模型作為代理,直接生成能夠誘導深模型線性化的不可學習擾動。

      PIL 方法概述

      與基于對抗攻擊的方案不同,PIL 通過一個雙目標優化過程,引導模型學習線性映射。

      1. 語義混淆(Semantic Obfuscation)

      通過最小化 KL 散度,使線性代理模型在擾動后的樣本上輸出接近均勻分布,從而削弱原始圖像中可用于分類的語義信息。

      2. 捷徑誘導(Shortcut Learning)

      通過最小化交叉熵損失,使代理模型能夠僅依據擾動準確預測標簽,從而將判別信息嵌入進擾動中。

      兩個目標通過平衡參數 λ 進行聯合優化,最終生成的擾動同時抑制語義學習并強化線性捷徑,從而在深模型訓練階段誘導其產生顯著的泛化退化。



      圖 1:PIL 方法示意圖

      PIL 的算法流程(簡要)

      1. 訓練一個無偏置的線性分類器作為代理模型;

      2. 在不可察覺約束(L∞≤8/255)下,采用類似 PGD 的方法優化擾動;

      3. 將擾動注入原始圖像,構造不可學習樣本;



      Algorithm 1:PIL 算法流程

      實驗結果

      我們在 SVHN、CIFAR-10/100 和 ImageNet-100 數據集上,結合 ResNet、VGG、MobileNet 等多種模型進行了系統評估。

      1. 有效性

      在不同數據集和模型架構下,PIL 生成的不可學習樣本均能顯著降低模型的測試準確率,在部分設置中準確率接近隨機水平。



      表 2:在干凈數據集(Dc)與 PIL 構建的不可學習數據集(Du)上訓練的模型在干凈數據上的測試準確率(%)對比

      2. 計算效率

      在 CIFAR-10 上,PIL 生成擾動僅需 40.53 秒,而 REM 方法需要超過 54k 秒,效率提升超過三個數量級。同時,PIL 在效率與防護效果之間取得了較好的平衡。



      表 3:不同方法為 CIFAR-10 訓練集構建全部擾動所需的時間對比

      3. 魯棒性

      在多種數據增強策略(旋轉、裁剪、MixUp)和不同 JPEG 壓縮質量下,PIL 依然保持穩定的防護性能。



      表 4:不同數據增強策略下,各類不可學習樣本在 CIFAR-10 上的干凈測試準確率(%)。結果越接近 10% 越好。灰色背景標示 Top-2 的兩種方法。



      表 5:在不同 JPEG 壓縮質量下,各類不可學習樣本在 CIFAR-10 上的干凈測試準確率(%)。結果越接近 10% 越好。灰色背景標示 Top-2 的兩種方法。

      4. 線性化驗證

      我們使用 FGSM 攻擊下的準確率下降幅度作為線性化指標。實驗表明,隨著 PIL 擾動比例增加,模型對 FGSM 的敏感性顯著增強,驗證了 PIL 確實誘導了模型的線性行為。



      表 6:使用不同干凈 / PIL 擾動數據混合比例訓練的 ResNet-18 模型,在各 FGSM 攻擊步長下的測試準確率及下降幅度(%)

      進一步分析:

      部分擾動設置下的性能退化受限

      在實驗中我們觀察到一個一致現象:當僅有部分訓練數據被擾動時,模型的測試準確率往往不會出現顯著下降。這一現象并非 PIL 方法特有,而是現有不可學習樣本方法普遍存在的特性。

      為解釋該現象,我們通過實驗發現模型對被擾動樣本產生的梯度與對干凈樣本的梯度呈現很強的正交性,于是我們提出在梯度正交假設,并在該假設下進行了理論分析,得到如下結論:

      • 干凈樣本與擾動樣本在訓練過程中所產生的梯度方向近似正交,因此擾動樣本對應的梯度更新難以顯著干擾模型對干凈樣本的學習;
      • 在混合訓練設置下,模型的泛化性能主要由干凈數據主導,只要干凈樣本數量足夠,模型仍能學習到穩定且可泛化的特征表示。



      圖 2:在部分擾動場景下,CIFAR-10 數據集的干凈測試準確率(%)

      上述分析表明,部分擾動并不足以從根本上削弱模型的泛化能力。這一定性結論對于實際應用具有直接啟示意義:若期望獲得穩定且顯著的防護效果,需要對數據集進行大比例甚至全部的擾動,或至少保證擾動樣本在訓練數據中占據足夠高的比例(通常高于 80%)。

      結語

      PIL 的核心在于從機制層面重新審視不可學習樣本問題,將關注點從復雜的代理模型與攻擊策略,轉向「模型線性化」這一關鍵因素。通過使用線性代理模型,PIL 在顯著降低計算成本的同時,依然保持了穩定而有效的防護能力。

      我們希望這一視角能夠為不可學習樣本及相關數據保護研究提供新的思路,并推動更加高效、可擴展的方法設計。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      母嬰品牌Babycare回應“被檢出重金屬銻”:傳言不實,已報案

      母嬰品牌Babycare回應“被檢出重金屬銻”:傳言不實,已報案

      紅星新聞
      2026-04-11 15:34:31
      寶馬“炮轟”比亞迪:不是我們做不到閃充,是不愿犧牲電池耐用性

      寶馬“炮轟”比亞迪:不是我們做不到閃充,是不愿犧牲電池耐用性

      混沌錄
      2026-04-10 22:53:05
      解鎖單賽季2000分最高齡紀錄!杜蘭特:詹姆斯不在榜單上嗎?

      解鎖單賽季2000分最高齡紀錄!杜蘭特:詹姆斯不在榜單上嗎?

      北青網-北京青年報
      2026-04-11 15:44:18
      道士給弟子教針灸被認定非法行醫,累計收到10萬罰單,算不算“小過重罰”?衛健局:已是最低處罰標準

      道士給弟子教針灸被認定非法行醫,累計收到10萬罰單,算不算“小過重罰”?衛健局:已是最低處罰標準

      大風新聞
      2026-04-10 19:30:03
      誰還記得樟木頭?83萬人次的“終點站”,是那個年代打工人的噩夢

      誰還記得樟木頭?83萬人次的“終點站”,是那個年代打工人的噩夢

      匹夫來搞笑
      2026-04-12 03:28:28
      美伊停火內幕曝光!巴官員:中國本不愿擔保,經巴方勸說才出面

      美伊停火內幕曝光!巴官員:中國本不愿擔保,經巴方勸說才出面

      書寫傳奇
      2026-04-11 15:48:39
      4月11日俄烏最新:俄羅斯的關鍵條件

      4月11日俄烏最新:俄羅斯的關鍵條件

      西樓飲月
      2026-04-11 21:42:50
      什么事讓你瞬間感到毛骨悚然?網友:從此再沒見過她老公發脾氣

      什么事讓你瞬間感到毛骨悚然?網友:從此再沒見過她老公發脾氣

      另子維愛讀史
      2026-03-10 23:08:46
      美以伊爆發沖突以來,為何哈馬斯幾乎保持沉默?

      美以伊爆發沖突以來,為何哈馬斯幾乎保持沉默?

      人生錄
      2026-04-10 21:38:01
      斯諾克戰報!4場10-2,決勝輪已出8席,中國4人晉級,周躍龍大捷

      斯諾克戰報!4場10-2,決勝輪已出8席,中國4人晉級,周躍龍大捷

      劉姚堯的文字城堡
      2026-04-12 07:39:28
      中超本賽季下課第一人預測!坐擁豪華陣容卻連戰連敗,急需爆發

      中超本賽季下課第一人預測!坐擁豪華陣容卻連戰連敗,急需爆發

      振剛說足球
      2026-04-11 10:45:03
      山西49歲局長在辦突發疾病搶救無效離世,小兒子今年6月參加高考,妻子稱丈夫常加班到凌晨兩三點,出事前還接了幾個工作電話

      山西49歲局長在辦突發疾病搶救無效離世,小兒子今年6月參加高考,妻子稱丈夫常加班到凌晨兩三點,出事前還接了幾個工作電話

      極目新聞
      2026-04-11 16:04:10
      瑜伽褲外穿引發爭議,穿著不當或致尷尬局面

      瑜伽褲外穿引發爭議,穿著不當或致尷尬局面

      特約前排觀眾
      2026-03-24 00:15:04
      陳獨秀晚年感慨:我一生最后悔的,不是選錯路,而是忘了看看腳下

      陳獨秀晚年感慨:我一生最后悔的,不是選錯路,而是忘了看看腳下

      曉張說
      2026-04-12 07:05:26
      職稱倒查30年,有問題的正高、副高,追繳不正當待遇追究法律責任

      職稱倒查30年,有問題的正高、副高,追繳不正當待遇追究法律責任

      馬蹄燙嘴說美食
      2026-04-11 13:09:52
      陳麗華年輕照出烏龍:美女照片主人出來辟謠,真實年輕照像韓紅

      陳麗華年輕照出烏龍:美女照片主人出來辟謠,真實年輕照像韓紅

      動物奇奇怪怪
      2026-04-11 15:25:19
      剛從蒙古國回來,說點不中聽的:蒙古國真實面目,可能讓你很意外

      剛從蒙古國回來,說點不中聽的:蒙古國真實面目,可能讓你很意外

      復轉這些年
      2026-04-06 22:24:11
      住院時兒媳全程陪護,出院當天女兒拿來文件:爸,你看看這個

      住院時兒媳全程陪護,出院當天女兒拿來文件:爸,你看看這個

      紙鳶奇譚
      2026-03-31 10:40:50
      網上賣的大流量手機套餐,為啥運營商APP里沒有?

      網上賣的大流量手機套餐,為啥運營商APP里沒有?

      TMT流程審計
      2026-04-11 22:52:18
      國青核心李沂澤年齡存疑引熱議!媒體人:去年有教練跟我說過這事

      國青核心李沂澤年齡存疑引熱議!媒體人:去年有教練跟我說過這事

      狼叔評論
      2026-04-11 23:32:08
      2026-04-12 09:11:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12729文章數 142623關注度
      往期回顧 全部

      科技要聞

      半夜被燃燒瓶砸醒,OpenAI CEO發文反思

      頭條要聞

      男子自帶茅臺就餐飲用時感覺不對味 服務員還"消失"了

      頭條要聞

      男子自帶茅臺就餐飲用時感覺不對味 服務員還"消失"了

      體育要聞

      換帥之后,他們從降級區沖到升級區

      娛樂要聞

      鄭鈞回應兒子走路:會監督他挺直腰板

      財經要聞

      從日本翻身看:這次誰能扛住高油價?

      汽車要聞

      煥新極氪007/007GT上市 限時19.39萬起

      態度原創

      游戲
      健康
      家居
      房產
      手機

      《永劫》女解說被批“穿著暴露” 官方解決方案來了

      干細胞抗衰4大誤區,90%的人都中招

      家居要聞

      復古風格 自然簡約

      房產要聞

      土地供應突然暴跌!2026海口樓市,格局大變!

      手機要聞

      榮耀最強數字旗艦來了!榮耀600 Pro真機揭曉

      無障礙瀏覽 進入關懷版