<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      對抗樣本攻擊詳解:如何讓AI模型產生錯誤判斷

      0
      分享至

      精心構造的輸入樣本能讓機器學習模型產生錯誤判斷,這些樣本與正常數據的差異微小到人眼無法察覺,卻能讓模型以極高置信度輸出錯誤預測。這類特殊構造的輸入在學術界被稱為對抗樣本(adversarial examples)。

      模型將右側圖像判定為長臂猿,置信度高達99.3%。

      人眼看不出這兩張熊貓圖像有任何區別,而模型對左圖的預測是熊貓,置信度57.7%顯得不太確定。中間那張看起來像噪聲的圖案其實是經過精心設計的擾動掩碼,將其乘以一個很小的系數0.007后疊加到原圖上。肉眼完全察覺不到變化,但卻可以讓模型以99.3%的置信度認定右圖是長臂貓的圖像。

      這個現象說明模型并未真正理解圖像的本質結構。模型構建的是一種內部表征來描述自然圖像,但分布外的數據點就能輕易突破這種表征的局限。

      2014年Christian Szegedy做過一個有趣的實驗:他從CIFAR-10數據集選了幾張圖片,試圖用反向傳播把它們逐步轉換成飛機,想觀察圖像是如何一步步接近飛機的樣子。



      結果的圖像幾乎沒什么變化,但右下角這張在視覺上依然是輛車的圖片,模型卻近乎百分百確信它是架飛機。

      視覺模型的輸入維度通常很高,每個像素的微小改變累積起來會在表征向量中產生顯著變化,用L?范數可以直觀看出這種累積效應。

      幾乎所有機器學習模型都存在對抗攻擊的脆弱性:邏輯回歸、softmax回歸、支持向量機這類線性模型特別容易被精心設計的樣本誤導;相比之下徑向基函數(RBF)這種高度非線性的模型抵抗力要強一些。

      多數機器學習模型的線性特性恰恰為生成對抗樣本做了最好的理論鋪墊,RNN和LSTM用加法操作來捕捉時序數據的流動,加法本質上是線性的;而ReLU、maxout這些激活函數讓深度神經網絡的輸入輸出關系呈現分段線性特征。

      進一步看這個過程:



      像素空間里的擾動雖小,但經過權重矩陣的放大在嵌入空間產生的效應就明顯了,嵌入空間的變化量取決于權重向量與擾動向量的點積。

      要讓這個點積最大化,就得沿著特定方向移動,或者準確說是沿著權重向量的符號方向。

      快速梯度符號法(FGSM)

      優化函數可以這樣定義,把損失函數改寫成泰勒級數的一階展開形式:



      為什么要最大化損失?因為我們的目標是欺騙模型,所以要反著優化的方向走,ε sign()給出了能產生最大更新的方向。

      為什么用最大范數而不是別的范數?因為我們的目的是稍微改變輸入,并且要控制在人能夠感知閾值之下。最大范數讓擾動的控制變得精確,這跟真實傳感器的情況比較接近。

      將最大范數約束在ε以內,就能保證改變幅度不被肉眼發現。這就是快速梯度符號法(Fast Gradient Sign Method, FGSM)的核心思路:利用梯度的符號信息來確定移動方向。

      FGSM的可視化分析

      畫出數據點周圍的決策邊界能直觀展示FGSM的工作機制。



      假設沿著FGSM方向和它的正交方向移動,移動范圍限制在ε最大范數邊界內,用這兩個向量把決策空間切成一個二維子空間。

      取幾個數據點把它們周圍的決策邊界畫出來,白色區域代表正確類別,有色區域對應錯誤標簽。



      沿FGSM方向移動會進入錯誤標簽的區域。然后加入隨機噪聲相當于往隨機方向移動:





      隨機方向的移動并不改變數據點的類別歸屬,這證明了一點:對抗樣本不等于隨機噪聲

      對抗子空間的維度是可以計算的,它表示能用來生成對抗樣本的正交方向數量。這些向量和梯度向量之間有較大的點積。



      平均下來這些子空間大約有25個正交向量。

      目標類別的一步攻擊

      另一種思路是直接最大化某個特定目標類別的概率:讓輸入朝著能夠最小化目標標簽損失的方向移動。換句話說就是強迫模型認為損失最小的標簽就是目標標簽,從而輸出這個標簽。

      更新規則寫成這樣:



      MNIST數據集上的實驗

      訓練一個模型來區分MNIST數據集里的數字3和7。



      這是個單層權重的簡單線性分類器,權重本身就可以當作梯度用。接下來取權重的符號。



      這些權重決定了分類結果。把權重的符號加到樣本上或者從樣本中減去。



      人眼能輕松過濾掉這些圖像的背景噪聲,但模型會認真對待每一個權重。權重為正時輸出7,權重為負時輸出3。這些生成的對抗樣本徹底瓦解了分類器的判別能力。

      對抗樣本的遷移性

      機器學習追求的是模型在不同數據集上都能保持穩定表現,這要求模型權重具備泛化能力。既然權重要泛化那基于這些權重生成的對抗樣本自然也會泛化。



      不同數據集應該產生相似的權重分布,可以量化模型間的遷移能力:



      SVM依賴數據特性所以用一個SVM生成的對抗樣本很容易攻擊另一個SVM,而邏輯回歸生成的對抗樣本有87.42%的概率能欺騙決策樹。

      作為攻擊者,如果不清楚目標模型的具體架構,可以用模型集成的方式來生成對抗樣本。就算拿不到模型的訓練數據標簽,也能利用模型的輸出來構造對抗樣本。

      有意思的是,人腦也會遭遇類似的"對抗攻擊"。下面這個例子挺經典:



      這些其實是同心圓,但因為方塊的排列方向大腦會把它們解讀成螺旋。

      對抗訓練提升泛化性

      用對抗樣本訓練深度神經網絡能起到正則化的作用,還能改善性能。



      對抗訓練確實能提升DNN的表現,損失函數可以重新表述成這種形式:



      不過嚴格的線性模型用對抗樣本訓練不會有什么改進。還可以修改損失函數,給對抗樣本分配更高的權重:



      需要明確一點,這些做法都是在和對抗攻擊做斗爭。要降低對抗攻擊的成功率,需要強大的優化算法配合嚴格的非線性模型架構。

      參考文獻

      Goodfellow, I. J., Shlens, J., & Szegedy, C. (2014). Explaining and Harnessing Adversarial Examples.ArXiv. /abs/1412.6572

      Goodfellow, I. J., Mirza, M., Xu, B., Ozair, S., Courville, A., & Bengio, Y. (2014). Generative Adversarial Networks.ArXiv. /abs/1406.2661

      Tramèr, F., Papernot, N., Goodfellow, I., Boneh, D., & McDaniel, P. (2017). The Space of Transferable Adversarial Examples.ArXiv. /abs/1704.03453

      https://avoid.overfit.cn/post/815495f184a049389d702becdb972067

      作者:Kavishka Abeywardana

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      美媒感慨:若不是中國還在反抗特朗普,幾乎全世界都向他投降了

      美媒感慨:若不是中國還在反抗特朗普,幾乎全世界都向他投降了

      悅心知足
      2026-02-21 23:03:46
      范元甄:與江青齊名的延安四美之一,嫁主席秘書,卻輸掉了一生

      范元甄:與江青齊名的延安四美之一,嫁主席秘書,卻輸掉了一生

      干史人
      2026-03-05 21:06:35
      “新任指揮官瓦希迪:伊朗革命衛隊的‘冷酷無情’時代來臨!”

      “新任指揮官瓦希迪:伊朗革命衛隊的‘冷酷無情’時代來臨!”

      世界探索者探索
      2026-03-07 15:29:39
      頭號援軍到位,伊朗強勢表態!特朗普做一項決定,臺當局陷入絕望

      頭號援軍到位,伊朗強勢表態!特朗普做一項決定,臺當局陷入絕望

      野史日記
      2026-03-06 13:50:03
      身邊毀三觀的八卦,太炸裂了!不準備兩斤瓜子出不來!

      身邊毀三觀的八卦,太炸裂了!不準備兩斤瓜子出不來!

      另子維愛讀史
      2026-01-24 20:54:02
      倪萍看望漸凍癥終末期的蔡磊,稱看到蔡磊的狀態非常鼓舞自己

      倪萍看望漸凍癥終末期的蔡磊,稱看到蔡磊的狀態非常鼓舞自己

      大象新聞
      2026-03-07 14:39:03
      馬刺29分超級逆轉,小卡空砍30+9!福克斯立功,文班亞馬是頭怪獸

      馬刺29分超級逆轉,小卡空砍30+9!福克斯立功,文班亞馬是頭怪獸

      毒舌NBA
      2026-03-07 13:05:00
      新娘臨時要10萬下車費,新郎去取錢卻未歸,新娘趕到婆家瞬間淚目

      新娘臨時要10萬下車費,新郎去取錢卻未歸,新娘趕到婆家瞬間淚目

      千秋歷史
      2026-02-02 20:23:42
      前國腳:梅西并不是公認的球王,個人能力獨一無二,沒有超過C羅

      前國腳:梅西并不是公認的球王,個人能力獨一無二,沒有超過C羅

      夏侯看英超
      2026-03-06 21:05:17
      阿里天才少年出走,硅谷大佬砸重金搶人

      阿里天才少年出走,硅谷大佬砸重金搶人

      大佬灼見
      2026-03-06 16:20:57
      女流直播突然孩子哭鬧,被迫過去“墊一口”,網友:不行下播吧

      女流直播突然孩子哭鬧,被迫過去“墊一口”,網友:不行下播吧

      相思賦予誰a
      2026-03-05 16:09:12
      西方觀察家認為:這次的美伊以沖突會導致永久改寫臺海戰爭的規則

      西方觀察家認為:這次的美伊以沖突會導致永久改寫臺海戰爭的規則

      阿七說史
      2026-03-05 15:43:01
      岳父跟我9年,除夕夜大舅哥來接,臨走時岳父悄悄說:晚點來接我

      岳父跟我9年,除夕夜大舅哥來接,臨走時岳父悄悄說:晚點來接我

      朗威談星座
      2026-03-07 15:21:53
      陳飛宇在巴黎吃麻辣燙被偶遇!衣服破了個大洞,網友:我眼花了?

      陳飛宇在巴黎吃麻辣燙被偶遇!衣服破了個大洞,網友:我眼花了?

      木子愛娛樂大號
      2026-03-06 16:45:32
      隨著巴黎圣日耳曼爆冷1-3轟然倒下,法甲最新積分榜出爐

      隨著巴黎圣日耳曼爆冷1-3轟然倒下,法甲最新積分榜出爐

      側身凌空斬
      2026-03-07 06:34:39
      韓國網友瘋狂稱贊中國電影《731》配日文字幕上線YouTube!

      韓國網友瘋狂稱贊中國電影《731》配日文字幕上線YouTube!

      奮斗在韓國
      2026-03-05 13:52:04
      中國女籃戰捷克,直播頻道有變,張子宇對比劉禹彤,差距顯而易見

      中國女籃戰捷克,直播頻道有變,張子宇對比劉禹彤,差距顯而易見

      體育大學僧
      2026-03-07 11:40:15
      官方:皇馬與阿聯酋航空續約至2031年;據悉價值每年7400萬歐

      官方:皇馬與阿聯酋航空續約至2031年;據悉價值每年7400萬歐

      懂球帝
      2026-03-07 14:11:07
      F35輕松擊落伊朗戰機!看完五代機實戰發現,難怪中國殲20不出口

      F35輕松擊落伊朗戰機!看完五代機實戰發現,難怪中國殲20不出口

      黑鷹觀軍事
      2026-03-06 17:13:39
      名場面!烏克蘭大使公開拒吊唁伊朗高層,字字戳心撕破偽善面具

      名場面!烏克蘭大使公開拒吊唁伊朗高層,字字戳心撕破偽善面具

      老馬拉車莫少裝
      2026-03-06 13:45:05
      2026-03-07 17:07:00
      deephub incentive-icons
      deephub
      CV NLP和數據挖掘知識
      1940文章數 1456關注度
      往期回顧 全部

      科技要聞

      OpenClaw爆火,六位"養蝦人"自述與AI共生

      頭條要聞

      伊朗總統:絕不可能無條件投降 向鄰國表示歉意

      頭條要聞

      伊朗總統:絕不可能無條件投降 向鄰國表示歉意

      體育要聞

      塔圖姆298天走完這段路 只用27分鐘征服這座城

      娛樂要聞

      周杰倫田馥甄的“JH戀” 被扒得底朝天

      財經要聞

      針對"不敢休、不讓休"怪圈 國家出手了

      汽車要聞

      逃離ICU,上汽通用“止血”企穩

      態度原創

      手機
      藝術
      數碼
      家居
      旅游

      手機要聞

      vivo X300 Max手機原型曝光:預估6.78英寸屏幕、7000mAh電池

      藝術要聞

      Mark Grantham | 城市街景

      數碼要聞

      AI存儲需求進一步增長,三星NAND閃存被曝Q2將繼續漲價

      家居要聞

      暖棕撞色 輕法奶油風

      旅游要聞

      警報聲中的歸途:一個義烏老板娘的中東“驚魂”之旅

      無障礙瀏覽 進入關懷版