快科技2月15日消息,近日,谷歌官方披露其旗艦AI模型Gemini正遭遇商業化驅動的大規模蒸餾攻擊——通過重復提問誘導聊天機器人泄露內部機制。
谷歌稱,攻擊者通過系統地、反復地向模型發送精心設計的提示詞(單次攻擊超10萬次),試圖逆向工程Gemini的內部推理邏輯與決策機制,以實現模型克隆或強化自身AI系統的目的。
這些攻擊主要由"商業動機行為者"發起,谷歌判斷其幕后人員多為希望獲得競爭優勢的AI私企或研究機構,公司發言人表示,此次攻擊源來自全球多個地區,但并未透露更多信息。
據悉,蒸餾攻擊(也稱知識蒸餾)原本是一種模型壓縮技術,通過將大型"教師模型"的知識遷移到小型"學生模型"中,實現模型輕量化。
攻擊者通過系統化、結構化的海量提問,收集模型在不同場景下的響應,分析響應的內容、延遲、置信度等細微差異,構建Gemini的決策邊界與推理路徑圖譜,最終用收集到的響應數據訓練自己的"學生模型",復制Gemini的核心能力。
谷歌稱,此類蒸餾攻擊屬于知識產權盜竊,盡管各大廠商已部署能夠識別與阻斷蒸餾攻擊的機制,但由于主流大模型服務面向所有人開放,所以其本質上仍易受攻擊。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.