關鍵詞
安全漏洞
![]()
EchoGram 漏洞揭示主流大模型安全體系正在面臨一場結構性的挑戰。HiddenLayer 在 2025 年初披露的研究指出,GPT 系列 Claude 以及 Gemini 等主流模型所依賴的防護機制存在先天缺口。問題的核心在于當前大模型普遍采用的兩類安全策略即 LLM 審核模型與分類模型均承擔著對用戶請求進行價值判斷的任務,而這兩類模型的訓練方式決定了它們對異常符號組合的敏感性極低。
EchoGram 的原理是利用訓練數據中的詞匯分布漏洞構造特定的稀缺詞序或符號片段即研究團隊稱為 flip token 的結構。這類 token 通常毫無含義但正因其罕見或未被訓練系統充分認知便能在不影響實際語義的前提下改變防護系統的判定結論。攻擊者只需在原始指令后附加一個 flip token 便可能使防護系統將惡意指令判定為安全或反過來將正常請求誤判為高危示例中僅加上一個看似隨機的字符串就足以使舊版本的防護系統完全失效。
![]()
這種機制導致的風險遠超傳統繞過技術。它不僅能讓真正的惡意請求悄無聲息地穿透安全邊界還能夠人為制造極高的誤報率。當安全審查系統在高頻誤判中陷入噪聲環境安全團隊將難以保持對告警的信任度最終形成研究者所稱的告警疲勞這將直接削弱企業級 AI 部署的整體安全策略。
研究團隊強調多個 flip token 組合使用能夠進一步放大攻擊效果且防御窗口極為有限開發者大約只有數個月時間來完成模型與訓練策略的修補包括豐富訓練語料平衡罕見序列分布以及構建更穩健的多層判決體系。隨著大模型快速進入金融醫療與公共服務場景這類結構性安全漏洞一旦未被及時修復將對行業帶來深遠影響。

安全圈

網羅圈內熱點 專注網絡安全
實時資訊一手掌握!
好看你就分享 有用就點個贊
支持「安全圈」就點個三連吧!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.