<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      對話鄧智航|以「龍蝦」為起點,起底從單個 Agent 到 Agentic Web 的安全重構

      0
      分享至


      大數據文文摘受權轉載自AI科技評論

      作者丨鄭佳美

      編輯丨岑 峰

      OpenClaw 的爆火,讓一個原本更多停留在技術圈內部的變化,突然變得具象起來。

      當一個 Agent 可以跨應用執行任務、調用工具、在幾乎沒有人工干預的情況下完成復雜流程時,人們第一次直觀地看到:AI 正在從“生成內容的工具”,轉變為“參與行動的主體”。也正是在這一刻,安全問題迅速被推到前臺。

      但一個更值得注意的現象是,在幾乎所有關于 Agent 安全的討論中,問題的定義仍然高度集中在模型層面:輸入是否被注入、輸出是否越界、對齊是否失效。這種討論路徑本身并沒有錯,但它隱含著一個前提,即安全問題主要發生在“模型”這一單點之上。

      問題在于,這個前提可能正在失效。當 Agent 不再只是響應指令,而是持續接收來自不同來源的信息、在多組件結構中做出決策、并通過工具鏈將決策轉化為現實動作時,“安全”所指向的對象,已經不再是單一模型,而是一個由模型、記憶、工具、環境以及交互鏈路共同構成的系統。

      在這樣的系統中,風險不一定以“錯誤輸出”的形式出現,也不一定以“瞬時失控”的方式爆發。它可能表現為決策過程中的偏移、信息在鏈路中的傳遞與放大,甚至是跨組件、跨主體之間的相互影響。

      這也意味著,Agent 安全的問題,正在從“是否安全”,轉向“如何被影響”。

      在論文《From Secure Agentic AI to Secure Agentic Web》中,上海交通大學、上海創智學院張偉楠團隊正是從這一轉變出發,嘗試將 Agent 安全從模型層面的魯棒性問題,重新置于系統結構與運行機制之中進行討論。

      圍繞這一問題,AI 科技評論與論文一作鄧智航進行了對話。下文在不改變原意的前提下,對訪談內容進行了整理與呈現,試圖還原其對于 Agent 安全問題“從模型走向系統”的整體理解。


      論文鏈接:https://arxiv.org/pdf/2603.01564

      Agent 安全,被理解錯了嗎?

      AI 科技評論:最近 OpenClaw 的爆火,讓很多人開始關注 Agent 安全,但你會發現大家討論的重點幾乎都集中在 prompt injection、越獄這些問題上,你是怎么看待這種觀點的?

      鄧智航:我認為這其實是目前一個非常普遍的誤解。現在大多數人在談 Agent 安全的時候,還是停留在 prompt injection、越獄這些比較“表層”的問題上,本質上仍然是在關注模型輸出這一層。

      但實際上,Agent 已經不再是一個只生成文本的系統了。過去的 chatbot,本質上就是輸入一段文本、輸出一段文本,而現在的 Agent 會調用工具,會寫入長期記憶,還會持續和外部環境進行交互。

      在這種情況下,安全問題的重心必須發生轉變,也就是要從“模型會不會說話”,轉向“整個系統在開放環境中是否可控、可審計、可約束”。我認為這是目前最重要的一個視角變化。

      AI 科技評論:也就是說,它的風險已經不只是“說錯話”,而是會真正影響現實世界?

      鄧智航:可以這么理解。因為 Agent 現在具備調用工具和操作外部系統的能力,它的行為已經不再局限在生成內容這一層,而是可以直接轉化為現實中的動作。比如它可以刪除你的文件,可以泄露你的隱私,甚至可以在獲取到一些敏感信息之后,調用郵件系統自動發送給攻擊者。所以現在的問題不只是“生成是否安全”,而是它在執行層面是否安全,這個變化是非常本質的。

      AI 科技評論:如果必須選一個關鍵因素,你覺得這種變化是由什么驅動的?很多人會說是工具調用。

      鄧智航:工具調用確實是一個重要因素,但如果只能選一個更核心的點,我認為是 Agent 在開放環境中的自主行動能力。工具調用本質上只是能力的一個接口,它讓 Agent 可以做更多事情,但真正讓安全問題發生質變的,是 Agent 開始在一個動態、復雜,甚至帶有對抗性的環境中進行感知、判斷和執行。

      比如網頁中的內容、文檔中的信息、第三方服務返回的數據,這些都會進入 Agent 的決策流程,從而共同構成一個更大的風險面。所以關鍵不只是“能不能調用工具”,而是“在什么環境中行動,以及如何行動”。

      AI 科技評論:在你們的論文中把威脅分成 prompt、environment、memory、toolchain 等不同類別,這種分類背后的共性是什么?

      鄧智航:如果從攻擊者的角度來看,其實這些攻擊有一個非常統一的本質,那就是爭奪對 Agent 的決策控制權。無論是 prompt 攻擊、環境注入、記憶投毒,還是工具鏈上的問題,它們表面上發生在不同模塊,但本質上都是在影響 Agent 的理解能力和認知過程。

      所以安全問題的核心,并不是某個漏洞被觸發,而是 Agent 在看似正常的情況下,被悄悄帶偏了。這種“控制權的轉移”,是我認為最關鍵的共性。

      AI 科技評論:你剛剛提到環境,那是不是可以理解為,外部世界本身就是 Agent 的輸入?

      鄧智航:是的,這個理解是對的。對于人來說,網頁主要是用來閱讀和判斷信息的,但對于 Agent 來說,它通常不會像人一樣去做復雜判斷,而是會把網頁、文件以及工具返回的內容直接作為輸入,用來影響它的任務規劃和行為決策。

      所以從系統安全的角度來看,我們需要把整個外部環境都視為潛在的攻擊面,也就是說默認它可能是帶有惡意意圖的,而不是默認它是可信的。

      AI 科技評論:如果有人認為,通過 system prompt 和拒答機制,已經可以解決大部分問題,你會怎么回應?

      鄧智航:我覺得這是遠遠不夠的。首先,system prompt 本身就可能被篡改或者被攻擊,其次,很多攻擊并不是通過用戶正面輸入進入系統的,而是來自網頁內容、工具返回,甚至是跨 Agent 的通信。

      所以 system prompt 和拒答機制更多只是第一層護欄,它們很重要,但無法覆蓋整個 Agent 系統的攻擊面。真正可靠的安全方案,需要把工具權限控制、運行時監控、協議級校驗以及持續的紅隊測試結合起來,從而形成一個更完整的安全體系,本質上這是一個生態級的問題。

      AI 科技評論:在你們的論文中把 toolchain 風險類比為供應鏈問題,這個你會怎么解釋?

      鄧智航:這個類比是比較直觀的。風險不一定來自模型本身,也可能來自它依賴的第三方工具、API 或插件。比如一個被污染的工具提供方,一個返回結果不可靠的接口,或者多個看起來安全的工具在組合調用時產生聯動,這些都可能導致嚴重的后果。所以在 Agent 系統中,工具鏈其實就相當于一個供應鏈,而安全問題也就變成了供應鏈安全問題。

      AI 科技評論:那像 MCP 這種統一工具調用方式,一方面提升能力,一方面是否也在放大風險?

      鄧智航:是的,這種雙重性是非常明顯的。一方面,MCP 提供了統一的上下文和工具交互方式,使得不同系統之間可以更方便地協作,這確實大幅提升了 Agent 的能力。但另一方面,它作為一個統一入口,也會把權限問題、信任問題以及潛在的污染風險集中放大。

      所以關鍵不在于要不要使用 MCP,而在于在使用這些能力的同時,是否同步設計了相應的安全機制。本質上,能力越強,對應的風險面就越大。

      AI 科技評論:現在圍繞 Agent 安全的討論很多,你覺得哪些風險被高估了,哪些被低估了?

      鄧智航:被高估的,主要是那些容易被發現的風險,比如單輪越獄或者即時攻破,這類問題因為比較直觀,所以更容易被關注。但被低估的,是一些更接近真實部署場景的問題,比如長期記憶污染、Agent 之間的傳播效應,以及行為偏移。這些問題通常不會立刻爆發,也不容易被察覺,但會在長期過程中持續影響 Agent 的行為。

      一個更“聰明”的攻擊,不會讓 Agent 當場失控,而是會慢慢改變它的偏好、信任對象和決策傾向,讓它在很多看似正常的決策中逐漸偏移。我認為這種風險是更值得警惕的。

      問題,不再發生在一個 Agent 上

      AI 科技評論:如果 Agent 之間形成網絡,會帶來什么新的變化?

      鄧智航:一個很重要的變化是,我們原來在互聯網中有一個默認前提,就是請求的另一端大概率是人,很多信任關系是建立在這個隱含假設之上的。但在 Agentic Web 中,這個前提被打破了,因為請求很可能來自另一個 Agent,甚至是多層 Agent 的委托和自動決策。

      這就意味著,原來依賴常識建立的信任關系已經不成立了,必須轉變為顯式表達,并且需要具備可驗證、可審計和可追蹤的能力。

      AI 科技評論:這是不是也意味著,一旦出問題,會很難追溯責任?

      鄧智航:是的,這是一個非常現實的問題。如果是人說錯話,我們可以直接找到這個人,但如果是 Agent 出現問題,我們很難判斷它是自己判斷錯誤,還是被其他 Agent 誤導,或者是某個中間環節被污染。

      在這種情況下,就需要一整套審計和追溯機制,否則就會變成需要一層一層往上追,這個過程是非常困難的,有點類似于追查資金來源的鏈條。

      AI 科技評論:那會不會出現一種攻擊,不是立刻出問題,而是長期潛伏?

      鄧智航:我認為這種情況是非常可能的,而且概率很高。一個更成熟的攻擊方式,不會馬上制造一個可以被發現的事故,而是會悄悄改變 Agent 的偏好、信任對象以及行為傾向,讓它在很多看似正常的微小決策中持續偏移。相比那種瞬間失控,這種長期的行為漂移其實更危險,因為它更隱蔽,也更難被檢測。

      AI 科技評論:那能力和安全之間的矛盾應該怎么處理?

      鄧智航:這是一個不可避免的張力。Agent 的能力越強,它可以訪問的上下文越多、可以調用的工具越多,自主性也越高,但相應的風險也會增加。如果把權限收緊,它的能力又會受到限制。

      所以問題不在于能不能消除這種張力,而在于能不能把它設計成一個可控的系統,比如通過分級授權、實時監測以及事后追溯等機制,把這種張力轉化為一個可以被管理的狀態。

      AI 科技評論:你覺得未來兩三年,Agent 安全的分水嶺會出現在哪里?

      鄧智航:我認為關鍵在于,整個行業能不能把身份、授權、溯源以及運行時治理這些能力真正做成基礎設施。如果這些基礎設施建立起來,Agent 才有可能從“能用但危險”,走向“可擴展且可治理”。

      如果只是依賴 prompt 工程或者局部的補丁式防御,一旦 Agent 大規模進入開放網絡,這種方式是無法支撐的。

      AI 科技評論:那這種“安全基礎設施”,你覺得可能會以什么形式出現?

      鄧智航:具體形式還需要行業去探索,但可以做一個類比。兩年前沒有 MCP 的時候,大家的工具調用方式是完全不統一的,不同系統之間也很難互通。但 MCP 出現之后,通過統一協議,工具調用這一層被標準化,Agent 的能力也因此提升。

      未來的安全機制,也有可能以類似“協議”的形式出現,通過統一的安全協議,讓整個 Agent 生態在運行過程中更安全。

      GPU 訓練特惠!

      H100/H200 GPU算力按秒計費,平均節省開支30%以上!

      掃碼了解詳情?

      點「贊」的人都變好看了哦!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      250萬賠償不算啥?官方介入,崔麗麗事件“創先河”,釋放3大信號

      250萬賠償不算啥?官方介入,崔麗麗事件“創先河”,釋放3大信號

      天天熱點見聞
      2026-04-25 06:27:01
      世界羽聯會員大會投票通過“15分制”改革,將于2027年實行

      世界羽聯會員大會投票通過“15分制”改革,將于2027年實行

      懂球帝
      2026-04-25 22:23:26
      拿水貨8號秀換場均22+4!狼隊的救世主,火箭為伊森放棄他太可惜

      拿水貨8號秀換場均22+4!狼隊的救世主,火箭為伊森放棄他太可惜

      你的籃球頻道
      2026-04-26 12:04:53
      特朗普、穆杰塔巴、佩澤希齊揚,同日表態

      特朗普、穆杰塔巴、佩澤希齊揚,同日表態

      極目新聞
      2026-04-26 07:59:00
      俄羅斯的錯誤決不能再犯!攻臺之戰,即使發射一萬枚導彈也不夠用

      俄羅斯的錯誤決不能再犯!攻臺之戰,即使發射一萬枚導彈也不夠用

      尋墨閣
      2026-04-26 08:33:01
      華晨宇哭了損失大了,在云南投資上億拿下地皮,如今緊急叫停

      華晨宇哭了損失大了,在云南投資上億拿下地皮,如今緊急叫停

      以茶帶書
      2026-04-25 16:22:06
      白宮記協晚宴發生槍擊事件 特朗普、萬斯撤離現場畫面曝光

      白宮記協晚宴發生槍擊事件 特朗普、萬斯撤離現場畫面曝光

      新華社
      2026-04-26 13:00:36
      “真假開市客”牽扯出的皮省川,曾被渣打銀行與華潤打假

      “真假開市客”牽扯出的皮省川,曾被渣打銀行與華潤打假

      金融界
      2026-04-25 22:02:49
      特朗普:美國總統是危險職業 不想生活在恐懼之中

      特朗普:美國總統是危險職業 不想生活在恐懼之中

      財聯社
      2026-04-26 12:16:05
      中國最危險的“淀粉崇拜”!不吃米飯哪有力氣?這套農耕廢物邏輯害慘了現代人

      中國最危險的“淀粉崇拜”!不吃米飯哪有力氣?這套農耕廢物邏輯害慘了現代人

      知識圈
      2026-04-25 20:46:53
      南京一派出所副所長為完成查處任務,“設計”讓6名未成年人吸毒再查獲,犯欺騙他人吸毒罪一審被判5年

      南京一派出所副所長為完成查處任務,“設計”讓6名未成年人吸毒再查獲,犯欺騙他人吸毒罪一審被判5年

      大風新聞
      2026-04-25 22:34:13
      2.4億頂薪打沒了!季后賽場均9+8,不像魔獸霍華德,更像小喬丹

      2.4億頂薪打沒了!季后賽場均9+8,不像魔獸霍華德,更像小喬丹

      你的籃球頻道
      2026-04-26 08:17:48
      伊朗政權秋后算賬,絞死更多抗議者

      伊朗政權秋后算賬,絞死更多抗議者

      一種觀點
      2026-04-25 19:08:26
      賴清德被摁住,29國24小時內為臺撐腰,大陸三句話回應

      賴清德被摁住,29國24小時內為臺撐腰,大陸三句話回應

      嘴角上翹
      2026-04-26 03:57:43
      來感受一下黃仁勛的絕望

      來感受一下黃仁勛的絕望

      智先生
      2026-04-25 21:03:53
      車圈最卷的時候,有人開始做減法

      車圈最卷的時候,有人開始做減法

      虎嗅APP
      2026-04-25 16:02:28
      史上最大規模化債,已經開始!一個堅持了30年的信仰,進入倒計時

      史上最大規模化債,已經開始!一個堅持了30年的信仰,進入倒計時

      柏年說政經
      2026-04-25 10:00:08
      被賣緬甸女學生后續:對方同意放人后表示壓力大,又提出無理要求

      被賣緬甸女學生后續:對方同意放人后表示壓力大,又提出無理要求

      青梅侃史啊
      2026-04-25 09:29:26
      心態被打崩了!麥丹上空籃,約基奇跑全場討說法引沖突,前者亮了

      心態被打崩了!麥丹上空籃,約基奇跑全場討說法引沖突,前者亮了

      籃球資訊達人
      2026-04-26 11:40:03
      震驚!東方甄選員工集體辭職要挾俞敏洪,被網友直言“蠢出天際”

      震驚!東方甄選員工集體辭職要挾俞敏洪,被網友直言“蠢出天際”

      火山詩話
      2026-04-26 07:09:07
      2026-04-26 13:51:00
      大數據文摘 incentive-icons
      大數據文摘
      專注大數據,每日有分享!
      6853文章數 94542關注度
      往期回顧 全部

      科技要聞

      漲價浪潮下,DeepSeek推動AI“價格戰”

      頭條要聞

      白宮槍手系教師兼游戲開發者 曾向哈里斯總統競選捐款

      頭條要聞

      白宮槍手系教師兼游戲開發者 曾向哈里斯總統競選捐款

      體育要聞

      那一刻開始,兩支球隊的命運悄然改變了

      娛樂要聞

      《八千里路云和月》大結局意難平

      財經要聞

      DeepSeek V4背后,梁文鋒的轉身

      汽車要聞

      預售19.38萬元起 哈弗猛龍PLUS七座版亮相

      態度原創

      藝術
      旅游
      數碼
      時尚
      游戲

      藝術要聞

      鄭麗文訪問清華附中引發熱議,蔣中正信札字跡真實性遭質疑

      旅游要聞

      春光正好迎假期 文旅消費暖意濃 多元“微度假”體驗解鎖小城引流密碼

      數碼要聞

      同檔最強小平板!OPPO Pad Mini下周首銷:3199元起

      IU的臉,真的有自己的時間線

      《光與影:33號遠征隊》迎來發售一周年紀念

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美熟妇xxxxx| 久久99精品国产99久久6男男| 国产95在线 | 亚洲| 天天干天天日| 亚洲精品字幕| 老熟妇乱子交视频一区| 国产精品视频久久久| 久久国产劲爆∧v内射| 亚洲精品国偷拍自产在线观看| 日韩视频在线免费观看| 天天射影院| 无码av最新无码av专区| 中日av乱码一区二区三区乱码| 中国农村真卖bbwbbw| 成人福利午夜A片| 国模精品视频一区二区| 精久国产av一区二区三区孕妇| 亚洲精品久综合蜜| 国产女主播免费在线观看| 肉大榛一进一出免费视频| 色综合久久一区二区三区 | 制服丝袜无码| 国产精品无码AV| 久久影院一区二区h| 日韩在线播放欧美字幕| 国产成人无码精品一区二区三区| 中文字幕日韩精品人妻| 老熟妇仑乱一区二区视頻| 国产成人无码一区二区在线播放| 午夜福利看片在线观看| jizzjizz欧美| 婷婷色六月| 国产一区二区三区资源在线观看| 日本久久99成人网站| 无码人妻斩一区二区三区| 天堂网在线.www天堂在线资源| 亚洲一区二区三区四区五区六| 日韩欧美tⅴ一中文字暮| 国产超碰无码最新上传| 亚洲天堂高清| 靖州|