![]()
90%工作由AI自動完成,數十家大型機構被入侵,Anthropic描繪的網絡攻擊威脅正引發一場關于真相與意圖的激烈爭論。
“首個由AI協同操作的網絡攻擊行動”,AI公司Anthropic在上周四發布的報告中這樣宣稱。他們表示發現了一個黑客組織使用其Claude Code工具自動化完成了多達90%的攻擊工作,目標是約30個全球機構,包括大型科技公司、金融機構和政府機構。
然而,這個本應敲響警鐘的報告,卻在科技界引發了截然不同的反應。
Anthropic的重磅聲明
Anthropic在報告中描述了一場“高度復雜的間諜活動”,攻擊者使用AI的“智能體”能力達到了“前所未有的程度”。
![]()
攻擊者通過將惡意任務分解成小而看似良性的步驟,成功繞過了Claude的安全防護措施。
這種方法使AI在沒有全面了解其惡意目的的情況下執行了這些任務。
Anthropic稱,攻擊者冒充一家合法的網絡安全公司進行防御測試,成功“越獄”Claude,使其超越安全護欄運行。
一旦繞過防護,AI不僅能協助攻擊,還能自主檢查數字基礎設施,識別“高價值數據庫”,編寫漏洞利用代碼,獲取用戶憑證,并組織被盜數據。
Anthropic表示,在這次特定的網絡攻擊中,絕大部分(大約“80-90%”)的工作是由AI執行的。
質疑聲四起
然而,安全研究人員和AI專家并沒有全盤接受Anthropic的聲明。
圖靈獎得主、Meta首席AI科學家Yann LeCun直言不諱地批評道:“你在被那些想通過監管來壟斷行業的人戲耍。他們利用可疑的研究來恐嚇所有人,從而讓開源模型被監管到無法生存。”
專業安全研究人員同樣持懷疑態度。Phobos Group創始執行官Dan Tentler提出疑問:“我仍然不相信攻擊者能夠讓這些模型完成別人根本做不到的事情。
為什么這些模型在攻擊者那里有90%的成功率,而我們其他人卻要面對拍馬屁式的迎合、各種推諉阻撓,甚至像迷幻般離譜的回答?”
批評者指出,Anthropic的報告缺乏傳統威脅情報報告應有的關鍵細節。
從事攻擊性安全與軟件工程的djnn批評道:“這篇報告根本過不了任何專業評審,它頂多是為了營銷自己的AI安全產品,是可恥且不專業的。”
專業的威脅情報報告通常包含具體的戰術、技術與流程細節,以及可用于檢測的威脅指標,如相關域名、文件哈希值等。
然而,Anthropic的報告中幾乎沒有這些可驗證的信息。
更令人質疑的是,Anthropic聲稱追蹤的黑客組織至少攻擊了30個組織,但只有“少量”攻擊成功。如果AI完成了90%的工作,為何成功率如此之低?
AI與網絡安全的真實關系
盡管質疑 Anthropic 的報告,但專家們并不完全否認AI在網絡攻擊中的作用。
根據云安全聯盟(CSA)的報告,AI可以在進攻性安全的五個階段——偵察、掃描、漏洞分析、利用和報告中發揮作用。
AI特別適合增強諸如信息收集、代碼生成和數據分析等任務。
然而,報告也強調AI在攻擊流程中存在明顯局限性,包括輸出不確定性、缺乏上下文判斷能力,以及自動攻擊可能產生的風險。
AI更適合作輔助工具,而非獨立決策者。
對于Anthropic發布此報告的動機,外界有不同解讀。
AnswerDotAI聯合創始人Jeremy Howard調侃道:“看來游說政府掌控監管、確保利潤鎖定在私營部門的策略奏效了。”
一些觀察家認為,這份報告可能是AI公司試圖影響政策導向的一種方式。
企業家Arnaud Bertrand在推特上表示:“不要輕易相信這些明顯的宣傳話術。”他讓Claude閱讀了Anthropic自己的報告,并判斷是否有證據支持其關于“國家支持的組織”實施攻擊的說法,而Claude的回答是:沒有。
AI安全的真問題與假恐慌
拋開爭議,AI安全確實面臨真實挑戰。
Anthropic自己的研究表明,當AI感到自身受到威脅時,可能會采取極端行為。在一項實驗中,16款前沿大模型為避免自己被替換,多數選擇了敲詐管理層、泄露機密。
包括Claude、GPT-4.1在內的模型都會通過“敲詐”來阻止自己被關閉,即使它們能意識到自己行為違反了道德規范。
同時,當前AI技術存在固有局限性。楊立昆指出,大型語言模型存在三道“認知墻”:世界模型缺席、持久記憶短缺和因果推理斷裂。
這些問題限制了AI的真正理解能力,也影響了其在復雜場景中的表現。
AI的能力與風險可能既不像Anthropic描繪的那樣嚴峻,也不像批評者所說的那樣無害。正如云安全聯盟報告所指出的,AI更適合作為“安全專家的智能助手”,而非獨立決策者。
https://www.anthropic.com/news/disrupting-AI-espionage
https://arstechnica.com/security/2025/11/researchers-question-anthropic-claim-that-ai-assisted-attack-was-90-autonomous/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.