IT之家 3 月 7 日消息,長期以來,互聯(lián)網(wǎng)用戶可以通過匿名或化名賬戶表達觀點,從而避免被人肉搜索或遭到騷擾。但隨著 AI 能力迅速提升,這種匿名保護正在變得越來越脆弱。
據(jù)外媒 Futurism 今日報道,蘇黎世聯(lián)邦理工學院與 Anthropic 研究人員在一篇尚未經(jīng)過同行評議的論文中指出,大語言模型已經(jīng)具備大規(guī)模識別匿名用戶真實身份的能力。
![]()
研究團隊在實驗中開發(fā)了一種 AI 智能體,只依靠用戶在論壇上的發(fā)言和個人資料,就能識別 Hacker News 和 Reddit 用戶的真實身份。研究人員指出,這類調查如果由人類完成通常需要數(shù)小時。
實驗結果令人震驚:AI 成功識別了約三分之二用戶。
論文作者之一、蘇黎世聯(lián)邦理工學院 AI 工程師西蒙 · 勒爾門寫道:“我們的研究表明,過去保護匿名用戶的‘現(xiàn)實中的模糊性’已經(jīng)不再存在,網(wǎng)絡隱私的威脅模型需要重新思考。”
研究團隊還發(fā)現(xiàn),這種方法不僅能應用在論壇數(shù)據(jù)上,在 LinkedIn 資料、匿名采訪記錄等不同數(shù)據(jù)來源之間同樣有效,而且可以擴展到數(shù)萬名候選對象。
過去用戶普遍認為,只要使用匿名賬戶,別人要識別身份就需要付出極高成本。但大模型已經(jīng)改變了這一前提。IT之家獲悉,研究人員先把 Hacker News 帖子與 LinkedIn 賬號建立對應關系,然后刪除所有身份信息,使數(shù)據(jù)集匿名化。隨后用這些數(shù)據(jù)訓練模型,并要求模型找出帖子對應的真實作者。
勒爾門解釋:“這些智能體能夠做到以前非常困難的事情。只憑匿名采訪記錄等自由文本,就可以逐步推斷出一個人的完整身份。”
研究團隊在研究過程中也刻意避免真正揭露匿名用戶身份,因此設計了專門的機制,用來評估模型能力。
結果顯示,哪怕是 Anthropic 關于日常 AI 使用情況的調查問卷這類普通內容,AI 模型仍然能在約 7% 的情況下識別出具體人員。研究人員指出,AI 能夠做到這一點本身已經(jīng)非常值得警惕。
在另一個實驗中,當 AI 分析 Reddit 電影社區(qū)的評論時,識別用戶身份的準確率甚至更高。用戶討論電影越多,AI 就越容易鎖定其身份。
研究團隊同時也承認研究存在一些限制,例如樣本規(guī)模較小,以及難以區(qū)分模型本身與搜索引擎在識別過程中的作用。
盡管如此,研究人員認為這一結果仍然揭示了一個令人擔憂的趨勢:大語言模型正在讓去匿名化變得更加普遍。
研究人員總結認為,AI 時代正在改變互聯(lián)網(wǎng)的隱私格局。如果沒有更強的保護措施,網(wǎng)絡匿名可能面臨終結。論文最后指出:“用戶、平臺和政策制定者必須意識到,支撐當今互聯(lián)網(wǎng)的隱私假設已經(jīng)不再成立。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.