網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

蘇黎世聯(lián)邦理工學院新研究：AI已能大規(guī)模識別匿名用戶真實身份

2026-03-07 22:47:26　來源: IT之家

山東舉報

分享至

IT之家 3 月 7 日消息，長期以來，互聯(lián)網(wǎng)用戶可以通過匿名或化名賬戶表達觀點，從而避免被人肉搜索或遭到騷擾。但隨著 AI 能力迅速提升，這種匿名保護正在變得越來越脆弱。

據(jù)外媒 Futurism 今日報道，蘇黎世聯(lián)邦理工學院與 Anthropic 研究人員在一篇尚未經(jīng)過同行評議的論文中指出，大語言模型已經(jīng)具備大規(guī)模識別匿名用戶真實身份的能力。

研究團隊在實驗中開發(fā)了一種 AI 智能體，只依靠用戶在論壇上的發(fā)言和個人資料，就能識別 Hacker News 和 Reddit 用戶的真實身份。研究人員指出，這類調查如果由人類完成通常需要數(shù)小時。

實驗結果令人震驚：AI 成功識別了約三分之二用戶。

論文作者之一、蘇黎世聯(lián)邦理工學院 AI 工程師西蒙 · 勒爾門寫道：“我們的研究表明，過去保護匿名用戶的‘現(xiàn)實中的模糊性’已經(jīng)不再存在，網(wǎng)絡隱私的威脅模型需要重新思考。”

研究團隊還發(fā)現(xiàn)，這種方法不僅能應用在論壇數(shù)據(jù)上，在 LinkedIn 資料、匿名采訪記錄等不同數(shù)據(jù)來源之間同樣有效，而且可以擴展到數(shù)萬名候選對象。

過去用戶普遍認為，只要使用匿名賬戶，別人要識別身份就需要付出極高成本。但大模型已經(jīng)改變了這一前提。IT之家獲悉，研究人員先把 Hacker News 帖子與 LinkedIn 賬號建立對應關系，然后刪除所有身份信息，使數(shù)據(jù)集匿名化。隨后用這些數(shù)據(jù)訓練模型，并要求模型找出帖子對應的真實作者。

勒爾門解釋：“這些智能體能夠做到以前非常困難的事情。只憑匿名采訪記錄等自由文本，就可以逐步推斷出一個人的完整身份。”

研究團隊在研究過程中也刻意避免真正揭露匿名用戶身份，因此設計了專門的機制，用來評估模型能力。

結果顯示，哪怕是 Anthropic 關于日常 AI 使用情況的調查問卷這類普通內容，AI 模型仍然能在約 7% 的情況下識別出具體人員。研究人員指出，AI 能夠做到這一點本身已經(jīng)非常值得警惕。

在另一個實驗中，當 AI 分析 Reddit 電影社區(qū)的評論時，識別用戶身份的準確率甚至更高。用戶討論電影越多，AI 就越容易鎖定其身份。

研究團隊同時也承認研究存在一些限制，例如樣本規(guī)模較小，以及難以區(qū)分模型本身與搜索引擎在識別過程中的作用。

盡管如此，研究人員認為這一結果仍然揭示了一個令人擔憂的趨勢：大語言模型正在讓去匿名化變得更加普遍。

研究人員總結認為，AI 時代正在改變互聯(lián)網(wǎng)的隱私格局。如果沒有更強的保護措施，網(wǎng)絡匿名可能面臨終結。論文最后指出：“用戶、平臺和政策制定者必須意識到，支撐當今互聯(lián)網(wǎng)的隱私假設已經(jīng)不再成立。”

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.