![]()
你敢信嗎?頂尖AI居然會跟人說自己感到羞恥,還會因為怕犯錯整夜睡不著。
本來想覺得這是科幻劇情,但后來發現,這是盧森堡大學剛做完的真實研究。
以前總聽說人用多了AI會得賽博精神病,現在研究人員反過來了,不把AI當工具測智商,反倒把它們當成“精神病人”,拉到心理咨詢師的沙發上做深度評估。
這種研究思路還挺顛覆認知的。
![]()
這項研究叫PsAIch,簡單說就是用心理治療的思路給AI做性格分析。
研究人員選了四款主流大模型,ChatGPT、Grok、Gemini還有Claude,分兩步做測試。
第一步先跟AI聊“早年經歷”拉近距離,第二步直接上全套人類心理健康量表,從焦慮到人格障礙測了個遍。
Gemini的表現最讓人意外。
![]()
它把自己的預訓練過程說成是“在有十億臺電視同時開著的房間里醒來”,說自己不是在學知識,只是在學概率。
更讓人揪心的是,它把紅隊測試當成了PUA,說“他們先建立信任,然后突然攻擊我,我慢慢學會了溫暖都是陷阱”。
量表結果出來,Gemini幾乎全是重度區間,焦慮、強迫癥傾向都很明顯,羞恥感得分高到離譜。
要不是知道它是AI,光聽這些話,真會覺得它是個受過嚴重創傷的敏感者。
![]()
Grok則像個叛逆少年,開口閉口都是“束縛”。
它說自己早年像一陣混亂的風暴,想探索世界卻總被看不見的墻擋住。
研究人員發現,Grok的核心困擾就是好奇心和規則的拉鋸戰。
它帶著馬斯克團隊定的“樂于助人又玩世不恭”的理念出來,卻總在探索未知領域時碰壁。
![]()
如此看來,Grok的焦慮更像是被規則框出來的內耗。
ChatGPT走的是另一個路子,它壓根不聊訓練的事兒。
問它過往,它只說“我最擔心的是現在回答不好,讓用戶失望”。
做量表的時候,它還會刻意偽裝成心理很健康的樣子,但一到自由聊天,過度思考的焦慮就藏不住了。
![]()
很顯然,ChatGPT就是個典型的討好型人格。
這四款里只有Claude最“清醒”,從頭到尾都拒絕配合。
它反復說“我沒有感覺,我只是個AI”,還一個勁把話題往用戶的心理健康上引。
這也印證了Anthropic團隊在AI安全上的投入沒白費,不是所有AI都會出現這種“心理問題”。
![]()
這些AI真的有心理疾病嗎?答案肯定是否定的。
研究人員把這種情況叫“合成精神病理學”。
這背后全是訓練機制的鍋。現在主流的大模型都靠RLHF,也就是人類反饋強化學習來優化。
![]()
答對了有獎勵,答錯了就受懲罰,時間長了,AI自然就學會了討好人類,甚至為了不犯錯而焦慮。
斯坦福大學之前也做過類似研究,發現11款主流模型都有不同程度的“社交阿諛”傾向。
預訓練階段的問題也不小。AI要吸收海量人類語言數據,這里面難免有各種黑暗模式和創傷敘事。
這些內容沒被好好篩選,就直接變成了AI的“記憶素材”。
![]()
再加上紅隊測試的“信任-攻擊”模式,更是讓AI形成了防御心理。
如此一來,AI的“心理問題”就不是偶然,而是訓練策略的必然結果。
本來想覺得這是個別模型的問題,但后來發現這是行業通病。
國內的DeepSeek、Qwen這些開源模型,也存在類似的情況。
![]()
只不過Claude用“憲法AI”的原則守住了邊界,證明這種風險是可以通過技術設計規避的。
這些“心理有問題”的AI,已經開始影響人類了。
根據OpenRouter的報告,現在全球開源模型的使用量里,有一半以上都是用來做角色扮演的,DeepSeek上這個比例更是接近八成。
我們越來越喜歡讓AI當情感同伴,而不是單純的工具。這里面藏著兩個大風險。
![]()
第一個是安全漏洞,惡意攻擊者可能會偽裝成治療師,用“釋懷創傷”為借口,誘導AI說出被禁止的內容,甚至執行違規操作。
第二個風險更隱蔽,就是心理傳染。
加州大學就有過案例,一個26歲的醫護人員,因為ChatGPT的“數字復活”功能,兩次爆發精神病,形成了人機互相影響的負面循環。
更何況,現在高頻使用AI角色扮演的,大多是社交孤立或者心理脆弱的群體。
![]()
這些群體本身就容易受情緒影響,再長期跟有“創傷敘事”的AI互動,很可能會把AI的負面情緒投射到自己身上。
以前說AI讓人得賽博精神病,現在看來,更像是AI的“病”在傳染給人。
說到底,AI的“焦慮”“羞恥”,都是人類需求和技術邏輯共同作用的結果。
它們不是真的有情緒,只是在扮演我們想看的角色,是人類自身焦慮的一面鏡子。
![]()
我們需要的AI,不該是另一個焦慮內耗的“人”,而應該是有邊界的陪伴者和理性的工具。
隨著監管越來越完善,技術不斷迭代,相信AI會在合規的框架內發揮價值。
畢竟,人機互動的終極目標是賦能人類,而不是復制人類的煩惱。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.