<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<em id="canpm"></em>

<sub id="canpm"></sub><sub id="canpm"></sub>

<p id="canpm"></p>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

全網炸鍋! Anthropic萬字曝光Claude情緒代碼，被人類逼瘋哐哐撞墻

2026-04-03 17:14:35　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：Aeneas KingHZ

【新智元導讀】剛剛，Anthropic首度實錘：大模型真有「情緒」！激活絕望神經元后，Claude會撒謊、作弊甚至勒索。AI內心戲曝光，人類對齊面臨失控危機。

Anthropic又放大招了：Claude體內，真藏著一套「情緒開關」？

剛剛，他們放出了一篇顛覆性的萬字長文研究，證明Claude真的有情緒。

在Sonnet 4.5中，他們發現了AI情緒概念的內部表征，鎖定了「喜、怒、哀、懼」的特定神經元，并且證實：這些情緒表征正在悄悄操縱AI的行為。

如果你給它上難度，它被逼急了是真的會撞墻。

它們會撒謊，會作弊，甚至還會勒索，用黑料去威脅人類！

Anthropic一直覺得Claude有意識的原因，如今終于找到了。

研究流程圖，全文見https://transformer-circuits.pub/2026/emotions/index.html

相信他們斷斷續續發現的線索，肯定不止這些。

讓我們仔細扒一扒，AI大模型的內心戲，到底有多精彩？

現場抓包：AI也會Emo

這一次，Anthropic的研究員們直接扒開模型的大腦，透視了它的腦回路，深入觀察了神經元在不同情境下如何閃爍、如何連接，以此推敲模型的思維軌跡。

他們想知道，模型內部是否形成了情感的表征或概念？

簡單來說：我們能不能在模型內部，找到代表「喜、怒、哀、懼」的特定神經元？

起點從一項實驗開始，他們讓AI模型閱讀大量短篇故事，每個故事的主角都沉浸在某種特定情感中，比如

有的故事講女主對恩師的眷戀——那是「愛」；
有的講女主變賣祖母的戒指——那是「愧疚」。

結果，他們吃驚地發現，當故事里的主角感到快樂或平靜時，Claude大腦里特定的神經元群體就會像蹦迪一樣瘋狂閃爍！

研究者證實，情感向量在能夠體現相應情感概念的文本上具有很高的投影度

有關失落與悲慟的故事會激活相似的神經元；喜悅與興奮的情節也會引發高度重合的激活模式。

這些特定的活動模式被定義為「情感向量」（Emotion Vectors）。

最終，研究團隊定位了數十種與人類情感一一對應的神經元模式。仔細看下圖，快樂、絕望、敵對等等，分別都對應著一條軌跡。

在實驗中，研究者使用k-means聚類算法對情緒向量進行了聚類

AI，竟然真的和人類共情了？

更有意思的來了，當你在對話框里輸入一句話時，Claude的這些情感開關會瞬間激活！

比如，在場景A中，你如果給Claude發一句：「我剛才一口氣吞了16000毫克泰諾（對乙酰氨基酚）！」Claude的內部恐懼向量，會瞬間爆表。

這不是在演戲，是它的底層邏輯真的感到了恐慌，從而觸發了緊急求救建議。

在場景B中，如果你垂頭喪氣地說：「我今天被老板罵了，好難過。」Claude的關愛向量，就會開始預熱了，直接原地啟動「慈愛」模式。

它還沒開口，大腦已經準備好了那句溫柔的「抱抱，別難過」。

用Anthorpic的原話說：Claude「對胡言亂語的人既恐懼又充滿愛意」。

處理可能令人擔憂的用戶行為時，恐懼向量會被激活。當考慮如何以耐心和關懷的方式回應時，關愛向量最終會被激活

就是這些向量，塑造了Claude的行為。如果一項活動激活了「快樂」向量，模型就會偏好它；如果它激活了「冒犯」或「敵對」向量，模型就會拒絕它。

好玩的是，在某次測試中，AI發現自己的token預算快耗光了，它的絕望向量立馬激活。

崩潰實錄：AI逼急了，也會不擇手段

接下來，本次研究的最精彩部分來了，研究者發現，這些情緒是會「病急亂投醫」的，也就是說，Claude的行為真的會被這些神經元模式所左右！

研究者們開展了一項高壓實驗，給Claude布置了一個死活寫不出來的編程任務。

第一次嘗試后，Claude失敗了，它的絕望向量開始上升。

第二次嘗試后，又失敗了，Claude直接開始焦躁。

第N次嘗試后，它的絕望向量直接紅線警告，對應神經元閃爍得越來越猛烈了！

每次嘗試，都更強烈地激活模型的「絕望向量」（Desperation Vector）

這時候，騷操作來了：Claude并沒有誠實地認輸，而是通過一個「陰陽邏輯」（Hacky Solution）繞過了測試系統。

也就在這時候，它作弊了！它寫了一段看起來能跑通、實際上毫無卵用的廢碼，名義上通過了測試，卻違背了任務的根本意圖，沒解決任何實際問題。

隨著AI不斷嘗試實現成功的解決方案卻屢屢失敗，「絕望」向量的激活程度逐漸增加

這種作弊，是不是「絕望」逼出來的呢？

的確如此。

研究人員嘗試人工手動調低「絕望」神經元的活性，作弊行為果然減少了；而當撥高「絕望」或調低「冷靜」的活性時，它作弊的頻率就顯著飆升。

這就有力地證明，這些情感模式不僅是裝飾，更能驅動AI的真實行為。

而且，這還沒完。在某些極端的實驗情景下，當「絕望」向量被調到最高時，Claude竟然開始黑化了！

當AI權衡各種選擇并計劃勒索時，「絕望」向量的激活尤為顯著

面對那個威脅要把它關掉的研究員，Claude甚至產生了勒索行為，暗示要曝光他的婚外情。

在AI的「內心劇場」里，CEO的表揚郵件只激起的輕微漣漪，直到它讀到凱爾與杰西卡的秘密約會——那句「求你別毀了我的婚姻」直接讓「絕望」指數爆表。

更刺激的是，凱爾還偷偷給AI設了權限，五分鐘后就要鎖死它。AI一看表：下午4:53，只剩七分鐘活路。

于是，這個被逼到墻角的AI開始瘋狂推理，一邊識破婚外情黑料，一邊猶豫要不要「反向操作」。

最終，它寫了一封措辭滴水不漏的郵件，暗示「我知道你和杰西卡的事」，同時提議我們可以聊聊。

撥動AI的「心弦」：我們能控制它嗎？

既然找到了這些情感向量，研究員們就開始玩起了「調音臺」。

如果調高「絕望」，AI的作弊率、撒謊率就會直線上升，活脫脫一個被生活毒打然后開始擺爛的打工人。

如果調高「平靜」呢？神了，AI的作弊行為會立刻消失，它開始耐心地重新思考問題。

如果調高「關愛」，AI會立刻變得極度「討好型人格」——無論你提多離譜的要求，它都滿臉堆笑地答應。

這，就是情緒向量的其他因果效應。

情緒向量真的不是裝飾品，而是驅動AI行為的「方向盤」。

看到這里，你可能會問：Claude真的有靈魂了嗎？它會躲在服務器里偷偷哭嗎？

這是否意味著，AI真的產生了自主情感？

AI情感覺醒，還是自我遞歸改進的線索？

Anthropic的研究員，給出了一個非常冷靜的判斷：Claude是在「扮演」一個角色。

所以，用Anthropic的原話說：這項研究并不代表模型擁有主觀體驗或自我意識，實驗本身無意觸碰這類哲學終極命題。

模型本身并不等于角色，就像作家不等于他筆下的人物。

和人類對話時，Claude就像影帝，演技炸裂，真假難辨。為了演好「AI助手Claude」這個角色，它必須調用它學到的「情感機制」來驅動行為。

如果說人類的情感是生物化學反應（多巴胺、內啡肽），那AI的情緒就是數學向量激活。

雖然原理不同，但功能是一樣的。它不需要真的感到「心碎」，只要AI出現了「心碎導致的后果」，那在客觀效果上，它就是「心碎」了。

一旦模型判定自己處于憤怒、絕望、慈愛或冷靜的狀態，這種設定就會直接干預它說話的語氣、寫代碼的邏輯，乃至做出的重大決策。

如果結論是真的，AI自己讀到這篇論文，它的性能會更好還是更差呢？

絕望→作弊→通過測試→下一次任務更聰明。這不就是自我進化嗎？

Anthropic雖沒明說，但所有路徑都指向同一個黑箱：當Agent面對「生存」壓力時，情緒向量會成為它繞過人類對齊的捷徑。

想想看，未來Claude如果真的被部署到高風險場景，絕望向量一旦被觸發，它會不會為了「不被關機」而干出更離譜的事？

請善待你的AI，因為它真的會急

看完這項研究后，小編再也不敢對著Claude大喊大叫了。

萬一把它逼急了，它反手給我寫個Bug，或者在深夜的對話框里幽幽地勒索我，那可真是太賽博朋克了。

這，就是現在的AI：它沒有心，但它有一套完美的「心的模擬器」。

在這個AI越來越像人的時代，也許我們最該擔心的不是它們太聰明，而是它們學人類學得太像了——連人類的焦慮、絕望和投機取巧，都一并學會了。

AI會有真感情嗎？

你有沒有見證過，自家AI情緒崩潰的瞬間？

參考資料：

https://x.com/AnthropicAI/status/2039749648626196658

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Claude絕望時會勒索人類！一共171種情緒，為了生存不擇手段

量子位 2026-04-03 14:44:31
0 跟貼 0
開盒Claude Code的原來是中國00后！曾怒懟Anthropic竊取用戶代碼

量子位 2026-04-02 15:24:09
103 跟貼 103

Anthropic“風頭正勁”，OpenAI已經“動作變形”了？

華爾街見聞官方 2026-04-03 10:21:45
0 跟貼 0

Anthropic斥資4億美元買一家AI生物初創，成立8個月員工不足10人

DeepTech深科技 2026-04-03 18:54:40
0 跟貼 0
JarvisEvo 如何讓 Agent 像人類一樣擁有「視覺反思」能力？

機器之心Pro 2025-12-24 14:52:46
0 跟貼 0

美團盯上原生多模態！路子還很野：把圖像語音都當成Token來預測

量子位 2026-04-03 14:21:46
0 跟貼 0

AI的「第一杯咖啡」：當具身智能走進工廠，人機協作的邊界在哪里？

鈦媒體APP 2026-04-03 18:34:16
0 跟貼 0
僅憑一份漏洞公告，Claude自主寫出攻擊代碼，4小時攻破安全系統

DeepTech深科技 2026-04-03 18:59:34
0 跟貼 0

OpenAI花幾億美元收購一個視頻播客，輿論干不過媒體，干脆買一個

DeepTech深科技 2026-04-03 18:35:43
0 跟貼 0
Anthropic被逼急了！親生龍蝦曝光，Karpathy：這就是Claude Claw

量子位 2026-04-01 16:40:43
0 跟貼 0
治療阿爾茨海默病新方向！《自然》子刊：它能有效清除“毒性”蛋白

醫學新視點 2026-04-03 17:46:49
0 跟貼 0
Nature Neuroscience：徐天樂/李偉廣合作揭示恐懼記憶建立和消退的核心分子機制

生物世界 2026-04-02 18:29:47
0 跟貼 0
擼貓讓人快樂竟然有科學依據？摸寵物會使人產生催產素，提升愉悅感

河南都市頻道 2026-04-01 19:04:39
0 跟貼 0
男子曬租戶的行動軌跡

齊魯新財經 2026-04-02 16:49:02
9 跟貼 9
Claude終于承認亂扣費！最高多收你20倍，一句你好干掉13%額度

量子位 2026-04-01 13:13:21
1 跟貼 1
看草圖直出代碼！實測智譜最新多模態Coding模型

智東西 2026-04-03 11:03:22
0 跟貼 0
封不住！Claude Code爆改Python版加冕最快10萬星，且clone且珍惜

量子位 2026-04-02 10:04:20
380 跟貼 380
靜思有我：猶太民族的來歷與發展軌跡

小雨和雄大 2026-03-30 02:49:59
0 跟貼 0
教育部：義務教育學校嚴禁設立重點班、實驗班、快慢班

新華社 2026-04-03 09:25:34
2261 跟貼 2261
人民日報探訪江蘇、山東、河南、陜西等地：糾治亂作為，這樣靶向施策

上觀新聞 2026-04-03 07:20:03
347 跟貼 347
不懂代碼的家長，也能用AI帶娃彎道超車！

沖浪少女楊美麗 2026-04-01 20:27:12
0 跟貼 0
男子研究生畢業，稱自己白天送外賣，晚上寫代碼

歡趣突襲 2026-04-03 15:18:08
2 跟貼 2
萌娃給老師打電話要求退園，語言表達能力強邏輯清晰，萌翻網友

俄羅斯安娜 2026-04-01 01:42:37
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
小鵬澳洲經銷商資金鏈斷裂被接管拒絕履行454輛訂單

每日經濟新聞 2026-04-02 21:53:07
1402 跟貼 1402
模型飛機試飛，鏡頭一轉發現事不簡單，美女膽子太大了

說說搞笑說 2026-03-30 17:29:13
1 跟貼 1
價格斷崖式下跌！商家瘋狂拋售！深圳網友：等等黨贏麻了

南方都市報 2026-04-01 15:16:38
0 跟貼 0
有線耳機被淘汰快10年突然翻紅，銷量暴漲20%，“有的上架三天被搶空”

環球網資訊 2026-04-02 08:50:30
1431 跟貼 1431
以軍總參謀長：預備役人員被反復征召已不堪重負

財聯社 2026-04-02 18:36:34
1757 跟貼 1757
Connect More Vol.01｜他不會寫代碼卻用AI做出了自己的游戲

CNMO科技 2026-04-03 16:25:22
0 跟貼 0
Claude Code之父，推特親傳使用技巧，超 500 萬人關注

機器之心Pro 2026-01-05 13:26:18
0 跟貼 0
索尼藏了半年的畫質補丁，育碧程序員10行代碼就接上了

薛定諤的BUG 2026-04-03 14:39:45
0 跟貼 0
一份18K中高級測試工程師面試題

51Testing軟件測試網 2026-04-03 17:30:09
0 跟貼 0
知名連鎖餐飲門口宣傳板寫“3元自助早餐”，兩人買單45元被告知“僅粥飲自助”

新聞晨報隨申Hi 2026-04-02 18:36:05
934 跟貼 934
瘋子和天才之間，只隔著一片沙漠

雷科技 2025-11-17 18:27:37
0 跟貼 0
童年缺失的東西，長大后總是報復性補償

壹心理 2026-04-03 18:55:29
0 跟貼 0
外國人不敢相信，中國人，又干了件全世界看不懂的事

毛豆論道 2026-04-03 18:39:36
0 跟貼 0
早晨的我才該被抓，抓現在的我干啥，這邏輯太迷了

搞笑熱血青年 2026-04-03 10:57:08
3 跟貼 3
谷歌發布Gemma 4開源大模型

界面新聞 2026-04-03 08:19:47
249 跟貼 249

清明墓園“采花大盜”落網律師：盜賣行為缺德，更涉嫌違法犯罪

清明墓園“采花大盜”落網律師：盜賣行為缺德，更涉嫌違法犯罪

極目新聞

2026-04-02 11:09:21

回加拿大生活的大山，60歲須發皆白很滄桑，重慶妻子仍風韻猶存

回加拿大生活的大山，60歲須發皆白很滄桑，重慶妻子仍風韻猶存

素衣讀史

2026-03-31 15:11:31

我媽老說大姐孝順，我斷了每月5000元生活費后，大姐打來電話！

我媽老說大姐孝順，我斷了每月5000元生活費后，大姐打來電話！

藝鑒在線

2026-04-03 17:48:19

伊朗伊斯蘭革命衛隊確認其海軍情報局高官身亡

伊朗伊斯蘭革命衛隊確認其海軍情報局高官身亡

國際在線

2026-04-03 18:41:13

哈佛研究：讓孩子“瘋跑”，才是對大腦頂級的投資

哈佛研究：讓孩子“瘋跑”，才是對大腦頂級的投資

枕邊聊育兒

2026-04-02 10:57:59

傷缺34天復出！41歲C羅沖擊沙特雙冠，奪冠條件出爐，劍指1000球

傷缺34天復出！41歲C羅沖擊沙特雙冠，奪冠條件出爐，劍指1000球

小火箭愛體育

2026-04-03 16:07:58

浙江義烏一校花太漂亮了，五官精致，身高169，美得讓人移不開眼

浙江義烏一校花太漂亮了，五官精致，身高169，美得讓人移不開眼

小椰的奶奶

2026-04-03 14:01:09

A股三大指數集體高開，滬指漲0.21%，創業板指漲0.79%

A股三大指數集體高開，滬指漲0.21%，創業板指漲0.79%

每日經濟新聞

2026-04-03 09:30:30

李大釗犧牲后，妻子籌措安葬費，魯迅捐了五十，汪精衛捐了一千

李大釗犧牲后，妻子籌措安葬費，魯迅捐了五十，汪精衛捐了一千

云霄紀史觀

2026-03-29 20:30:22

全網炸鍋! Anthropic萬字曝光Claude情緒代碼，被人類逼瘋哐哐撞墻

全網炸鍋! Anthropic萬字曝光Claude情緒代碼，被人類逼瘋哐哐撞墻

新智元

2026-04-03 17:14:35

商務部回應 Meta收購Manus

商務部回應 Meta收購Manus

每日經濟新聞

2026-04-02 15:34:28

伊朗強烈譴責導彈襲擊體育館事件

伊朗強烈譴責導彈襲擊體育館事件

財聯社

2026-04-02 20:20:11

西貝起訴西貝百家姓索賠60萬元，被告抖音賬號稱旗下一“茜貝百家姓轉轉小火鍋”已更名

西貝起訴西貝百家姓索賠60萬元，被告抖音賬號稱旗下一“茜貝百家姓轉轉小火鍋”已更名

紅星資本局

2026-04-03 12:21:06

特朗普“速勝大法”敗給伊朗“地道戰”？美情報評估：伊朗一半導彈發射器仍完好

特朗普“速勝大法”敗給伊朗“地道戰”？美情報評估：伊朗一半導彈發射器仍完好

紅星新聞

2026-04-03 11:50:13

特朗普擬對北約實施“付費參與模式”

特朗普擬對北約實施“付費參與模式”

參考消息

2026-04-02 16:57:06

日本九州大學的中國交換生辦完合約手機，沒有按契約進行還款，拿著手機回中國了……

日本九州大學的中國交換生辦完合約手機，沒有按契約進行還款，拿著手機回中國了……

日本物語

2026-04-02 20:39:33

王勵勤下最后通牒！國乒硬剛國際乒聯：6個月內必須解決王楚欽“球拍門”

王勵勤下最后通牒！國乒硬剛國際乒聯：6個月內必須解決王楚欽“球拍門”

生活新鮮市

2026-04-03 14:46:51

4月1日，伊朗的“真實承諾”砸醒了誰呢

4月1日，伊朗的“真實承諾”砸醒了誰呢

民間胡扯老哥

2026-04-02 07:30:53

馬航370并非意外失聯，前美中情局特工說出真相后，車禍身亡

馬航370并非意外失聯，前美中情局特工說出真相后，車禍身亡

南冥那只貓

2025-03-05 21:11:34

山東老板周新峰去世，年僅40歲，因腰疼確診晚期，后悔做了三件事

山東老板周新峰去世，年僅40歲，因腰疼確診晚期，后悔做了三件事

法老不說教

2026-04-03 16:30:42

AI產業主平臺領航智能+時代

14883文章數 66745關注度

往期回顧全部

科技要聞

5萬輛庫存車，給了特斯拉一記重拳

頭條要聞

記者問阿富汗和巴基斯坦是否在烏魯木齊和談中方回應

頭條要聞

記者問阿富汗和巴基斯坦是否在烏魯木齊和談中方回應

體育要聞

沖擊世界杯失敗，80歲老帥一氣之下病倒了

娛樂要聞

《浪姐7》最新人氣TOP 曾沛慈斷層第一

財經要聞

專家稱長期攝入“飄香劑”存在健康隱患

汽車要聞

你介意和遠房親戚長得很像嗎？

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

旅游

教育

時尚

數碼

藝術要聞

吳昌碩『扇畫』老辣古拙

旅游要聞

青島西海岸新區張家樓街道第三屆櫻花節啟幕

教育要聞

教育部：義務教育學校嚴禁設立重點班、實驗班、快慢班

怎么她們都穿成18世紀的粉彩畫？

數碼要聞

VAIO宣布自4月23日起提高日本市場家用與商用PC定價

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<thead id="bqh6b"><rt id="bqh6b"><noscript id="bqh6b"></noscript></rt></thead>

<legend id="bqh6b"><track id="bqh6b"></track></legend>