網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Anthropic王炸Claude基準(zhǔn)測試泄露，卡皮巴拉細(xì)節(jié)曝光！還在代碼里下毒

2026-04-02 00:03:21　來源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：Aeneas KingHZ

【新智元導(dǎo)讀】剛剛，Anthropic神秘王炸Mythos的基準(zhǔn)測試泄露了，多項(xiàng)跑分直接刷新紀(jì)錄！另外，泄露源碼中還曝光出卡皮巴拉的細(xì)節(jié)：代號(hào)capabara-v2-fast，支持1M上下文。

過去24小時(shí)，AI 圈的空氣里，都是焦灼和狂歡。

先爆的是 Claude Code。

Anthropic這款命令行終端工具的源碼意外泄露，很快就在GitHub上引發(fā)連鎖反應(yīng)。大量開發(fā)者沖進(jìn)去圍觀、Fork、拆解，隨后又出現(xiàn)了Python和Rust的「復(fù)刻版」。

原本只屬于Anthropic內(nèi)部的實(shí)驗(yàn)，轉(zhuǎn)眼變成了整個(gè)行業(yè)的「公開的秘密」。

誰也沒想到，第二波泄露來得更快。

就在剛剛，Anthropic疑似下一代旗艦重磅旗艦?zāi)Ｐ蚆ythos的基準(zhǔn)測試跑分，又又又泄露了。

與以往Claude 4.x/5系列不同，Mythos被稱為獨(dú)立產(chǎn)品線，定位明顯更高。而從曝光的數(shù)據(jù)來看，它很可能是Anthropic目前最具野心的一次模型躍遷。

從泄露信息來看，Mythos對(duì)比當(dāng)前強(qiáng)勢(shì)模型Opus 4.6，幾乎在所有關(guān)鍵指標(biāo)上都有明顯提升：

Terminal-Bench 2.0：78.4%（+13.0%）
SWE-bench Verified：87.4%（+6.6%）
OSWorld：79.6%（+6.9%）
BrowseComp：92.3%（+8.3%）
MCP Atlas：75.7%（+16.2%）
Finance Agent：82.1%（+21.4%）
GDPVal-AA-Elo: 2668 (+1062)
Humanity's Last Exam: 52.3% (無工具, +12.3%), 71.5% (有工具, +18.5%)

如果這些數(shù)字屬實(shí)，那Mythos顯然又是一個(gè)巨大的升級(jí)。不僅在性能上，而且在定位上。

在智能體編碼任務(wù)上，78.4%的Terminal-Bench和87.4%的SWE-bench證明，Mythos效果出眾。

這是愚人節(jié)玩笑，還是泄露的真實(shí)數(shù)據(jù)？

有人特意用谷歌的AI內(nèi)容水印技術(shù)synthid驗(yàn)了一下這張圖，大概率不是AI生成的。

還有人放出了無水印版基準(zhǔn)測試分?jǐn)?shù)。

總之，如果，泄露分?jǐn)?shù)是真的，Anthropic恐怕要對(duì)Mythos收取天價(jià)！

源代碼泄露，「卡皮巴拉」細(xì)節(jié)曝光

另外，昨天泄露的Claude Code源代碼中，曝光了不少Anthropic「卡皮巴拉」模型的細(xì)節(jié)。

從這些潛藏在代碼庫底層的蛛絲馬跡，可以解讀出不少信息：非常明顯，Anthropic不僅僅是在堆參數(shù)，他們正在解決一個(gè)所有長文本模型都面臨的「隱形頑疾」。

不同于大家猜測的Mythos（目前尚無實(shí)據(jù)），代碼中明確指向了名為capybara-v2-fast的新模型。

它具有1M Context。顯而易見，百萬上下文現(xiàn)在都成了新一代模型的入場券了。

既然有「fast」版本，按照Anthropic的慣例，后續(xù)大概率會(huì)跟進(jìn)能力更強(qiáng)的旗艦版。

技術(shù)細(xì)節(jié)：一場精密的提示詞手術(shù)

最有趣的不是參數(shù)，而是Anthropic如何處理生產(chǎn)環(huán)境下的模型故障。

開發(fā)者發(fā)現(xiàn)，當(dāng)Prompt的Shape在工具調(diào)用（Tool Use）返回結(jié)果后，如果長得太像一個(gè)「輪次邊界（Turn Boundary）」，Capybara會(huì)產(chǎn)生誤判，導(dǎo)致模型過早停止。

因此，模型活還沒干完，就以為這輪對(duì)話結(jié)束了。

為了修補(bǔ)這個(gè)Bug，Anthropic并沒有選擇單純重訓(xùn)模型，而是進(jìn)行了一場極為精密的「Prompt 手術(shù)」。

首先，就是強(qiáng)制安全邊界，引入了Tool loaded.這樣的硬性邊界標(biāo)記。

然后，要重新定位那些具有風(fēng)險(xiǎn)的「同級(jí)模塊（Sibling Blocks）」。

另外，還有信息壓縮，就是將提醒文本（Reminder Text）直接「擠」進(jìn)工具結(jié)果中，確保模型能看到。

針對(duì)空的工具輸出，還會(huì)強(qiáng)制添加非空標(biāo)記，防止模型在空白處「斷片」。

這樣，一臺(tái)精密的提示詞手術(shù)就完成了。

天狗（Tengu）守門

此外，Anthropic內(nèi)部擁有一套名為tengu_*的灰度開關(guān)。

這意味著所有這些針對(duì)Capybara的優(yōu)化都不是盲目上線的。

因?yàn)橛兄鳮ill-switch（自殺開關(guān)），一旦rollout 出現(xiàn)異常，就可以秒級(jí)回滾。

而且代碼注釋中包含了大量的A/B測試證據(jù)。

有趣的是，ant/internal用戶（Anthropic員工）是第一波「金絲雀」，只有在內(nèi)部驗(yàn)證通過后，才會(huì)向外部用戶解鎖。

泄露代碼中顯示，

Anthropic竟在代碼里下毒

現(xiàn)在，全網(wǎng)大神都對(duì)泄露的源代碼展開分析了，有人發(fā)現(xiàn)：Anthropic變腹黑了？防友商白嫖，竟在代碼里下毒！

在大模型圈，最讓底層廠商頭疼的事，莫過于辛辛苦苦跑出來的高質(zhì)量數(shù)據(jù)，轉(zhuǎn)頭就被對(duì)手拿去搞了模型蒸餾。

這不，有人從泄露的Claude Code底層代碼發(fā)現(xiàn)，Anthropic 為了反抓取，竟然喪心病狂地內(nèi)置了兩套「反蒸餾全家桶」。

第一招，就是「流式投毒」。

當(dāng)你在跑任務(wù)時(shí)，Claude會(huì)在輸出流里偷偷摻沙子，隨機(jī)注入一堆虛假的工具調(diào)用指令。

這些指令對(duì)你來說可能只是閃過的雜訊，但對(duì)于那些蹲在后臺(tái)抓取數(shù)據(jù)準(zhǔn)備訓(xùn)練的爬蟲來說，簡直就是劇毒的毒藥。

如果拿回去訓(xùn)練自家模型，只會(huì)讓它越來越瘋。

第二招，則是「打碼大法」。

為了不讓友商復(fù)刻Claude強(qiáng)大的Agent執(zhí)行邏輯，Anthropic把所有的工具調(diào)用細(xì)節(jié)都給模糊化了。

反饋給輸出端的不再是詳細(xì)的邏輯步驟，而是像馬賽克一樣的簡短摘要。

這次的爆料，也讓我們看到了Anthropic極其務(wù)實(shí)的一面。

他們不只是追求性能，更是在細(xì)節(jié)上瘋狂「打補(bǔ)丁」，以確保在復(fù)雜的工具調(diào)用鏈條中，模型不會(huì)因?yàn)楦袷絾栴}而崩掉。

雖然官方尚未公布正式的SKU命名或發(fā)布日期，但從代碼的成熟度來看，Capybara家族已經(jīng)箭在弦上。

所以，「卡皮巴拉」會(huì)是Claude 3.5的升級(jí)版，還是全新的4.0系列模型呢？

Anthropic，為何如此冷靜？

有意思的是，面對(duì)如此大規(guī)模源代碼事件，Anthropic的態(tài)度倒是出奇的冷靜，他們只是默默地私下向GitHub倉庫發(fā)了DMCA（數(shù)字千年版權(quán)法）刪除通知。

外媒得到的Anthropic解釋是，這次泄露事件屬于人為錯(cuò)誤導(dǎo)致的發(fā)布打包問題，因?yàn)闃?gòu)成安全漏洞。

Claude Code之父Boris Cherny也否認(rèn)了這是由于bun的問題，只是輕描淡寫說了一句，「只是開發(fā)者的錯(cuò)誤」。

或許，讓Anthropic如此淡定的原因，就是框架并不是護(hù)城河。

不少圈內(nèi)人在復(fù)盤泄露的代碼后，得出了冷靜結(jié)論：Claude Code的框架本身并不神秘。甚至有人直言不諱地指出，CC的框架只能算中規(guī)中矩，更像是基礎(chǔ)配置。

在泄露發(fā)生之前，開源社區(qū)在任務(wù)編排、長上下文管理等細(xì)分維度上，已經(jīng)存在不少優(yōu)于CC的替代方案。

但為什么Anthropic的產(chǎn)品依然讓開發(fā)者趨之若鶩？答案不在于那幾行Python或TypeScript代碼，而在于架構(gòu)工程。

比如Prompt的精細(xì)堆疊、工具鏈的無縫銜接、模型的容錯(cuò)與自我糾正。這些細(xì)節(jié)絕非易事。

源碼可以被復(fù)制，但這種對(duì)復(fù)雜系統(tǒng)的掌控力，是無法通過簡單的git clone獲得的。

Cursor模式的成功就已經(jīng)證明了，即使基于別人的模型，只要能在產(chǎn)品體驗(yàn)和架構(gòu)深度上做到極致，依然能打造出讓開發(fā)者無法離開的「殺手級(jí)產(chǎn)品」。

因此，CC這次源碼泄露，實(shí)際上是將一個(gè)原本專有的「工業(yè)級(jí)工具箱」拋向了荒野，這就降低了所有人構(gòu)建完善編碼智能體的門檻。

未來要比拼的，就是誰能在這個(gè)開源的基石上，搭出最符合用戶直接的產(chǎn)品大廈。三個(gè)月，誰能長成新巨頭？

多事之秋

Anthropic人設(shè)翻車？

Anthropic一直給自己立的人設(shè)是：一家行事謹(jǐn)慎的、造福全人類的AI公司。

它發(fā)布關(guān)于AI風(fēng)險(xiǎn)的詳細(xì)研究成果，雇用了該領(lǐng)域最優(yōu)秀的一些研究人員。

它也一直在公開討論，開發(fā)這類強(qiáng)AI技術(shù)時(shí)應(yīng)承擔(dān)怎樣的責(zé)任。

所以，當(dāng)與美國國防部展開交鋒時(shí)，Anthropic幾乎得到了全網(wǎng)聲援浪潮。

然而，據(jù)上周四外媒報(bào)道，Anthropic承認(rèn)正在測試代表能力「跨越式變化」的新AI模型。

Anthropic意外公開了近3000份內(nèi)部文件，其中包括一篇描述的博客草稿。

之后，Anthropic確認(rèn)確有此事：

新模型代碼Capybara，在軟件工程、學(xué)術(shù)推理和網(wǎng)絡(luò)安全上，大大提升了性能；

已向一小群專注于網(wǎng)絡(luò)安全測試和防御準(zhǔn)備的早期用戶開放訪問權(quán)限。

奇怪的是，Anthropic沒有阻止文件繼續(xù)泄露。

連續(xù)的泄露事件，未必會(huì)立刻削弱Anthropic的模型實(shí)力，卻已經(jīng)開始動(dòng)搖它最寶貴的另一層護(hù)城河：外界對(duì)其內(nèi)部治理、工程紀(jì)律和「安全優(yōu)先」敘事的信任。

當(dāng)一家以謹(jǐn)慎著稱的公司，反復(fù)因?yàn)樾孤墩镜骄酃鉄粝拢嬲芸简?yàn)的，就不只是產(chǎn)品發(fā)布節(jié)奏，而是它自己最看重的「人設(shè)」。

參考資料：

https://x.com/synthwavedd/status/2039102384241049956

https://x.com/forloopcodes/status/2038942169311195432

https://techcrunch.com/2026/03/31/anthropic-is-having-a-month/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

源碼被開源，Claude Code之父回應(yīng)了：純內(nèi)部開發(fā)者手滑

機(jī)器之心Pro 2026-04-01 14:39:04
2 跟貼 2
斯坦福MIT天團(tuán)出手！1美元養(yǎng)龍蝦，圖文視頻全包，打工人神外掛

新智元 2026-04-01 20:44:04
0 跟貼 0

AI再強(qiáng)，這些軟件仍不可替代

財(cái)天COVER 2026-04-01 18:23:10
0 跟貼 0

有點(diǎn)傷自尊，但太值了！Karpathy：當(dāng)AI接管80%代碼，我看清了AGI魔法

新智元 2026-04-01 11:40:16
12 跟貼 12
104人重寫底層，OpenClaw裝上「任務(wù)大腦」，連QQ機(jī)器人都能管

新智元 2026-04-01 18:30:07
18 跟貼 18

AI的看圖能力，可能是編出來的

虎嗅APP 2026-04-01 21:12:07
0 跟貼 0

把8B模型塞進(jìn)iPhone，這家公司讓AI速度起飛，功耗省掉80%

DeepTech深科技 2026-04-01 21:12:58
0 跟貼 0
Claude Code開源發(fā)酵：負(fù)責(zé)人反省，平替版狂飆10萬星，Anthropic緊急封殺

智東西 2026-04-01 20:11:10
102 跟貼 102

好友設(shè)局灌醉，偽造證據(jù)栽贓陷害騙取錢財(cái)，巖梟上門主持公道

星河佰E際 2026-04-01 01:11:17
3 跟貼 3
那個(gè)從酒店房間泄露《GTA 6》游戲信息的少年

星星科普 2026-04-01 13:57:13
4 跟貼 4
Anthropic被逼急了！親生龍蝦曝光，Karpathy：這就是Claude Claw

量子位 2026-04-01 16:40:43
0 跟貼 0
奪冠才兩天，人民日?qǐng)?bào)接連點(diǎn)名張雪，釋放三個(gè)強(qiáng)烈信號(hào)，字字珠璣

削桐作琴 2026-04-01 18:27:15
237 跟貼 237
不要在動(dòng)物的地盤亂標(biāo)記

左左愛影視 2026-03-28 07:51:30
6 跟貼 6
聚龍灣住宅戶型首曝！廣州等了10年的王炸，終于亮牌

廣州PLUS 2026-04-01 18:07:46
0 跟貼 0
小偷被當(dāng)眾潑尿標(biāo)記，從此淪為黑暗中最顯眼的獵物

瑩小八影視 2026-04-01 11:06:43
1 跟貼 1
龍蝦玩家從夯到拉五個(gè)級(jí)別，你在哪一層？

秋葉PPT 2026-04-01 19:39:15
3 跟貼 3
Xbox第一方新作PS5版疑泄露？員工火速刪除！

游民星空 2026-04-01 22:10:13
0 跟貼 0
R星太狠了！曝員工簽終身保密協(xié)議離職也不能說

游民星空 2026-04-01 23:14:11
0 跟貼 0
阿聯(lián)酋被指準(zhǔn)備協(xié)助美國武力打通霍爾木茲海峽

證券時(shí)報(bào)網(wǎng) 2026-04-01 11:24:58
21028 跟貼 21028
DeepSeek又崩了公司暫無回應(yīng)

第一財(cái)經(jīng) 2026-03-31 17:35:28
12975 跟貼 12975
中國為何能在能源動(dòng)亂中處變不驚路透社公布一組數(shù)據(jù)

澎湃新聞 2026-04-01 22:24:09
2433 跟貼 2433
吉利星愿上市536天達(dá)成60萬交付，官宣與卡皮巴拉小黃豚跨界合作

新浪財(cái)經(jīng) 2026-03-30 21:29:09
2 跟貼 2
萌娃近距離接觸卡皮巴拉，下一秒萬萬沒想到，難怪不配現(xiàn)場聲音！

朦朧生活說 2026-04-01 08:52:41
0 跟貼 0
有銀行卡的要注意了

彭彭師姐說情感 2026-03-29 10:15:00
0 跟貼 0
日本部署導(dǎo)彈"瞄準(zhǔn)中國" 美方提醒：中方反制還沒結(jié)束

澎湃新聞 2026-04-01 11:39:50
2811 跟貼 2811
你可以不認(rèn)識(shí)張雪機(jī)車，但你得知道有個(gè)老板真把用戶當(dāng)人

主持人老李 2026-04-01 23:09:53
1 跟貼 1
伊朗擊毀美軍E-3預(yù)警機(jī)，情報(bào)泄露事件引發(fā)關(guān)注

神顏販賣機(jī) 2026-03-30 13:32:23
0 跟貼 0
源碼開箱即用，產(chǎn)科電子病歷系統(tǒng)

淘源碼 2026-03-31 17:10:19
6 跟貼 6
卡皮巴拉：豚生不擺爛，快樂少一半，主打一個(gè)活著挺好，死了也行

芝士小熊i 2026-03-31 11:12:57
3 跟貼 3
民警緊急攔截70萬現(xiàn)金，投資理財(cái)詐騙

江西都市現(xiàn)場 2026-03-30 15:51:59
0 跟貼 0
40歲轉(zhuǎn)行程序員：André用18個(gè)月拆穿3個(gè)行業(yè)謊言

薛定諤的BUG 2026-04-01 09:47:26
0 跟貼 0
真沒想到多年前的騙局現(xiàn)在還存在！聽聽美女的遭遇謹(jǐn)防被騙

頑皮狐貍 2026-04-01 04:02:30
0 跟貼 0
Anthropic王炸Claude泄露！全面碾壓Opus 4.6引爆全網(wǎng)

新智元 2026-03-30 15:30:22
0 跟貼 0
蘿卜快跑道歉：武漢全域暫停服務(wù)，后續(xù)會(huì)持續(xù)進(jìn)行優(yōu)化；昨晚多車行駛中突然停車，多部門開展處置

魯中晨報(bào) 2026-04-01 16:21:19
566 跟貼 566
國足0-2喀麥隆，沒想到邵佳一賽后會(huì)這么說，核心戰(zhàn)術(shù)被泄露

極度說球 2026-03-31 17:48:51
1 跟貼 1
10人意大利點(diǎn)球大戰(zhàn)不敵波黑，連續(xù)三屆無緣世界杯，主帥加圖索稱“感覺非常痛苦”；瑞典“絕殺”波蘭晉級(jí)，捷克時(shí)隔20年重返世界杯

極目新聞 2026-04-01 07:59:13
1925 跟貼 1925
過于謹(jǐn)慎反倒是漏洞

快樂追劇吧 2026-03-28 08:32:00
1 跟貼 1
警惕！Word和PDF已成境外組織竊密利器

掌聞視訊 2026-03-30 18:56:59
0 跟貼 0
公安部發(fā)聲力挺張雪

第一財(cái)經(jīng)資訊 2026-04-01 23:37:17
0 跟貼 0
網(wǎng)友非招聘負(fù)責(zé)人卻接到求職電話，竟是豆包AI“泄露”其手機(jī)號(hào)

星視頻 2026-03-31 12:23:11
0 跟貼 0

新智元

AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代

14871文章數(shù) 66736關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

教育

健康

本地

公開課

家居要聞

白巖松談人口老齡化：社會(huì)要降低老年人門檻
為什么人類有不同的膚色？
13個(gè)毀掉你生活的不良習(xí)慣
李彥宏：百度離破產(chǎn)30天

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

Anthropic王炸Claude基準(zhǔn)測試泄露，卡皮巴拉細(xì)節(jié)曝光！還在代碼里下毒

甲骨文血洗3萬人，47人團(tuán)隊(duì)僅留3人

小伙掃共享單車上的碼虧一套房首付 一夜白頭自扇巴掌

小伙掃共享單車上的碼虧一套房首付 一夜白頭自扇巴掌

NBA擴(kuò)軍，和籃球無關(guān)？

張婉婷已決定離婚 找律師討論婚變事宜

電商售械三水光針 機(jī)構(gòu)倒貨or假貨猖獗?

三電可靠 用料下本 百萬公里的蔚來ES6 拆開看

態(tài)度原創(chuàng)

經(jīng)典配色 晝色銀河

高考為什么要回收“草稿紙”？長知識(shí)了

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

從學(xué)徒到世界冠軍，為什么說張雪的底氣在重慶？

小伙掃共享單車上的碼虧一套房首付一夜白頭自扇巴掌

小伙掃共享單車上的碼虧一套房首付一夜白頭自扇巴掌

張婉婷已決定離婚找律師討論婚變事宜

電商售械三水光針機(jī)構(gòu)倒貨or假貨猖獗?

三電可靠用料下本百萬公里的蔚來ES6 拆開看

經(jīng)典配色晝色銀河