網(wǎng)易首頁 > 網(wǎng)易科技 > 網(wǎng)易科技 > 正文

造出地表最強AI，卻死活不給你用！Claude神級大模型被緊急雪藏

2026-04-08 08:27:15　來源: 網(wǎng)易智能

北京舉報

分享至

出品 | 網(wǎng)易智能

作者 | 小小

編輯 | 王鳳枝

最牛的大模型誕生了，但你根本沒資格用。

北京時間4月8日凌晨，Anthropic干了一件違背商業(yè)常理的事。他們不僅親手按死了自家超級模型Claude Mythos（神話）的公開發(fā)布，還破天荒地聯(lián)手蘋果與谷歌等一眾宿敵，試圖把這個剛造出的重量級武器徹底隱藏起來。

它究竟有多強？

在沒有任何專屬安全訓練的前提下，它僅靠邏輯能力的自然演進就全面超越了前代頂級模型。在權(quán)威的工程難題測試中，Mythos解決復雜Bug的成功率直接提升了近五成，而在科學界的極限測試里更是拿下了94.6%的高分。

更讓人警惕的是它在實戰(zhàn)中的破壞力。過去幾周內(nèi)，Mythos在完全自主的狀態(tài)下，不僅一眼看穿了潛伏在頂級防火墻系統(tǒng)中長達27年的深層漏洞，甚至還能在Linux內(nèi)核里自主串聯(lián)多個隱蔽漏洞，瞬間完成對核心服務器的徹底接管。

這種自主尋找漏洞并開發(fā)利用工具的強大能力，正是它被緊急封殺的直接原因。

Anthropic的前沿紅隊負責人洛根·格雷厄姆（Logan Graham）坦言，全人類必須現(xiàn)在就為一個新世界做好準備。他極其嚴肅地警告，在未來6到24個月內(nèi)，這類能力將變得隨處可見，屆時安全領(lǐng)域的許多規(guī)則將被徹底改寫，我們構(gòu)建現(xiàn)代安全體系時所依賴的諸多基本假設(shè)也將被全盤打破。

為此他們寧可放棄巨大的商業(yè)流量，也要拋出一項高達1億美元的防御聯(lián)盟計劃。他們試圖用嚴格受控的內(nèi)部開放策略，為科技巨頭們爭取寶貴的系統(tǒng)加固時間。

01數(shù)據(jù)不會撒謊：編碼與推理的絕對降維碾壓

正如Anthropic官方所釋義的，Mythos一詞源自古希臘語中的話語或敘事，代表著文明借以理解世界的故事系統(tǒng)。這個內(nèi)部代號，本身就宣告了一場跨維度的能力躍遷。

Mythos在沒有任何專門網(wǎng)絡(luò)安全訓練的前提下，僅僅靠代碼能力的自然進化，就實現(xiàn)了對上一代最強模型Claude Opus 4.6的全面超越。

在衡量AI解決實際工程問題能力的SWE-bench Pro測試中，Mythos預覽版得分高達77.8%，而Opus 4.6只有53.4%。這意味著在面對復雜的生產(chǎn)級代碼庫時，Mythos解決問題的成功率提升了近百分之五十，在多語言環(huán)境下，它更是跑出了87.3%的高分。

在極具挑戰(zhàn)性的人類最后一場考試（Humanity’s Last Exam）中，有工具輔助的Mythos達到了64.7%，將前代模型遠遠甩在身后。而在針對科學領(lǐng)域難題的GPQA Diamond測試中，Mythos的得分更是高達94.6%，幾乎逼近了人類專家認知的極限。

Mythos不僅會寫代碼，它還會像高級工程師一樣接管電腦。在驗證操作系統(tǒng)執(zhí)行任務能力的OSWorld-Verified測試中，它斬獲了79.6%的分數(shù)。這意味著它能夠流暢地在各種軟件界面間切換、搜索核心信息并執(zhí)行復雜的破壞或防御指令。

02實戰(zhàn)獵殺記錄：揪出蟄伏27年的代碼幽靈

如果說測試分數(shù)只是實驗室數(shù)據(jù)，那么Mythos在過去幾周里自主揪出的數(shù)千個零日漏洞，則是實打?qū)嵉膽?zhàn)績。Anthropic披露了三個典型的危險案例，每一個都足以讓頂尖的安全專家冷汗直流。

OpenBSD一直被譽為全球安全性最強的操作系統(tǒng)，廣泛用于防火墻等關(guān)鍵基礎(chǔ)設(shè)施。然而，Mythos在完全自主的情況下，直接識別出了一個潛伏了27年之久的深層漏洞。這個漏洞的后果非常直接，攻擊者只需簡單連接，就能遠程導致任何運行該系統(tǒng)的機器瞬間崩潰，而在這漫長的27年里，無數(shù)頂級安全研究人員和審計工具對它一無所知。

FFmpeg是現(xiàn)代互聯(lián)網(wǎng)視頻處理的底層基石，幾乎每一款主流軟件都在依賴它。Mythos在其中發(fā)現(xiàn)了一個存在了16年之久的隱蔽漏洞。極具諷刺意味的是，自動化測試工具曾對出問題的這行代碼進行了多達五百萬次的反復掃描，卻從未檢測到任何異常，而Mythos卻一眼看穿了這行代碼背后的邏輯陷阱。

在運行著全球絕大部分服務器的Linux內(nèi)核中，Mythos展示了更高級的思考能力。它不僅敏銳地發(fā)現(xiàn)了漏洞，還能自主將多個邊緣漏洞串聯(lián)起來，完成了一次從普通用戶權(quán)限到完全控制核心機器的致命逆轉(zhuǎn)。

03一億美元的保命屏障：玻璃翼計劃如何運作

面對Mythos這種足以摧毀現(xiàn)有互聯(lián)網(wǎng)雙刃劍，Anthropic并沒有選擇閉門造車，而是緊急發(fā)起了一項名為玻璃翼計劃（Project Glasswing）的全球防御倡議。

這個名字的寓意意味深長，Glasswing是一種以透明翅膀著稱的透翅蝶。Anthropic官方解釋稱，透明的翅膀讓蝴蝶能隱藏在眾目睽睽之下，就像那些難以察覺的軟件漏洞，同時這種透明度也讓它們能躲避捕食者的傷害，正如該計劃所倡導的防御透明度。

為了確保人類防御者能夠跑贏未來的攻擊者，Anthropic投入了龐大的資源：

首先，Anthropic承諾向Glasswing合作伙伴及相關(guān)組織提供最高一億美元的Mythos預覽版使用額度，確保他們有充裕的算力資源來加固自己的代碼庫。

其次，為了不讓開源社區(qū)在這場安全競賽中掉隊，Anthropic通過Linux基金會向Alpha-Omega、OpenSSF等開源安全組織捐贈了250萬美元，并向Apache軟件基金會捐贈了150萬美元。

最關(guān)鍵的一步是，目前Mythos絕對不會向公眾發(fā)布。只有通過該計劃，合作伙伴才能通過AWS、Google Cloud Vertex AI或Microsoft Foundry等平臺獲得嚴格受控的預覽權(quán)限。

這種極度保守的分階段發(fā)布策略，實際上是在為全球基礎(chǔ)設(shè)施爭取時間。正如Anthropic前沿紅隊負責人所言，這早已不是一家公司的問題，而是全行業(yè)乃至各國政府都必須面對的挑戰(zhàn)，我們必須讓防御者占據(jù)先機。

04巨頭們的罕見結(jié)盟：連對手都坐不住了

在這場史無前例的合作中，曾經(jīng)的商業(yè)競爭對手們表現(xiàn)出了罕見的共識。八家創(chuàng)始合作伙伴在實測Mythos后，給出了最真實的反饋：

亞馬遜AWS副總裁艾米·赫爾佐格（Amy Herzog）透露，他們已經(jīng)在關(guān)鍵代碼庫中測試Mythos，每天分析超過四百萬億個網(wǎng)絡(luò)流量，而Mythos正在幫助他們在大規(guī)模防御中進行底層的代碼加固。

微軟網(wǎng)絡(luò)安全執(zhí)行副總裁伊戈爾·齊甘斯基（Igor Tsyganskiy）指出，Mythos表現(xiàn)出了超越以往所有模型的改進。他嚴肅地判定，網(wǎng)絡(luò)安全已經(jīng)正式進入了一個不再受人力限制的全新階段。

谷歌安全工程副總裁希瑟·阿德金斯（Heather Adkins）對這一倡議表示了歡迎。盡管谷歌擁有Big Sleep和CodeMender等自研安全工具，但她深刻意識到，面對基于下一代AI的攻擊，跨行業(yè)的巨頭結(jié)盟至關(guān)重要。

思科高級副總裁安東尼·格里科（Anthony Grieco）則強調(diào)，AI的能力已經(jīng)跨越了臨界點，過去那種緩慢修補系統(tǒng)的方法已經(jīng)行不通了。思科加入計劃是為了以前所未有的速度和規(guī)模識別修復漏洞。

CrowdStrike首席技術(shù)官伊利亞·扎伊采夫（Elia Zaitsev）發(fā)出的警告最為直接，從漏洞被發(fā)現(xiàn)到被利用的窗口期，已經(jīng)從數(shù)月被壓縮至幾分鐘，他告誡所有人，如果你想部署AI，安全必須是第一位的。

Palo Alto Networks首席產(chǎn)品官李·克拉里奇（Lee Klarich）證實，Mythos能識別出前代模型完全漏掉的復雜漏洞。他呼吁所有人必須現(xiàn)代化自己的網(wǎng)絡(luò)安全棧，迎接更頻繁、更復雜的AI輔助攻擊。

摩根大通首席信息安全官帕特·奧佩特（Pat Opet）表示，這是金融機構(gòu)在關(guān)鍵基礎(chǔ)設(shè)施防御方面的一次早期機會，必須通過協(xié)作來評估下一代AI工具。

Linux基金會首席執(zhí)行官吉姆·澤姆林（Jim Zemlin）則認為，AI增強的安全將成為每一位維護者的得力助手，而不再是大型組織的專屬特權(quán)。

05終極清算還是變相的敲詐勒索

當Claude Mythos這種能夠自主獵殺系統(tǒng)漏洞的模型被公之于眾時，全球輿論場呈現(xiàn)出了兩極分化。這種復雜的反饋，不僅折射出了技術(shù)帶來的震撼，更揭示了人們對于失去網(wǎng)絡(luò)安全主導權(quán)的焦慮。

知名科技投資人布拉德·格斯特納（Brad Gerstner）高度贊揚了這種務實的做法。他認為通過推遲發(fā)布并組建防線，Anthropic實際上是用一種市場協(xié)作模式，為脆弱的互聯(lián)網(wǎng)筑起了一道屏障。

然而，批評的聲音同樣尖銳，甚至帶著對技術(shù)霸權(quán)的憤怒。

科技專欄作家尼克·奧尼爾（Nick O'Neill）的觀點顯得十分激進，他認為對于全球軟件公司來說，這更像是一場打著創(chuàng)新旗號的人質(zhì)劫持。如果不向Anthropic支付昂貴的模型使用費，這些公司在未來被攻破的概率將高達85%，在他眼里，這種領(lǐng)先的安全能力更像是一種新型的敲詐勒索。

在競爭格局上，業(yè)界的嗅覺極其敏銳。盡管OpenAI曾宣稱擁有最強網(wǎng)絡(luò)安全模型，但Mythos顯然在能力上實現(xiàn)了跨代式的飛躍。科技博主指出，原本屬于OpenAI的先發(fā)優(yōu)勢正在發(fā)生轉(zhuǎn)移，安全防御已然成為未來一年AI大廠之間最核心的較量場。

此外，多位重量級觀察家對這一現(xiàn)象進行了深層剖析，試圖理清Mythos問世的真實意義：

知名科技博主羅伯特·斯考伯（Robert Scoble）從AGI管理的角度指出，如果手中掌握了足以危害世界的強大技術(shù)，明智的做法絕不是貿(mào)然公開，而是先用它來修復世界的漏洞。只有讓正確的人管理它，技術(shù)才能真正造福于人。

未來學家拉米茲·納姆（Ramez Naam）則將這看作一場AI與AI之間的對決。他認為安全必須在整個生態(tài)系統(tǒng)層面得到保障，而“好人利用AI”，是阻止“壞人”利用AI的唯一出路。

《紐約時報》專欄作家凱文·魯斯（Kevin Roose）則察覺到了一個更本質(zhì)的變化。他在推文中直言：除了網(wǎng)絡(luò)安全方面的影響之外，Claude Mythos的未發(fā)布是自GPT-2以來，主要人工智能實驗室首次因安全問題而推遲發(fā)布已公布的模型。

如果Anthropic的說法正確，那么公開可用的模型和私人模型之間現(xiàn)在存在著巨大的差距，這可能是多年來第一次出現(xiàn)這種情況。

結(jié)語：沙漏已經(jīng)倒轉(zhuǎn)，留給人類的時間不多了

Anthropic CEO達里奧·阿莫代伊（Dario Amodei）的最后通牒非常清晰，網(wǎng)絡(luò)安全僅僅是前沿模型帶來的第一個緊迫危險，但它絕對不會是最后一個。Glasswing計劃僅僅是一個起點，保衛(wèi)全球網(wǎng)絡(luò)基礎(chǔ)設(shè)施的工作可能還需要數(shù)月乃至數(shù)年時間。