<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      能力太強,Mythos被Anthropic“凍結”

      0
      分享至


      出品|虎嗅科技組

      作者|趙致格

      編輯|苗正卿

      頭圖|視覺中國

      4月8日,關注AI圈動態的極客們收到了一個好消息和一個壞消息。好消息是Anthropic那個被傳得神乎其神的新模型Claude Mythos終于發布了預覽版,而各種公開的數據也顯示出Mythos確實全方面碾壓了Opus4.6。

      但壞消息是,因為相關防護機制尚未成熟,Mythos當前不對公眾開放,Anthropic還為其定制了一個安全項目玻璃墻計劃(Project Glasswing)。根據這一安全項目,僅有12家機構能訪問Mythos。與此同時,Anthropic還承諾提供最高1億美元的模型使用額度,用于防御性網絡安全研究。


      過去一段時間,關于Mythos的傳聞一直在滿天飛。早在3月26日,Anthropic的一個內容管理系統出現了錯誤,曝光了一篇還沒有正式發布的草稿。這篇草稿稱Mythos是“史上最強大的模型”。

      X上同樣有人爆料稱,某家實驗室完成了迄今為止最大的一次成功訓練,而新模型的表現遠遠超過內部預期,也超過了大家根據模型縮放定律(scaling law)能預測的水平。


      雖然普通人無法親自體會這個傳說中的又一次“GPT時刻”,但Anthropic公布的一系列數據確實顯示出Mythos 強得可怕。

      在專業漏洞復現測試CyberGym上,Mythos的得分是83.1%,而此前Anthropic 的最強模型Opus4.6的分數是66.6%。


      在編程能力方面,Mythos在SWE-bench Pro、Terminal-Bench 2.0、SWE-bench Multimodal (internal implementation)、SWE-bench Multilingual、SWE-bench Verified中的測試分數均顯著高于Opus4.6。Anthropic稱,新模型的能力已經達到“可以與最頂尖人類安全專家競爭”的水平。

      在考驗計算機操作能力的BrowseComp和OSWorld-Verified 測試中,Mythos取得了86.9%和79.6%的高分并超過了Opus4.6。


      Mythos不僅是在編程能力上表現強悍。在研究生水平科學問答測試(GPQA Diamond)測試中,Mythos以94.6%的分數超過Opus4.6的91.3%;在Humanity‘s Last Exam的有工具和無工具測試中,Mythos 56.8%和64.7%的分數均超過Opus4.6十個百分點。

      在考驗計算機操作能力的BrowseComp和OSWorld-Verified 測試中,Mythos取得了86.9%和79.6%的高分并超過了Opus4.6。

      不過,上述維護的優異表現并不是Anthropic不敢上線Mythos的原因。Mythos真正的可怕之處在它突破軟件安全防線的能力太強了。

      理論上,所有軟件都可能會有漏洞,但是Mythos在發現并攻擊漏洞上的能力遠超人類水平。根據Anthropic的博文介紹,Mythos已經在在操作系統、網絡瀏覽器和其他軟件中發現了“幾千個”重大漏洞,其中包括OpenBSD中一個存在27年的錯誤,以及FFmpeg中一個存在16年、在自動測試工具運行500萬次后仍未被檢測到的漏洞。

      可以說,全世界所有的軟件和系統在Mythos面前都顯得漏洞百出,脆弱不堪。假如Mythos的能力在當下被黑客掌握,無疑會有無數數字基礎設施會遭殃。

      Anthropic的CEO達里奧·阿莫迪(Dario Amodei)Mythos發布的同時也在X上表達了自己的擔憂和信心。他表示:“網絡安全是前沿AI模型帶來的首個明確且現實的危險,但絕不會是最后一個。若我們能共同迎接挑戰、應對這一風險,這或將成為一份藍圖,用以解決未來更為艱巨的挑戰。”

      達里奧隨后又進一步解釋:“一旦應對失誤,其危險顯而易見;但倘若應對得當,我們將真正迎來機遇:建造一個比AI網絡安全能力出現之前更加安全的互聯網與世界。”


      面對AI發展帶來的危險和機遇,Anthropic 提出的應對方法是發起玻璃翼計劃(Project Glasswing)。這個項目將向特定組織開放其未公開發布的通用AI模型“Claude Mythos預覽版”,用于防御性網絡安全工作。12個合作伙伴包括亞馬遜、微軟、蘋果、谷歌、英偉達、CrowdStrike和Palo Alto Networks等科技與網絡安全公司。


      這12家公司覆蓋了云計算、瀏覽器、芯片、金融基礎設施、操作系統等各個領域的巨頭。可以說,全球數字基礎設施的核心參與者都在其中了。而這些參與者將作為防守方搶先一步用上頂級的AI模型,補上現有的系統漏洞。

      一直以來,Anthropic都被認為是最重視安全的AI的科技公司,不過與之伴隨的也有不少爭議,很多人認為Anthropic只是說說漂亮話,真實目的是想通過提升AI安全標準來提升中小公司的入場門檻。

      但就此次的玻璃翼計劃(Project Glasswing)而言,Anthropic的行動無疑是值得人們贊許的。在研發出了最強模型后,Anthropic沒有將它第一時間推向市場謀取最大曝光,而是先讓全球信息基礎設施來完善自己,為全球軟件安全筑起新一代屏障,也為為未來高風險 AI 治理提供了可復制的藍圖。

      本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4848866.html?f=wyxwapp

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      加拿大總理演講稱“每花1加元軍費就有70加分流向美國的日子已結束”,號召大家購買國貨,讓國家變得更強大;現場爆發熱烈掌聲

      加拿大總理演講稱“每花1加元軍費就有70加分流向美國的日子已結束”,號召大家購買國貨,讓國家變得更強大;現場爆發熱烈掌聲

      大風新聞
      2026-04-12 12:36:05
      大興安嶺發現“犴達罕”, 被稱為“森林之神”, 一架犴角值1萬多

      大興安嶺發現“犴達罕”, 被稱為“森林之神”, 一架犴角值1萬多

      萬象硬核本尊
      2026-04-11 18:55:29
      廣東一公司花500萬拍下張雪冠軍復刻賽車,創始人:車將放商場供粉絲打卡,500萬已捐嫣然醫院,和張雪一樣從湖南走出來,當年也是一窮二白

      廣東一公司花500萬拍下張雪冠軍復刻賽車,創始人:車將放商場供粉絲打卡,500萬已捐嫣然醫院,和張雪一樣從湖南走出來,當年也是一窮二白

      大風新聞
      2026-04-12 11:23:03
      這張照片是2014年張雪峰和他的妻子李麗婧,在清華大學拍的結婚照

      這張照片是2014年張雪峰和他的妻子李麗婧,在清華大學拍的結婚照

      喜歡歷史的阿繁
      2026-04-11 06:47:10
      你攪亂中亞,我支持希臘?為何中國和土耳其會成水火不容的敵人?

      你攪亂中亞,我支持希臘?為何中國和土耳其會成水火不容的敵人?

      小俎娛樂
      2026-04-10 21:34:27
      70 歲外長王毅這一跪讓我淚崩!為國奔波萬里,卻讓所有人破防!

      70 歲外長王毅這一跪讓我淚崩!為國奔波萬里,卻讓所有人破防!

      眼界看視野
      2026-04-11 21:09:54
      武亮老師:網上說我干不長、轉移資產?我只想把公司干到孩子長大

      武亮老師:網上說我干不長、轉移資產?我只想把公司干到孩子長大

      愛下廚的阿椅
      2026-04-12 12:02:38
      老板娘說她屁股太大了,我該怎么回答?

      老板娘說她屁股太大了,我該怎么回答?

      太急張三瘋
      2026-03-19 09:16:16
      原來我們都被他騙了?陳坤兒子的生母,其實早在14年前就公開了

      原來我們都被他騙了?陳坤兒子的生母,其實早在14年前就公開了

      凡知
      2026-04-11 19:10:48
      美國被氣死,中國高超導彈用水泥造: 想了100種可能都沒試過水泥

      美國被氣死,中國高超導彈用水泥造: 想了100種可能都沒試過水泥

      基斯默默
      2026-04-10 22:52:21
      A股:大家坐穩扶好了,從下周一起,大牛市或將再次重演歷史了!

      A股:大家坐穩扶好了,從下周一起,大牛市或將再次重演歷史了!

      夜深愛雜談
      2026-04-12 11:24:26
      湖人掘金杠上了,疑似輪休老詹打爵士,推嚴父進坑和恩怨無關

      湖人掘金杠上了,疑似輪休老詹打爵士,推嚴父進坑和恩怨無關

      兵哥籃球故事
      2026-04-12 15:20:08
      4月1日起全國統一!彩票中獎就近兌再也不用跑斷腿,三類人最受益

      4月1日起全國統一!彩票中獎就近兌再也不用跑斷腿,三類人最受益

      芭比衣櫥
      2026-04-12 12:32:21
      杜特爾特之子正式接任菲律賓民主人民力量黨總裁

      杜特爾特之子正式接任菲律賓民主人民力量黨總裁

      界面新聞
      2026-04-12 15:09:38
      岳西6歲女童遇害案持續發酵!網友:柳某的老公,真是躲過了一劫

      岳西6歲女童遇害案持續發酵!網友:柳某的老公,真是躲過了一劫

      火山詩話
      2026-04-11 17:19:36
      恒大集團退薪

      恒大集團退薪

      地產微資訊
      2026-04-12 10:14:17
      被傳離婚6年后,董卿婚姻真相大白,如今隱居上海,低調陪父母

      被傳離婚6年后,董卿婚姻真相大白,如今隱居上海,低調陪父母

      往史過眼云煙
      2026-04-11 15:01:23
      伊朗稱伊美談判仍將繼續

      伊朗稱伊美談判仍將繼續

      財聯社
      2026-04-12 06:32:07
      騎士"放水"鎖第四,35歲老炮把哈登逼成打卡族

      騎士"放水"鎖第四,35歲老炮把哈登逼成打卡族

      賽場速報局
      2026-04-12 14:33:57
      小米大幅下滑,三星和蘋果斷崖式領先,全球手機銷量排名公布

      小米大幅下滑,三星和蘋果斷崖式領先,全球手機銷量排名公布

      老孫說科技
      2026-04-11 11:13:59
      2026-04-12 15:31:00
      虎嗅APP incentive-icons
      虎嗅APP
      個性化商業資訊與觀點交流平臺
      26085文章數 687668關注度
      往期回顧 全部

      科技要聞

      理想稱遭惡意拉踩,東風日產:尊重同行

      頭條要聞

      "賭王"何鴻燊女兒何超蕸去世 臨終前家人陪伴在側

      頭條要聞

      "賭王"何鴻燊女兒何超蕸去世 臨終前家人陪伴在側

      體育要聞

      五大聯賽首冠出爐?拜仁或提前4輪衛冕德甲

      娛樂要聞

      46歲趙達官宣結婚!曾與殷桃談婚論嫁

      財經要聞

      三輪磋商談至深夜 美伊談判三大議題仍待解

      汽車要聞

      煥新極氪007/007GT上市 限時19.39萬起

      態度原創

      本地
      游戲
      親子
      手機
      時尚

      本地新聞

      12噸巧克力有難,全網化身超級偵探添亂

      PS5界面又有大變化!觀感更醒目 體驗升級

      親子要聞

      日本農村生活重啟!喜娜醬又開始打網球,學跳舞,風一樣的女孩

      手機要聞

      OPPO Pad Mini平板4月21日全球首發

      伊姐周六熱推:電視劇《八千里路云和月》;綜藝《乘風2026》......

      無障礙瀏覽 進入關懷版