<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      剛剛,Claude Opus 4.7突然發布:不是最強,但奧特曼又得失眠

      0
      分享至


      今年 Anthropic 的勢頭異常兇猛。

      不僅熱度居高不下,口碑也持續攀升,穩坐 AI 圈「頂流」的交椅。現在幾乎每天醒來,都能看到他們準點推送的新產品或新功能。久而久之,大家也從興奮變成了「是你,果然又是你」的默契感。

      而就在剛剛,萬眾期待的 Claude Opus 4.7 也正式發布,依舊是熟悉的配方,熟悉的高分選手。


      有趣的是,Anthropic 在公告里非常坦誠,甚至帶著點驕傲:「這并非我們最強大的模型。」那個傳說強得可怕的 Claude Mythos Preview 依然還在藏。

      但就是這個并非最強的 Opus 4.7,卻依舊引發了極大的關注。因為它解決了一個比聰明更重要的痛點:靠譜。不是那種你說什么它就做什么的靠譜,而是當你提出一個愚蠢的方案時,它敢于反駁你,并自己把坑填上的靠譜。

      當靠譜成為比聰明更稀缺的品質

      基準測試結果顯示,在業界公認最硬核的 SWE-bench Pro 上,4.7 從前代的 53.4% 直接拉到 64.3%,單代升級漲了近 11 個百分點,把 GPT-5.4(57.7%)和 Gemini 3.1 Pro(54.2%)都甩在了身后。

      視覺推理的 CharXiv 基準從 69.1% 跳到 82.1%,對應的是它新獲得的 2576 像素長邊識別能力——清晰度是前代的 3 倍以上。

      這不只是「看得更清楚」這么簡單。更高的分辨率直接帶動了輸出質量的連鎖提升:生成界面、制作幻燈片、排版文檔,細節精度也全面提升。

      工具調用規模化評測 MCP-Atlas 上,4.7 跑出 77.3%,超過 GPT-5.4 的 68.1% 和 Gemini 的 73.9%。法律 AI 平臺 Harvey 測試中,4.7 在 BigLaw 基準上拿下 90.9%,正確區分了歷來是前沿模型死穴的「轉讓條款」與「控制權變更條款」。


      不過,4.7 也并非全然遙遙領先,在 Agentic search 評測 BrowseComp 上,4.7 反而從前代的 83.7% 下降到了 79.3%,被 GPT-5.4(89.3%)和 Gemini(85.9%)超越。

      這個退步并非偶然。一個遇到缺失信息會直接報錯、不肯亂編答案的 Agent,在以「是否給出答案」為評判標準的基準上,天然會吃虧。

      而數據之外,更值得關注的問題是:這種「靠譜」,在真實工作里到底意味著什么?

      過去一年,業界對代碼大模型的期待,普遍還停留在「寫個函數、找個 Bug」的層面,但 Claude 4.7 在早期測試里,展現出了一種截然不同的氣質。

      知名云端開發平臺 Replit 的負責人這樣描述:「它在技術討論中會反駁我,幫我做出更好的決定。它真的感覺像一個更好的同事。」


      它不再一味地「唯命是從」,也不再為了交差而胡編亂造。在數據科學平臺 Hex 的測試里,4.7 遇到缺失數據時會直接報錯,而不是像前代那樣塞一個「看似合理但完全錯誤」的備選值。Hex 團隊甚至直言:「低消耗狀態下的 4.7,等同于中等消耗狀態下的 4.6。」

      這種「拒絕順從」的特質,恰恰是高級軟件工程里最稀缺的東西。

      當然,凡事有兩面。為舊模型寫的 prompt,到了 4.7 手里可能會產生意想不到的結果。那些過去被模型「意會」掉的模糊指令,4.7 會一字一字地字面執行。這也意味著越懂得清楚表達需求的人,越能從 4.7 這里拿到好結果。

      光會「頂嘴」還不夠,遇到挫折就罷工的 AI 同樣不是好同事。4.7 的另一個大的變化,是任務韌性。


      以往大模型在多步任務中遇到工具調用失敗,往往直接停機報錯。Notion 團隊測試發現,4.7 的工具錯誤率降到了原來的三分之一,更關鍵的是,它能在工具鏈崩潰時自己繞過障礙,繼續把任務跑完。

      當 AI 停止諂媚,真正的生產力才開始爆發。

      Anthropic 公布的一個極端案例里,4.7 在沒有任何人類干預的情況下,從零構建了一個完整的 Rust 文本轉語音引擎——寫神經網絡模型、SIMD 內核和瀏覽器演示,還自己把輸出喂給語音識別器做驗證,連測試都一并完成了。

      前端框架巨頭 Vercel 還發現了一個過去從未有過的行為:4.7 會在開始寫系統級代碼之前,先自己進行數學證明。這已經超出了寫代碼的范疇,進入了嚴謹工程設計的領域。

      雇傭 AI「資深專家」的代價

      為了驗證它在細節上的處理能力,我設定了三個前端交互場景,評判標準只有一個:細節是否敷衍,一眼便知。

      第一個場景,是讓它做一個俯視視角的黑膠唱片機界面,其難點在于「金屬光澤」與「呼吸光暈」的呈現。4.7 并沒有用廉價的色彩漸變敷衍了事,而是通過復雜的 CSS 樣式疊加,逼真地還原了金屬質感。


      第二個場景是只用 CSS,不用 JavaScript 做一個老式電風扇。 面對這個限制嚴格的題目,一些模型會悄悄違規使用 JS,但 4.7 遵守了規則。它用純 CSS 做出了風扇的立體結構,低中高三檔過渡流暢,底座透視和陰影的處理也真有一點實物感,它在規則允許的范圍內找到了很好的解決辦法。


      第三個場景是做一個復古磁帶隨身聽,帶有錄像帶那種老舊的噪點效果。磁帶轉動的細節也是有的。


      當然,變聰明是有代價的。Opus 4.7 現已在所有 Claude 產品和 API、Amazon Bedrock、Google Cloud 的 Vertex AI 以及 Microsoft Foundry 平臺上推出。

      基礎定價維持在每百萬輸入 5 美元、輸出 25 美元不變。但 4.7 引入了全新分詞器,同樣的文本會拆分出比原來多 1.0 到 1.35 倍的 Token。


      疊加上它在高強度任務中本身就傾向于「多想一會兒」,實際消耗幾乎必然上升。

      此外,Anthropic 在原有的難度選項之上,加入了全新的 xhigh(超高)級別。在這個級別下,面對復雜難題,Claude 4.7 會消耗更多的 Token,花更多的時間去「思考」。Claude Code 已經把所有套餐的默認 effort level 直接拉到了 xhigh。

      Anthropic 用行動告訴所有人,對于真正的編碼任務,省著用不如想清楚。

      為了匹配這種工作流,Claude Code 順勢推出了兩個殺手級功能:

      /ultrareview(深度審查):開啟一個專門的審查會話,像一個極其挑剔的資深 Reviewer 一樣,通讀所有代碼更改,精準標記出深層的架構設計缺陷和 Bug。Pro 和 Max 用戶可以免費試用三次。

      Auto Mode(自動模式)擴展到 Max 用戶:一種介于「逐項授權」和「跳過所有權限」之間的新權限模式。Claude 會在你授權的范圍內自主做決策,既能跑完漫長無聊的任務,又比完全放權更安全。

      為了防止這個「太能思考」的 AI 把賬戶余額刷爆,API 端還推出了「任務預算」(Task Budgets)功能公測版,讓開發者可以顯式規劃 Claude 在長任務中的 Token 支出優先級。


      當然,4.7 并不是 Anthropic 手里最強的牌。

      那個更強的 Claude Mythos Preview,本月剛以「Project Glasswing」的名義,小范圍開放給了一批企業用于網絡安全研究。Mythos 沒有公開發布,原因則是因為它的網絡攻防能力太強,Anthropic 覺得還沒想清楚怎么安全地推給所有人。

      4.7 本身也做了主動取舍,訓練階段就壓低了網絡攻防能力,內置自動攔截機制,碰到高風險請求直接擋掉。有合規需求的安全研究人員,可以通過官方渠道單獨申請。

      不急著把最強的牌打出去,和不停地往桌上加新牌,背后是同一套邏輯。實際上,Anthropic 真正的護城河,是交付節奏本身。

      在今年 2 月 1 日至 3 月 24 日,短短 52 天里,Anthropic 一共更新了 74 款產品,平均不到兩天一個。Cowork、插件……這些動作扎扎實實地擊中了職場辦公的痛點。

      如今的 Claude 生態,早就超越了單純的「聊天機器人」。對于那些渴望將 AI 深度嵌入實際工作流的團隊而言,這種穩定、高頻且可預期的更新節奏,才是最讓人感到踏實的定心丸。

      今天發布的 Claude 4.7,是這條鏈條上最新的一塊壓艙石。而那個 Mythos Preview,遲早也會來。到那時候,我們現在覺得已經很能打的 4.7,可能只是個開端。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      失業后在小縣城的兩年發現,打麻將和性生活才是普通人底色!

      失業后在小縣城的兩年發現,打麻將和性生活才是普通人底色!

      黯泉
      2026-04-01 17:44:20
      政治局會議,傳遞三重利好

      政治局會議,傳遞三重利好

      劉勝軍經濟學大局觀
      2026-04-28 15:41:45
      馬云預言又應驗!若無意外,2026年后,中國房地產或迎來3大轉變

      馬云預言又應驗!若無意外,2026年后,中國房地產或迎來3大轉變

      石辰搞笑日常
      2026-04-29 01:26:00
      5月1日正式開刀!3萬就立案,所有打工人都要警惕

      5月1日正式開刀!3萬就立案,所有打工人都要警惕

      洞見小能手
      2026-04-27 21:17:44
      5月1日起全面嚴查!紅包轉賬新規落地,所有人都要注意這幾條紅線

      5月1日起全面嚴查!紅包轉賬新規落地,所有人都要注意這幾條紅線

      混沌錄
      2026-04-28 22:08:15
      難怪民進黨氣得跳腳也不敢抓鄭麗文,她背后的保護傘,讓綠營絕望

      難怪民進黨氣得跳腳也不敢抓鄭麗文,她背后的保護傘,讓綠營絕望

      阿器談史
      2026-04-27 09:01:44
      濱州潤達城市發展集團有限公司原黨委書記、董事長竇利濱被查

      濱州潤達城市發展集團有限公司原黨委書記、董事長竇利濱被查

      齊魯壹點
      2026-04-28 11:07:07
      西多夫:阿方索手球絕不是點球;阿森納經常零封很可能奪冠

      西多夫:阿方索手球絕不是點球;阿森納經常零封很可能奪冠

      懂球帝
      2026-04-29 06:40:09
      萬達影院易主,賣完80個廣場還欠6000億,71歲王健林比許家印爺們

      萬達影院易主,賣完80個廣場還欠6000億,71歲王健林比許家印爺們

      毒sir財經
      2026-04-28 22:10:24
      千萬粉絲網紅白冰偷稅超900萬元被查,用公司購買個人使用的奢侈品,白冰多平臺賬號仍可正常關注

      千萬粉絲網紅白冰偷稅超900萬元被查,用公司購買個人使用的奢侈品,白冰多平臺賬號仍可正常關注

      極目新聞
      2026-04-28 11:20:23
      提前截胡網易!完美搶先拿下都市開放世界,年流水預估30億

      提前截胡網易!完美搶先拿下都市開放世界,年流水預估30億

      17173游戲網
      2026-04-27 14:15:37
      湖人瞄準年輕中鋒補強陣容,東契奇要"快"不要"等"

      湖人瞄準年輕中鋒補強陣容,東契奇要"快"不要"等"

      熱血體育社
      2026-04-29 05:32:01
      5月1日起施行!存款12萬-50萬注意,利息存取全改,這樣存不虧!

      5月1日起施行!存款12萬-50萬注意,利息存取全改,這樣存不虧!

      老特有話說
      2026-04-28 18:10:54
      兩性關系:55-65歲這十年,惜命最好的方式,不是鍛煉,而是這6點

      兩性關系:55-65歲這十年,惜命最好的方式,不是鍛煉,而是這6點

      周哥一影視
      2026-04-17 06:45:59
      紋身女孩曬“考公第一步”,被嘲低認知:考公要學習的,你知道嗎

      紋身女孩曬“考公第一步”,被嘲低認知:考公要學習的,你知道嗎

      妍妍教育日記
      2026-04-27 10:25:03
      深圳市委書記靳磊到華為、比亞迪等走訪調研

      深圳市委書記靳磊到華為、比亞迪等走訪調研

      界面新聞
      2026-04-28 07:33:45
      基米希:沒想到比賽會如此開放;巴黎看起來很累,還拖延時間

      基米希:沒想到比賽會如此開放;巴黎看起來很累,還拖延時間

      懂球帝
      2026-04-29 06:40:09
      71.5%!歷史性暴跌,以貸養貸的泡沫崩了

      71.5%!歷史性暴跌,以貸養貸的泡沫崩了

      月滿大江流
      2026-04-16 13:54:38
      為什么男人每次偷情要開房,女人每次偷情都在車里呢?

      為什么男人每次偷情要開房,女人每次偷情都在車里呢?

      思絮
      2026-04-28 10:25:11
      10年麻將館老板囗述:凡是愛打麻將的,沒有一個人日子是過得好的

      10年麻將館老板囗述:凡是愛打麻將的,沒有一個人日子是過得好的

      小噎論事
      2026-04-24 17:15:21
      2026-04-29 07:04:49
      愛范兒 incentive-icons
      愛范兒
      消費科技第一媒體
      38782文章數 2601575關注度
      往期回顧 全部

      科技要聞

      10億周活目標落空!傳OpenAI爆發內部分歧

      頭條要聞

      美國禁止本國個人或實體向伊朗繳納霍爾木茲通行費

      頭條要聞

      美國禁止本國個人或實體向伊朗繳納霍爾木茲通行費

      體育要聞

      魔術黑八活塞,一步之遙?!

      娛樂要聞

      蔡卓妍官宣結婚,老公比她小10歲

      財經要聞

      中央政治局會議定調,八大看點速覽!

      汽車要聞

      拒絕瘋狂套娃!現代艾尼氪金星長在未來審美點上

      態度原創

      手機
      健康
      游戲
      教育
      家居

      手機要聞

      一加 Ace6至尊版深度評測:雙形態一槍封神,射擊游戲旗艦的新標桿!

      干細胞治療燒燙傷三大優勢!

      PS6最大賣點曝光!高端PC終于能平替了

      教育要聞

      人生如何選擇要結合自身實際情況

      家居要聞

      江景風格 流動的秩序

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 妇女自拍偷自拍亚洲精品| 免费观看的av毛片的网站| 上杭县| 免费国产女王调教在线视频 | 91丨国产丨精品丨丝袜| 亚洲欧美成aⅴ人在线观看| 人人玩人人添人人澡超碰| 政和县| 免费看国产曰批40分钟| 成人自拍偷拍| www.av小说| 精品无码人妻| 国产在线精选免费视频8x| 无码视屏| 久久综合88中文色鬼| 天天弄天天模| 江达县| 亚洲色成人网站www永久| 亚洲av伊人久久青青草原 | 天堂中文最新版在线官网在线| 好吊妞这里有精品| 一本色道久久综合亚洲精品按摩 | 爆乳日韩尤物无码一区| 国产一区二区三区免费在线观看 | 欧美人妻aⅴ中文字幕| 国产av最新一区二区| 人人做人人妻人人精| 48沈阳熟女高潮嗷嗷叫| 兖州市| 久久亚洲熟女cc98cm| 亚洲人妻av| 中文字幕乱码中文乱码51精品| 一本一道狠狠躁东京热| 国产成人一区二区三区免费| 人妻无码中文字幕| 色偷偷男人的天堂亚洲av| 国产麻豆91网在线看| 久久婷婷国产精品香蕉| 中文字幕一区二区三区人妻少妇| 精品熟女亚洲av在线观看| 中国china体内裑精亚洲日本|