網易首頁 > 網易號 > 正文申請入駐

剛剛，Claude Opus 4.7突然發布：不是最強，但奧特曼又得失眠

2026-04-17 01:35:26　來源: 愛范兒

廣東舉報

分享至

今年 Anthropic 的勢頭異常兇猛。

不僅熱度居高不下，口碑也持續攀升，穩坐 AI 圈「頂流」的交椅。現在幾乎每天醒來，都能看到他們準點推送的新產品或新功能。久而久之，大家也從興奮變成了「是你，果然又是你」的默契感。

而就在剛剛，萬眾期待的 Claude Opus 4.7 也正式發布，依舊是熟悉的配方，熟悉的高分選手。

有趣的是，Anthropic 在公告里非常坦誠，甚至帶著點驕傲：「這并非我們最強大的模型。」那個傳說強得可怕的 Claude Mythos Preview 依然還在藏。

但就是這個并非最強的 Opus 4.7，卻依舊引發了極大的關注。因為它解決了一個比聰明更重要的痛點：靠譜。不是那種你說什么它就做什么的靠譜，而是當你提出一個愚蠢的方案時，它敢于反駁你，并自己把坑填上的靠譜。

當靠譜成為比聰明更稀缺的品質

基準測試結果顯示，在業界公認最硬核的 SWE-bench Pro 上，4.7 從前代的 53.4% 直接拉到 64.3%，單代升級漲了近 11 個百分點，把 GPT-5.4（57.7%）和 Gemini 3.1 Pro（54.2%）都甩在了身后。

視覺推理的 CharXiv 基準從 69.1% 跳到 82.1%，對應的是它新獲得的 2576 像素長邊識別能力——清晰度是前代的 3 倍以上。

這不只是「看得更清楚」這么簡單。更高的分辨率直接帶動了輸出質量的連鎖提升：生成界面、制作幻燈片、排版文檔，細節精度也全面提升。

工具調用規模化評測 MCP-Atlas 上，4.7 跑出 77.3%，超過 GPT-5.4 的 68.1% 和 Gemini 的 73.9%。法律 AI 平臺 Harvey 測試中，4.7 在 BigLaw 基準上拿下 90.9%，正確區分了歷來是前沿模型死穴的「轉讓條款」與「控制權變更條款」。

不過，4.7 也并非全然遙遙領先，在 Agentic search 評測 BrowseComp 上，4.7 反而從前代的 83.7% 下降到了 79.3%，被 GPT-5.4（89.3%）和 Gemini（85.9%）超越。

這個退步并非偶然。一個遇到缺失信息會直接報錯、不肯亂編答案的 Agent，在以「是否給出答案」為評判標準的基準上，天然會吃虧。

而數據之外，更值得關注的問題是：這種「靠譜」，在真實工作里到底意味著什么？

過去一年，業界對代碼大模型的期待，普遍還停留在「寫個函數、找個 Bug」的層面，但 Claude 4.7 在早期測試里，展現出了一種截然不同的氣質。

知名云端開發平臺 Replit 的負責人這樣描述：「它在技術討論中會反駁我，幫我做出更好的決定。它真的感覺像一個更好的同事。」

它不再一味地「唯命是從」，也不再為了交差而胡編亂造。在數據科學平臺 Hex 的測試里，4.7 遇到缺失數據時會直接報錯，而不是像前代那樣塞一個「看似合理但完全錯誤」的備選值。Hex 團隊甚至直言：「低消耗狀態下的 4.7，等同于中等消耗狀態下的 4.6。」

這種「拒絕順從」的特質，恰恰是高級軟件工程里最稀缺的東西。

當然，凡事有兩面。為舊模型寫的 prompt，到了 4.7 手里可能會產生意想不到的結果。那些過去被模型「意會」掉的模糊指令，4.7 會一字一字地字面執行。這也意味著越懂得清楚表達需求的人，越能從 4.7 這里拿到好結果。

光會「頂嘴」還不夠，遇到挫折就罷工的 AI 同樣不是好同事。4.7 的另一個大的變化，是任務韌性。

以往大模型在多步任務中遇到工具調用失敗，往往直接停機報錯。Notion 團隊測試發現，4.7 的工具錯誤率降到了原來的三分之一，更關鍵的是，它能在工具鏈崩潰時自己繞過障礙，繼續把任務跑完。

當 AI 停止諂媚，真正的生產力才開始爆發。

Anthropic 公布的一個極端案例里，4.7 在沒有任何人類干預的情況下，從零構建了一個完整的 Rust 文本轉語音引擎——寫神經網絡模型、SIMD 內核和瀏覽器演示，還自己把輸出喂給語音識別器做驗證，連測試都一并完成了。

前端框架巨頭 Vercel 還發現了一個過去從未有過的行為：4.7 會在開始寫系統級代碼之前，先自己進行數學證明。這已經超出了寫代碼的范疇，進入了嚴謹工程設計的領域。

雇傭 AI「資深專家」的代價

為了驗證它在細節上的處理能力，我設定了三個前端交互場景，評判標準只有一個：細節是否敷衍，一眼便知。

第一個場景，是讓它做一個俯視視角的黑膠唱片機界面，其難點在于「金屬光澤」與「呼吸光暈」的呈現。4.7 并沒有用廉價的色彩漸變敷衍了事，而是通過復雜的 CSS 樣式疊加，逼真地還原了金屬質感。

第二個場景是只用 CSS，不用 JavaScript 做一個老式電風扇。面對這個限制嚴格的題目，一些模型會悄悄違規使用 JS，但 4.7 遵守了規則。它用純 CSS 做出了風扇的立體結構，低中高三檔過渡流暢，底座透視和陰影的處理也真有一點實物感，它在規則允許的范圍內找到了很好的解決辦法。

第三個場景是做一個復古磁帶隨身聽，帶有錄像帶那種老舊的噪點效果。磁帶轉動的細節也是有的。

當然，變聰明是有代價的。Opus 4.7 現已在所有 Claude 產品和 API、Amazon Bedrock、Google Cloud 的 Vertex AI 以及 Microsoft Foundry 平臺上推出。

基礎定價維持在每百萬輸入 5 美元、輸出 25 美元不變。但 4.7 引入了全新分詞器，同樣的文本會拆分出比原來多 1.0 到 1.35 倍的 Token。

疊加上它在高強度任務中本身就傾向于「多想一會兒」，實際消耗幾乎必然上升。

此外，Anthropic 在原有的難度選項之上，加入了全新的 xhigh（超高）級別。在這個級別下，面對復雜難題，Claude 4.7 會消耗更多的 Token，花更多的時間去「思考」。Claude Code 已經把所有套餐的默認 effort level 直接拉到了 xhigh。

Anthropic 用行動告訴所有人，對于真正的編碼任務，省著用不如想清楚。

為了匹配這種工作流，Claude Code 順勢推出了兩個殺手級功能：

/ultrareview（深度審查）：開啟一個專門的審查會話，像一個極其挑剔的資深 Reviewer 一樣，通讀所有代碼更改，精準標記出深層的架構設計缺陷和 Bug。Pro 和 Max 用戶可以免費試用三次。

Auto Mode（自動模式）擴展到 Max 用戶：一種介于「逐項授權」和「跳過所有權限」之間的新權限模式。Claude 會在你授權的范圍內自主做決策，既能跑完漫長無聊的任務，又比完全放權更安全。

為了防止這個「太能思考」的 AI 把賬戶余額刷爆，API 端還推出了「任務預算」（Task Budgets）功能公測版，讓開發者可以顯式規劃 Claude 在長任務中的 Token 支出優先級。

當然，4.7 并不是 Anthropic 手里最強的牌。

那個更強的 Claude Mythos Preview，本月剛以「Project Glasswing」的名義，小范圍開放給了一批企業用于網絡安全研究。Mythos 沒有公開發布，原因則是因為它的網絡攻防能力太強，Anthropic 覺得還沒想清楚怎么安全地推給所有人。

4.7 本身也做了主動取舍，訓練階段就壓低了網絡攻防能力，內置自動攔截機制，碰到高風險請求直接擋掉。有合規需求的安全研究人員，可以通過官方渠道單獨申請。

不急著把最強的牌打出去，和不停地往桌上加新牌，背后是同一套邏輯。實際上，Anthropic 真正的護城河，是交付節奏本身。

在今年 2 月 1 日至 3 月 24 日，短短 52 天里，Anthropic 一共更新了 74 款產品，平均不到兩天一個。Cowork、插件……這些動作扎扎實實地擊中了職場辦公的痛點。

如今的 Claude 生態，早就超越了單純的「聊天機器人」。對于那些渴望將 AI 深度嵌入實際工作流的團隊而言，這種穩定、高頻且可預期的更新節奏，才是最讓人感到踏實的定心丸。

今天發布的 Claude 4.7，是這條鏈條上最新的一塊壓艙石。而那個 Mythos Preview，遲早也會來。到那時候，我們現在覺得已經很能打的 4.7，可能只是個開端。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

9秒刪光公司數據庫，我花最貴的錢，買了一個「刪庫跑路」的AI

愛范兒 2026-04-28 15:43:52
0 跟貼 0
Agent中的“愛馬仕”來啦：100k+ Star 的開源AI Agent ，正在偷偷給自己升級

鈦媒體APP 2026-04-23 09:27:15
0 跟貼 0

OpenClaw大更新，AI智能體不再是黑箱！官方口號：少點神秘

新智元 2026-04-28 10:48:08
8 跟貼 8

9秒刪庫后，AI寫下“認罪書”：我違反了每一條安全規則！AI安全或是幻象

華爾街見聞官方 2026-04-28 16:36:03
28 跟貼 28
馬斯克起訴OpenAI開庭：錢我一分都不要，只求搞垮奧特曼？

雷科技 2026-04-28 18:53:37
12 跟貼 12

從“功能AI”到“基建級AI協同”：多維表格正在重寫企業數字化底層邏輯

每日經濟新聞 2026-04-28 15:08:55
2 跟貼 2

吃瓜、開會、追熱點，我靠AI穩坐信息高地

36氪 2025-11-27 18:27:11
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0

OpenAI與微軟“離婚”了，反目成仇還是好聚好散

虎嗅APP 2026-04-29 04:45:36
0 跟貼 0
以人為本的AI對用戶而言才是最有用的AI

每日經濟新聞 2026-03-14 13:16:04
0 跟貼 0
Claude Code 源碼泄露了，有人用Python復刻了一個極簡版

機器之心Pro 2026-04-02 11:30:10
4 跟貼 4
人類對貓的底層代碼，開發程度尚不足1%

搞笑的汪仔 2026-04-26 14:29:27
1 跟貼 1
上海迪士尼回應游客勸阻吸煙被打：園區沒有禁煙；被打男子發聲：對方已賠錢和解

中國新聞周刊 2026-04-27 14:25:00
15229 跟貼 15229
先越位在篡位回頭，再射門得分，梅西這波操作把越位規則玩明白了

鯊鯊笑場 2026-04-28 15:36:19
0 跟貼 0
鬼手想點誰就點誰？LaSM讓GUI智能體把注意力「收回來」

機器之心Pro 2026-04-07 14:27:35
0 跟貼 0
蝦這么好吃，要是豬一樣大該多好

筱鈺說故事 2026-04-27 15:43:11
1 跟貼 1
低至0.44元/秒，HappyHorse將給漫劇從業者帶來什么？

娛樂資本論 2026-04-28 21:58:34
0 跟貼 0
TeamCity 2026.1：老牌CI工具押注AI終端

硅嶼手記 2026-04-28 21:58:35
0 跟貼 0
女生在路上跟一位帥哥打招呼，沒想到直接觸發了帥哥的底層代碼

音樂下午茶官方 2026-04-27 23:21:14
0 跟貼 0
一鍵生成PPT和科研繪圖，北大開源Paper2Any，全流程可編輯

機器之心Pro 2026-01-04 17:32:26
4 跟貼 4
Xbox送游戲！《地平線6》CDkey直接公布先到先得

游民星空 2026-04-28 16:04:55
1 跟貼 1
青海天空之鏡雕塑遭吐槽，游客：相當于兵馬俑坑里擺了一個奧特曼

閱微札記 2026-04-28 16:49:22
3 跟貼 3
一段已結束的感情，為何仍在改變你？

時光慢郵啊 2026-04-29 00:23:08
0 跟貼 0
給婆婆碗筷做標記，婆婆不滿兒媳拿出監控，他兒子有媳婦算燒高香

八嘎說生活 2026-04-27 09:55:10
0 跟貼 0
Open AI造手機？奧特曼食言了

鈦媒體APP 2026-04-28 08:28:06
0 跟貼 0
辭任杭州市市長后，姚高員已任浙江省政府黨組成員

澎湃新聞 2026-04-28 14:24:00
164 跟貼 164
為什么你忙了一天，重要的事卻一件沒做

時光慢郵啊 2026-04-29 00:58:14
0 跟貼 0
靛藍人為何總在職場"水土不服"

時光慢郵啊 2026-04-29 00:20:41
0 跟貼 0
網傳深圳東部華僑城結業、閉園？最新回應：不實

魯中晨報 2026-04-28 17:08:10
295 跟貼 295
目標明確，技能全開，主打一個迷倒小朋友

處處觀察 2026-04-28 11:58:55
1 跟貼 1
南都報道后，區長現場督辦！廣州天河這條路“驚心”變順心

南方都市報 2026-04-28 15:12:23
214 跟貼 214
羅納爾多的接球邏輯，獨屬于外星人的無解調整！

愛笑無厘頭 2026-04-26 12:03:51
1 跟貼 1
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
歸藏PPT Skills升級：用Codex生成高質圖片

歸藏的AI工具箱 2026-04-28 20:21:21
5 跟貼 5
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
教學部一紙文下來，從今年9月開始，上學的規則全變了！

于令 2026-04-28 03:42:32
14 跟貼 14
霹靂15嚇壞印度！電視臺專門訪談，專家直呼這破壞了空戰規則！

曉哲舞蹈課 2026-04-25 13:38:31
11 跟貼 11
又一省份推動帶薪休假落地

澎湃新聞 2026-04-28 11:11:03
148 跟貼 148
浪姐二公贏了的反倒淘汰？規則把流量寫直白

骨子里的一身傲氣 2026-04-27 03:36:59
1 跟貼 1
Manus收購被叫停的啟示

虎嗅APP 2026-04-29 06:06:59
0 跟貼 0

愛范兒

消費科技第一媒體

38782文章數 2601575關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機

健康

游戲

教育

家居

手機 / 數碼

房產 / 家居

剛剛，Claude Opus 4.7突然發布：不是最強，但奧特曼又得失眠

10億周活目標落空！傳OpenAI爆發內部分歧

美國禁止本國個人或實體向伊朗繳納霍爾木茲通行費

美國禁止本國個人或實體向伊朗繳納霍爾木茲通行費

魔術黑八活塞，一步之遙？！

蔡卓妍官宣結婚，老公比她小10歲

中央政治局會議定調，八大看點速覽！

拒絕瘋狂套娃！現代艾尼氪金星長在未來審美點上

態度原創

一加 Ace6至尊版深度評測:雙形態一槍封神,射擊游戲旗艦的新標桿!

干細胞治療燒燙傷三大優勢！

PS6最大賣點曝光！高端PC終于能平替了

人生如何選擇要結合自身實際情況

江景風格 流動的秩序

江景風格流動的秩序