<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<p id="oaefu"><li id="oaefu"><pre id="oaefu"></pre></li></p><cite id="oaefu"><rp id="oaefu"><form id="oaefu"></form></rp></cite>

<cite id="oaefu"><track id="oaefu"></track></cite>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

AI編程助手進化：先驗證再提交，程序員終于找到靠譜隊友

2026-04-21 10:55:18　來源: 真正能保護你的

四川舉報

0

分享至

就在剛剛，Anthropic 正式發布了 Claude Opus 4.7。

這不是一次「擠牙膏」式的小更新，有幾個核心能力的提升幅度。

下面說重點。

先說一個場景。

你有沒有遇到過這種情況，把一個復雜的 bug 丟給 AI，它給你一個看起來合理的答案，你照著改了，結果發現根本沒解決問題，甚至引入了新問題。

這是因為模型在「不確定」的時候，傾向于給你一個「看起來對」的答案，而不是真的去驗證。

Opus 4.7 在這里做了一個關鍵改變。

它會在匯報結果之前，主動驗證自己的輸出。

官方的描述是「devises ways to verify its own outputs before reporting back」。不是說說而已，是真的在訓練層面做了優化。

數字上怎么體現？

Cursor 的 CEO 說，在他們內部 benchmark 上，Opus 4.7 解決了 70% 的任務，Opus 4.6 是 58%。

Rakuten 的團隊說，Opus 4.7 解決的生產任務數量是 Opus 4.6 的 3 倍。

另一家公司在 93 個任務的編程測試里，Opus 4.7 比 Opus 4.6 提升了 13%，其中有 4 個任務是 Opus 4.6 和 Sonnet 4.6 都解不了的。

這些數字不是 Anthropic 自己說的，是合作伙伴在自己的真實業務場景里跑出來的。

還有一個細節我覺得很有意思。

Vercel 的工程師說，Opus 4.7 會在開始寫代碼之前，先對系統代碼做推導驗證。「這是我們在之前的 Claude 模型里從沒見過的行為。」

這不是優化，這是行為模式的改變。

這個升級我沒想到會這么大。

之前的 Claude 模型上限大概是 100 萬像素出頭。

直接翻了三倍多。

有一家做自動滲透測試的公司 XBOW，他們的視覺精度 benchmark 上，Opus 4.7 得了 98.5%，Opus 4.6 只有 54.5%。

他們說，「我們最大的痛點基本消失了，這解鎖了一整類之前沒法用它做的工作。」

從 54.5% 到 98.5%，這不是小幅提升，這是質變。

這個功能之前一直是 Claude 的短板。

它能在多個會話之間記住重要信息，并在新任務開始時主動調用這些記憶，減少每次都要重新交代背景的麻煩。

對于跑長期項目、多步驟 Agent 任務的用戶來說，這個改變是實質性的。

以前你每次開新對話，都要把項目背景重新說一遍。現在它記得。

這次同步上線了幾個新東西。

第一個，xhigh 推理等級。

介于 high 和 max 之間，給用戶更細的控制粒度。Claude Code 里已經把默認推理等級調到了 xhigh。

第二個，/ultrareview 命令。

在 Claude Code 里用，專門做代碼審查。會像一個認真的 reviewer 一樣讀完所有改動，標出 bug 和設計問題。Pro 和 Max 用戶有三次免費試用。

第三個，task budgets。

API 公測，讓開發者可以控制 Claude 在長任務里的 token 消耗分配。對于跑復雜 Agent 流程的團隊，這個功能很實用。

輸入 5 刀 / 百萬 token，輸出 25 刀 / 百萬 token。

和 Opus 4.6 一樣。

但官方特別提醒了一件事。

Opus 4.7 用了新的 tokenizer，同樣的輸入可能會消耗更多 token，大概是原來的 1.0 到 1.35 倍。另外在高推理等級下，它會輸出更多 token，因為它想得更深了。

價格單價沒變，但實際花費可能會漲。

官方建議遷移前先在真實流量上測一下，別直接切換。

他們的結論是，目前最強的模型 Claude Mythos Preview，網絡安全能力太強，風險太高，暫時不對外開放，只給少數合作伙伴用于防御性安全工作。

Opus 4.7 是第一個用來測試「新網絡安全防護機制」的模型。

它的網絡安全能力被刻意降低了。

官方的說法是，「我們從 Opus 4.7 的真實部署中學到的東西，將幫助我們最終實現 Mythos 級別模型的廣泛發布。」

換句話說，Opus 4.7 是一個試驗場。

Anthropic 在用它測試，當一個強大的模型被放出去，安全機制能不能真的兜住風險。

這個邏輯，我覺得比任何一個 benchmark 數字都更值得認真對待。

一家公司在主動給自己的模型「降能」，然后用真實用戶來驗證安全機制是否有效。

現在，Claude 官網、API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry，全部上線。

代碼能力，真實場景里提升幅度在 13% 到 3 倍之間，取決于任務類型。最關鍵的變化是它會主動驗證自己的輸出，不再只是給你一個「看起來對」的答案。

記憶能力，跨會話長期記憶專項優化，不用每次開新對話都重新交代背景。

新工具，xhigh 推理等級、/ultrareview 代碼審查命令、task budgets 三件套，對重度 Claude Code 用戶實用性很高。

價格，單價不變，但 tokenizer 更新后實際 token 消耗可能增加 1.0 到 1.35 倍。

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

神秘模型「大象」：僅100B拿下SOTA，Token效率超高！

量子位 2026-04-22 18:26:33
2 跟貼 2
實測在DeepSeek-V4上燒1000萬token，我發現了3個驚喜和1個意外

智東西 2026-04-24 19:01:13
1 跟貼 1

Agent中的“愛馬仕”來啦：100k+ Star 的開源AI Agent ，正在偷偷給自己升級

鈦媒體APP 2026-04-23 09:27:15
0 跟貼 0

Anthropic實錘Claude Code「降智」：就是這三個Bug造成的

機器之心Pro 2026-04-24 17:38:03
0 跟貼 0
挖漏洞何必Mythos，國產智能體早跑通了

量子位 2026-04-23 08:40:08
0 跟貼 0

00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0

支持遠程操控和通用GUI操作3

機器之心Pro 2026-03-02 13:36:13
0 跟貼 0
朱旻琦：具身智能用一天進化一天、聰明一天機器人普及核心痛點是需要二次開發和適配

財聯社 2026-04-17 16:59:02
0 跟貼 0

Meta員工淪為AI訓練工具人？小扎要強制監控員工鼠標、鍵盤

智東西 2026-04-24 22:09:34
0 跟貼 0
這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0
AI Agent是科技革命中的一次真正的范式轉移

量子位 2026-04-03 22:52:35
0 跟貼 0
專訪李修文：AI時代，更要孤絕地成為自己

新周刊 2026-04-24 21:04:20
0 跟貼 0
GPT-5.5發布：兩倍定價，半步進化

鈦媒體APP 2026-04-24 12:58:14
1 跟貼 1
Deepseek V4第一波測評來了！

華爾街見聞官方 2026-04-24 16:51:56
40 跟貼 40
山東醫藥大學通報“展某某學位證無法認證”：成立工作組調查核實

界面新聞 2026-04-24 06:53:49
5803 跟貼 5803
太心酸了！36歲程序員自述被裁經歷，從年薪四五十萬到被家人嫌棄

火山詩話 2026-04-20 07:13:56
945 跟貼 945
程序員找創業點子，為什么越聰明越找不到？

摸魚算法 2026-04-22 14:13:21
1 跟貼 1
半掛模型玩具車買菜，要是超重了怎么辦，雷軍都不敢這么設計！

宇宙搞笑生活 2026-04-23 14:10:00
4 跟貼 4
蘋果不講武德！iPhone18 屏幕偷偷縮水，強逼用戶買Pro版？

極果酷玩 2026-04-23 12:53:41
12 跟貼 12
程序員上班遭辭退，當場刪庫跑路讓公司癱瘓，這次不是賠錢的事了

笑咖小迷糊 2026-04-23 15:01:16
1 跟貼 1
助手機器人洛克默默打雜，一場機械入侵爆發，他竟成最強戰力！

特拉仔電影 2026-04-21 16:26:41
2 跟貼 2
謝孟偉參加選秀節目，成龍評價完助手之后，嘎子臉上有點掛不住了

星映館 2026-04-22 23:31:27
3 跟貼 3
找到了！伊朗真正的內鬼，根本不是人！中國也要小心

照亮你的前行之路 2026-04-24 18:29:32
11 跟貼 11
它喊著防止追尾，卻又有意急剎，設計這個邏輯的公司真無敵了！

旅行指南者 2026-04-20 09:47:38
0 跟貼 0
像梁文峰一樣誠實

象先志 2026-04-24 16:47:37
0 跟貼 0
DeepSeek V4登頂了！梁文鋒把四大技術秘方公開

智東西 2026-04-24 19:01:13
0 跟貼 0
大熊貓“平平”“福雙”將赴美國

新京報 2026-04-24 08:26:05
8237 跟貼 8237
兩個美國人幫朝鮮程序員"打工"，判了16年

全棧遛狗員 2026-04-24 10:43:00
2 跟貼 2
中際旭創市值突破1萬億，山東誕生新首富

中國能源網 2026-04-24 17:42:04
119 跟貼 119
全面進化！OPPO Find X9 Ultra首發評測

IT168 2026-04-22 17:31:34
0 跟貼 0
一個想被裁員的程序員，寫了什么

我是一個養蝦人 2026-04-22 16:17:14
3 跟貼 3
廈門一乘客酒后打車，支付了77276元車費，司機懵了，追著乘客退錢：不是自己的錢，一分也不能要

環球網資訊 2026-04-24 17:23:08
24 跟貼 24
你的一句好詭異，殊不知當年的程序員都要燃成舍利子了

娛樂呆小姐 2026-04-22 03:39:15
0 跟貼 0
“蘇超”烽煙再起，強強對話將現分水嶺

荔枝新聞 2026-04-24 16:43:10
47 跟貼 47
【硬核拆解Claude Code】為什么Claude是最強 Agent？四層架構 + 記憶壓縮 +

盧菁老師 2026-04-20 11:08:43
0 跟貼 0
特朗普用直升機送馬杜羅？尷尬邏輯引熱議

隱龍天下o 2026-04-23 06:43:03
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
讀懂濟南｜天龍大廈拆除，濟南站南廣場的“破局”與“重構”

齊魯壹點 2026-04-24 17:26:48
25 跟貼 25
問界M9行業首發車外后投影，車外交互能力再度進化

融煤資訊 2026-04-23 18:10:08
0 跟貼 0
美國移民“金卡”項目啟動至今僅一人獲批

央視新聞客戶端 2026-04-24 17:48:49
74 跟貼 74

爆料瘋傳！中南醫院“王護士長”被扒，她到底有沒有問題？

爆料瘋傳！中南醫院“王護士長”被扒，她到底有沒有問題？

千言娛樂記

2026-04-22 13:31:23

威脅對中國加征50%關稅！用對臺售武交換中國軍售伊朗否則免談

威脅對中國加征50%關稅！用對臺售武交換中國軍售伊朗否則免談

軍評陳光文

2026-04-24 22:27:35

實力藏不住了！中國尖端科技重磅問世，美媒感嘆：先進得不像國產

實力藏不住了！中國尖端科技重磅問世，美媒感嘆：先進得不像國產

瞻史

2026-04-22 19:38:16

2次毀約拒絕賠償，墨西哥再次找中國建高鐵，中國這次不再慣著

2次毀約拒絕賠償，墨西哥再次找中國建高鐵，中國這次不再慣著

小蘭聊歷史

2026-04-24 15:54:29

國家一級女演員陳麗云被逮捕！

許三歲

2026-03-28 09:24:30

馬蹄露迎來尊重，如今獲3位明星力挺，霍汶希毀掉英皇多年口碑

馬蹄露迎來尊重，如今獲3位明星力挺，霍汶希毀掉英皇多年口碑

娛貝勒

2026-04-24 21:57:58

五地迎來新任公安局長

上觀新聞

2026-04-24 16:31:04

只有秦昊能治孫楊，直男暴擊起來沒輕沒重

只有秦昊能治孫楊，直男暴擊起來沒輕沒重

陳意小可愛

2026-04-24 17:46:42

施明離世留市值千萬房產，長子全家獨占，還怪父親弟弟沒出喪禮錢

施明離世留市值千萬房產，長子全家獨占，還怪父親弟弟沒出喪禮錢

臨云史策

2026-04-24 14:13:09

天空體育預測英超34輪：阿森納1-0，曼聯2-1，利物浦2-1，熱刺1-2

天空體育預測英超34輪：阿森納1-0，曼聯2-1，利物浦2-1，熱刺1-2

郝小小看體育

2026-04-24 15:37:55

劉德華官宣！網友沸了

中國新聞周刊

2026-04-23 12:35:02

拿了錢還不放人！19歲花季少女被困柬埔寨56天，綁匪正臉照曝光！

拿了錢還不放人！19歲花季少女被困柬埔寨56天，綁匪正臉照曝光！

今朝牛馬

2026-04-07 22:43:23

八寶山有一座無名墓，高層一直保密，40多年后才公開身份

八寶山有一座無名墓，高層一直保密，40多年后才公開身份

談古論今歷史有道

2026-04-23 17:15:03

斯佳輝成笑柄，唯一出局種子輸得太窩囊！最強16強陣容歷史第三次

斯佳輝成笑柄，唯一出局種子輸得太窩囊！最強16強陣容歷史第三次

叮咚體壇

2026-04-24 09:49:05

我知道那兩名保安為啥不讓退伍老兵上廁所的原因

我知道那兩名保安為啥不讓退伍老兵上廁所的原因

筆桿論道

2026-04-23 01:25:03

個人收款被查了！2026年個人收款高于這個數，要小心！

個人收款被查了！2026年個人收款高于這個數，要小心！

新浪財經

2026-04-21 22:04:32

如果在家突發心梗，黃金6分鐘自救法，快了解，關鍵時刻可自救

如果在家突發心梗，黃金6分鐘自救法，快了解，關鍵時刻可自救

健康科普365

2026-01-20 16:05:03

重磅出臺！《武漢市城市更新條例》全文來了

重磅出臺！《武漢市城市更新條例》全文來了

越喬

2026-04-22 22:31:27

博主：韓佳奇、何宇鵬、吳少聰、楊立瑜現身基地進行康復訓練

博主：韓佳奇、何宇鵬、吳少聰、楊立瑜現身基地進行康復訓練

懂球帝

2026-04-24 19:19:21

騎士為何慘敗猛龍？賽后哈登毫不避諱說出真實原因，說的非常實在

騎士為何慘敗猛龍？賽后哈登毫不避諱說出真實原因，說的非常實在

翰飛觀事

2026-04-24 16:57:35

真正能保護你的

真正能保護你的

489文章數 170關注度

往期回顧全部

科技要聞

DeepSeek V4牽手華為，價格依然"屠夫級"

頭條要聞

賴清德面臨彈劾投票島內網友：不記名投票一定過

頭條要聞

賴清德面臨彈劾投票島內網友：不記名投票一定過

體育要聞

上海男籃23連勝+主場全勝姚明之后最強一季

娛樂要聞

停工16個月！趙露思證實接拍新劇

財經要聞

LG財閥內斗：百億美元商業帝國爭奪戰

汽車要聞

零跑Lafa5 Ultra北京車展上市：11.88-12.48萬

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

家居

旅游

公開課

軍事航空

藝術要聞

2025最繪畫--第四屆中國青年油畫作品展 | 油畫選刊（三）

家居要聞

自然肌理溫潤美學

浪漫協奏法式風格
極簡繪夢克制和諧
詩意光影窺見自然之境

旅游要聞

蓉城花正好 “我心中的成都最美賞花地”指南發布

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

軍事要聞

美伊陷入互相封鎖僵局

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：日韩中文字幕高清有码| 洋洋av| 河西区| 色欲久久久天天天综合网| 超碰AV在线| 成在线人视频免费视频| 国产精品无码mv在线观看| 精品一区二区成人精品| 人妻激情偷乱一区二区三区| 多人乱p视频在线免费观看| 欧美高清国产| 国产女人在线视频| 和黑人中出一区二区三区| 夜夜高潮天天爽欧美| 宁乡县| 天堂在线www天堂中文在线| 午夜黄色影院| 九九天堂网| 久久99精品久久久大学生| 国内精品极品久久免费看| 呦系列视频一区二区三区| 亚洲欧洲AV| 东京热无码av男人的天堂| 不卡的AV在线| 亚洲熟妇无码av在线播放| 国产女人18毛片水真多1| 国产无遮挡免费视频免费| 无码一区二区三区| 亚洲av鲁丝一区二区三区黄| 综合久久国产九一剧情麻豆| 91日韩在线| 成av免费大片黄在线观看| 日韩性色| 伊人不卡不卡| 亚洲丶国产丶欧美一区二区三区| 国产精品久久久福利| 电影蜜桃熟了| 国产亚洲成av人片在线观看下载| 成人片黄网站色大片免费毛片| 阿克陶县| 无套中出极品少妇白浆|

<thead id="2g3nz"><i id="2g3nz"><noscript id="2g3nz"></noscript></i></thead>

<blockquote id="2g3nz"><i id="2g3nz"><video id="2g3nz"></video></i></blockquote>

<s id="2g3nz"><li id="2g3nz"><menuitem id="2g3nz"></menuitem></li></s>