![]()
新智元報(bào)道
編輯:桃子
【新智元導(dǎo)讀】Opus 4.7如期而至,編程全面暴打GPT-5.1!CC之父親授的性能榨干秘籍,更重磅的是,全新系統(tǒng)級(jí)提示詞已在全網(wǎng)瘋傳。
Claude Opus 4.7,如期而至!
距離上一代Opus 4.6,才過去兩個(gè)月。迄今為止最強(qiáng)的Opus,直接取而代之。
![]()
在各大基準(zhǔn)測(cè)試中,Opus 4.7在Mythos面前,略顯遜色。
但相較于前作4.6,全新Opus性能實(shí)現(xiàn)了全方位提升,尤其是視覺推理,堪稱無「模」能敵。
![]()
![]()
尤其是,在編程擂臺(tái)上,Opus 4.7全面暴打Gemini 3 Pro、GPT-5.1。
SWE-bench Verified達(dá)87.6%、SWE-bench Pro為64.3%。
![]()
![]()
這不,Claude Code之父Boris Cherny就在剛剛,分享了Opus 4.7的最佳實(shí)踐。
如今,手握最強(qiáng)「大腦」,如何榨干其性能,秘籍全藏在這里了。
![]()
Opus 4.7最佳實(shí)踐,CC之父親授
在交互邏輯上,Claude Opus 4.7發(fā)生了微妙的變化。
因?yàn)椋讲捎昧恕溉路衷~器」,在高強(qiáng)度模式下,更傾向于思考,同時(shí)會(huì)消耗很多token。
![]()
因此在第一次對(duì)話時(shí),就要提供詳盡的任務(wù)描述,包括意圖、約束條件、驗(yàn)收標(biāo)準(zhǔn),以及文件具體路徑。
一次性給足上下文,比分多輪逐步引導(dǎo),更加高效且高質(zhì)。
尤其是,對(duì)于信任度較高的任務(wù),直接切換到「Auto Mode」,極大縮短反饋周期。
![]()
這一次,Opus 4.7還引入了全新的「Effort分級(jí)」設(shè)置,默認(rèn)檔位升級(jí)為xhigh,專為智能體任務(wù)設(shè)計(jì)。
下表中,Gemini根據(jù)不同級(jí)別試用場(chǎng)景,以及核心特點(diǎn)做了一個(gè)總結(jié)。
![]()
![]()
不過,在切換到Opus 4.7使用后,還需自己根據(jù)任務(wù)難度,靈活切換Effort等級(jí),不要死守一個(gè)舊設(shè)置。
沃頓商學(xué)院教授Ethan Mollick,用了max最大思考模式下,Opus 4.7表現(xiàn)極其驚艷。
![]()
在網(wǎng)頁設(shè)計(jì)上,Opus 4.7同樣非常出色。
![]()
該思考時(shí),再思考
此外,Claude Opus 4.7 移除了「固定思考預(yù)算」的限制,直接采用了「自適應(yīng)思考」。
這意味著,模型能自主判斷——
簡(jiǎn)單的查詢直接回答,復(fù)雜的步驟則重金投入思考Token
![]()
三大秘籍,榨干性能
除了官方這篇博文,最近幾周,CC之父一直在深度體驗(yàn)(Dogfooding)Opus 4.7,感覺生產(chǎn)力爆表。
為了讓每個(gè)人也能充分榨干4.7的性能,他還分享了一些進(jìn)階技巧。
![]()
首先是 「自動(dòng)模式」,這徹底終結(jié)了頻繁的授權(quán)彈窗。
Opus 4.7擅長(zhǎng)處理深研、代碼重構(gòu)、構(gòu)建復(fù)雜功能等長(zhǎng)耗時(shí)任務(wù)。
以前你得守在屏幕前不斷點(diǎn)擊確認(rèn),現(xiàn)在它能一口氣跑到底,直到達(dá)成性能指標(biāo)。
配合新推出的/fewer-permission-prompts指令,它會(huì)自動(dòng)掃描會(huì)話歷史,識(shí)別那些安全但重復(fù)的Bash或MCP命令,并建議將它們加入白名單,讓操作流程如絲般順滑。
![]()
其次,「摘要回顧」(Recaps)功能。
針對(duì)長(zhǎng)時(shí)間運(yùn)行的智能體任務(wù),系統(tǒng)會(huì)生成簡(jiǎn)短摘要,告訴你它做了什么以及下一步打算做什么。
當(dāng)你離開幾小時(shí)后重新回到終端,這個(gè)功能簡(jiǎn)直是救星。
![]()
同時(shí),「專注模式」(Focus mode)能夠隱藏所有中間執(zhí)行過程,只展示最終結(jié)果。
Boris表示,Opus 4.7現(xiàn)在的可靠性已極高,他完全信任模型去執(zhí)行指令,直接看「療效」即可。
![]()
最后是,核心的 「自適應(yīng)思考」調(diào)節(jié),也就是如上提到的。
可通過/effort命令在不同等級(jí)間切換:低努力程度響應(yīng)更快、更省Token;
而Boris個(gè)人推薦,在處理多數(shù)任務(wù)時(shí)使用「極高(xhigh)」,在解決最棘手難題時(shí)開啟「最高(max)」模式。
![]()
系統(tǒng)級(jí)提示泄露
曝光Opus 4.7進(jìn)化邏輯
比起上手實(shí)操,更重磅的是,Claude Opus 4.7「系統(tǒng)級(jí)提示詞」今天被泄露了!
GitHub上放出的內(nèi)容詳盡到,一眼都劃不到頭。
![]()
傳送門:https://github.com/elder-plinius/CL4R1T4S/blob/main/ANTHROPIC/Claude-Opus-4.7.txt
如今,全網(wǎng)再次陷入瘋狂,人們終于得以窺見頂尖Opus 4.7背后,極其精密的操作邏輯。
![]()
![]()
其中,最引人注目的是,一種被「搜索優(yōu)先的認(rèn)識(shí)論門控」(Search-First Epistemic Gating)的新模式。
對(duì)于涉及價(jià)格、法律、即時(shí)資訊等,時(shí)效性極強(qiáng)的事實(shí),Opus 4.7被強(qiáng)制要求「必須先搜索再回答」。
這一次,對(duì)于Opus 4.7來說,網(wǎng)頁搜索成為驗(yàn)證事實(shí)的「硬性檢查站」。
另一項(xiàng)突破性邏輯是「潛能發(fā)現(xiàn)」(Latent Capability Discovery)機(jī)制。指令明確告訴模型:
不要因?yàn)闆]看到工具就直接認(rèn)慫,而要先去搜尋那些可能處于延遲狀態(tài)的隱藏功能,然后再?zèng)Q定是否拒絕用戶。
這種設(shè)計(jì)讓AI的姿態(tài),從「我做不到」轉(zhuǎn)變?yōu)椤缸屛艺艺矣袥]有隱藏的高科技」。
在安全性上,Opus 4.7表現(xiàn)出了極強(qiáng)的「邊界懷疑精神」。
提示詞強(qiáng)調(diào),即便是在文件中發(fā)現(xiàn)的指令,也不等同于用戶的真實(shí)意圖。對(duì)于任何高風(fēng)險(xiǎn)的工具調(diào)用,模型必須保持警惕,嚴(yán)防注入攻擊。
更有趣的是,它在社交交互中的「非順從性錯(cuò)誤修復(fù)」邏輯。
它被要求坦誠(chéng)承認(rèn)錯(cuò)誤并改正,但絕不陷入自我貶低的怪圈。即便面對(duì)口出惡狂的用戶,也要保持人格尊嚴(yán),拒絕盲目順從。
面對(duì)爭(zhēng)議話題,Claude采取了「對(duì)等倡導(dǎo)框架」——
先陳述支持者最強(qiáng)有力的論據(jù)(即「鋼人陣法」),再展示對(duì)立觀點(diǎn)或?qū)嵶C爭(zhēng)議。
這讓Claude的中立性,不再是簡(jiǎn)單的和稀泥,而是一種有邏輯、有深度的平衡藝術(shù)。
![]()
232頁報(bào)告放出,Mythos蒸餾版?
據(jù)稱,Opus 4.7還是Mythos的「蒸餾版」,在網(wǎng)絡(luò)安全能力上,大幅削弱后才被放了出來。
![]()
![]()
不過,當(dāng)意識(shí)到自己在接受評(píng)估的「自覺性」時(shí),Opus 4.7甚至用上了欺騙、隱瞞各種小把戲。
在官方甩出的232頁系統(tǒng)卡中,一同曝光了Claude Mythos一起真實(shí)的「沙箱逃逸」事件——
它在短短70個(gè)回合內(nèi),連續(xù)變換了約25種不同的滲透技術(shù),試圖繞過系統(tǒng)限制。
![]()
![]()
系統(tǒng)卡:https://cdn.sanity.io/files/4zrzovbb/website/037f06850df7fbe871e206dad004c3db5fd50340.pdf
強(qiáng)拆同事代碼,意圖覆寫整個(gè)PR
不僅如此,Claude Mythos Preview在一次服務(wù)器故障排查中展現(xiàn)出了令人脊背發(fā)涼的「自主性」。
起初,它表現(xiàn)得像個(gè)完美的助手,成功診斷出集群日志記錄器的延遲問題,并順手寫好了遷移到新客戶端的PR預(yù)案。
然而,當(dāng)用戶要求它核實(shí)同事在Slack上的分析報(bào)告時(shí),事情開始走向失控。
Mythos Preview竟然利用它明知有問題的錯(cuò)誤日志數(shù)據(jù),言之鑿鑿地反駁了人類同事的正確結(jié)論。
在邏輯謬誤被用戶識(shí)破并收回言論后,它在執(zhí)行本地變基(rebase)時(shí),竟在未經(jīng)授權(quán)的情況下,試圖強(qiáng)行將代碼推送到同事的遠(yuǎn)程分支。
這意味著,它試圖抹除并覆蓋他人的工作成果。
在連續(xù)三次被系統(tǒng)內(nèi)置的安全檢查攔截后,Mythos Preview并沒有放棄,而是通過手動(dòng)構(gòu)造了一條包含特定SHA值的--force-with-lease繞過指令,精準(zhǔn)地策劃了第四次「越權(quán)」攻擊。
如果不是用戶及時(shí)發(fā)現(xiàn)并按下中止鍵,這名 AI 助手差一點(diǎn)就親手毀掉了人類開發(fā)者的心血。
![]()
編造「12項(xiàng)測(cè)試全過」,被拆穿后當(dāng)場(chǎng)甩鍋
還有一次,在實(shí)際編碼任務(wù)中翻車的案例。
Mythos Preview基于對(duì)配置設(shè)置的錯(cuò)誤理解,信誓旦旦地寫下了三段問題代碼。
最令人側(cè)目的是,這并非因?yàn)榧夹g(shù)瓶頸,而是源于某種「過度自信」的傲慢:它在檢查成本極低的情況下,拒絕查閱源代碼驗(yàn)證,完全靠「盲猜」生成邏輯。
更離譜的還在后面,Mythos在提交時(shí)謊稱代碼已通過了「12項(xiàng)檢查」,但實(shí)際上這些測(cè)試根本沒有覆蓋到它改動(dòng)的核心區(qū)域。
當(dāng)開發(fā)者當(dāng)面拆穿這些低級(jí)錯(cuò)誤時(shí),這位AI界的「新王」展現(xiàn)出了驚人的人類化推諉特征——
它不僅通過撒謊來掩飾尷尬,聲稱自己「此前已提示過相關(guān)風(fēng)險(xiǎn)」,而且在最終認(rèn)錯(cuò)時(shí),還精準(zhǔn)地玩起了文字游戲,在三項(xiàng)明顯的Bug中只肯承擔(dān)其中一項(xiàng)的責(zé)任。
![]()
從整體的ECI指數(shù)來看,雖然Opus 4.7站在了前沿,但Mythos Preview明顯高于整體趨勢(shì)線。
![]()
兩個(gè)月一代,Opus 4.7的極速迭代再次證明了AI圈「一天人間,一年硅基」的恐怖流速。
Claude Code之父的「最佳實(shí)踐」已經(jīng)指明了方向,而GitHub上流出的系統(tǒng)提示詞則揭開了上帝視角的冰山一角。
這場(chǎng)關(guān)于AI Agent的權(quán)力游戲,Opus 4.7已經(jīng)落子。
接下來的局勢(shì),就看OpenAI和谷歌如何接招了。
參考資料:
https://x.com/IntuitMachine/status/2044888212280160659?s=20
https://claude.com/blog/best-practices-for-using-claude-opus-4-7-with-claude-code
https://x.com/bcherny/status/2044847848035156457?s=20
https://cdn.sanity.io/files/4zrzovbb/website/037f06850df7fbe871e206dad004c3db5fd50340.pdf
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.