Anthropic 急了,發(fā)布了 Claude Opus 4.5,同時終于從原來死貴的 75 美元變成了 25 美元,當然還是比 Gemini 3 Pro 貴不少。
介紹一下詳細更新內(nèi)容:
## 性能表現(xiàn):編程任務新世界第一
SWE-bench Verified Opus 4.5 拿了第一。
Anthropic 內(nèi)部還做了個有意思的測試:他們讓 Opus 4.5 做性能工程師的入職考試(2小時限時),結(jié)果模型的分數(shù)超過了所有人類候選人。
不只是編程,Opus 4.5 在數(shù)學、視覺、推理等各個維度都有提升。
## 頂級模型價格對比(per million tokens):
- Claude Opus 4.5: $5 / $25
- GPT-5.1: $1.25 / $10
- GPT-5-pro: $15 / $120
- Gemini 3 Pro: $2-4 / $12-18
## 效率大幅提升:更聰明意味著更省錢
Opus 4.5 引入了一個新參數(shù)叫 effort(努力程度),你可以根據(jù)任務選擇不同的思考深度。
在 medium effort 模式下,Opus 4.5 達到了 Sonnet 4.5 的最佳分數(shù),但只用了 24% 的輸出 tokens。換句話說,少用了 76% 的 tokens。
即使在 highest effort 模式下,Opus 4.5 的表現(xiàn)超過 Sonnet 4.5 有 4.3 個百分點,同時還少用了 48% 的 tokens。
這說明模型變聰明了:更少的回溯、更少的冗余探索、更精準的推理。對于長期運行的代理任務,這個效率提升會直接轉(zhuǎn)化為成本節(jié)省。
有權(quán)使用 Opus 4.5 的 Claude 和 Claude Code 用戶,已移除針對 Opus 的特定限制。
Max 和 Team Premium 用戶,提高了總體使用上限,這意味著將擁有與之前使用 Sonnet 時大致相同數(shù)量的 Opus Token。
效率提升這點是這次比較關(guān)鍵的,用的好的話,它可能會比 sonnet 4.5 還要便宜。
我的觀察是它有點變得像GPT5.1了。 就是輸出的結(jié)果和思考的結(jié)果非常的節(jié)省。然后輸出的結(jié)果就我能看懂,但是它不像是給人看的,寫出來。
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.