★ 設為星標 | 只講人話,帶你玩轉AIGC。
太卷了,真的太卷了。
Google 的 Gemini 3 Pro 才發布不到一周吧?
“最強模型”的屁股還沒坐熱,今早一睜眼,Anthropic 反手就是一個王炸:Claude Opus 4.5 來了。
這就是神仙打架,凡人看戲。
![]()
圖:美國 AI 競爭循環
本來Gemini 3 Pro 的編碼能力就不如 Claude,這回更是被甩了一條街。
![]()
圖:Opus 4.5 性能指標
廢話不說,看看它到底強在哪。
1. 代碼能力封神:這回是真“大佬”
這次最嚇人的還是寫代碼。
在權威的軟件工程測試 SWE-Bench 里,它拿了 80.9%,直接甩飛友商。
![]()
圖:軟件工程能力對比
更離譜的是,Anthropic 透露:在內部高難度招聘測試里,它的得分超過了所有人類候選人。
不過這里有個細節。
這個“超越全人類”的成績是開了個“外掛”跑出來的——同時試好幾種解法挑最好的。
如果關掉外掛,它的成績是追平了最強人類。
但哪怕是“追平”,也夠恐怖了,程序員這回真的。。。得想想新的職業了?
2. 價格膝蓋斬:頂級大腦“白菜價”
通常來說,性能越強越貴,但這次 Claude 居然反向操作。
Opus 4.5 的價格,直接比上一代砍掉了三分之二。
![]()
圖:Claude 模型價格對比
立刻能用的神器
除了這些,他們還提供了一些工具,我們可以直接用起來:
- Claude for Chrome: 瀏覽器裝個大腦,跨標簽頁自動整理信息,搬磚神器。
- Claude for Excel: 別背公式了,直接跟它說人話,表格自動搞定。
Claude 寫代碼最強其實早就不算新聞了,但這周的劇情真的太精彩。
前兩天 Gemini 3 Pro 剛發布時,那種“手搓代碼”的演示已經讓無數人直呼“天花板”了。
結果呢?Anthropic 連一周的安全期都沒給對手留,反手就用 Opus 4.5 再次刷新了認知。
巨頭們卷得越兇,留給我們的工具就越強。
評論區聊聊,在這個“代碼大爆炸”的時代,你最看好誰?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.