<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<ruby id="iv5nr"></ruby>

<sub id="iv5nr"></sub>

<wbr id="iv5nr"><menu id="iv5nr"></menu></wbr>

<nav id="iv5nr"></nav>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Claude Opus 4.5來了：谷歌把Anthropic逼到了墻角

2025-11-25 13:08:43　來源: AI進化論花生

北京舉報

0

分享至

上周，Google實在是太猛了，拳打OpenAI，腳踢Anthropic。Gemini 3 Pro模型在編程、數學、推理等能力上都達到了當之無愧的SOTA級別。

被逼到墻角之后，就看誰先有能力掀桌坐不住了。

于是，就在今天，Anthropic發布了Claude Opus 4.5。

Opus 4.5的核心還是聚焦在編程能力，可以說很炸裂：SWE-bench Verified達到80.9%，首次突破80%，超越Gemini 3 Pro的76.2%。

以及，很少見的是，他們甚至降價了！價格從之前的貴得離譜的$15/$75直接降到$5/$25 per million tokens，直降66%！！

Opus 4.5的發布，說明Anthropic是真的急了——或者說，終于認真了。

Opus 4.5到底有多強？

先說benchmark數據。

SWE-bench Verified：80.9%

這是業界公認的編程能力測試標準。Opus 4.5是第一個突破80%的模型。

對比一下：

- Gemini 3 Pro：76.2%

- Claude Sonnet 4.5：77.2%

- GPT-5.1：76.3%/77.9%

80.9%是什么概念？Anthropic內部拿性能工程師的面試題測試，Opus 4.5的得分超過了所有人類候選人。

Terminal-bench 2.0：59.3%

這個測試主要看模型在終端環境下的編程能力。Opus 4.5比Gemini 3 Pro高了5個百分點（54.2%），比自家的Sonnet 4.5高了近10個百分點（50.0%）。

這個差距說明一個事實：Claude在真實開發環境下，就是比其他模型強。

GPQA Diamond：87.0%

這是研究生級別的推理測試，涵蓋物理、化學、生物。Opus 4.5在這個測試上落后于Gemini 3 Pro（91.9%），但87%的成績也不差。

總結一下：編程能力世界第一，推理能力也不弱。

價格策略的巨大轉變

Opus 4.5最讓人意外的，是在性能提升的同時，價格還暴降了。

新定價：

- 輸入：$5 / million tokens

- 輸出：$25 / million tokens

Anthropic的官方說法是："making Opus-level capabilities accessible to even more users, teams, and enterprises"（讓更多用戶、團隊和企業能用上Opus級別的能力）。

邏輯很明顯：Anthropic需要更多人用Opus。

之前Opus的定位是"高端用戶"，但高端市場就那么大。現在降價，是要搶占"中端市場"——那些之前用Sonnet，但其實需要更強能力的開發者。

不到一周，正面交鋒

11月18日，Google發布Gemini 3 Pro。

11月24日，Anthropic發布Claude Opus 4.5。

不到一周，兩個頂級模型連續發布。

這不是巧合。

Gemini 3 Pro發布時，各種benchmark數據都很炸裂，尤其是GPQA Diamond的91.9%，直接刷新了推理能力的記錄。當時AI圈的共識是：Google這次真的起來了。

Anthropic當然不會讓Google獨占風頭。

Opus 4.5的發布時機，明顯是沖著Gemini 3來的。而且，Anthropic選擇的戰場很聰明：不和你比推理，和你比編程。

Gemini 3 Pro在推理上確實強（91.9% vs 87.0%），但在編程上，Claude Opus 4.5領先了近5個百分點（80.9% vs 76.2%）。

更關鍵的是，編程能力是開發者最關心的指標。推理能力再強，如果寫不出好代碼，開發者也不會買單。

這就是Anthropic的策略：在自己最擅長的領域，做到絕對領先。

為什么Anthropic能在編程上這么強？

之前我在測試Claude Code時，有個很深的感受：

Claude Code好用的邏輯，不是因為它是終端工具，而是因為Anthropic有模型成本和模型認知的優勢。

他們可以更無所畏懼地投喂代碼上下文燒token，能知道如何擠壓模型Agentic的能力實現更長步驟的推理，可以用agentic search而非RAG的方式處理上下文。

這些優勢，說白了就一個原因：Anthropic從一開始就是奔著編程和Agent去優化模型的。

我之前評價Claude 4時說：最強編程模型 + 最強Agent基建。

Anthropic對模型的所有優化，都是奔著To B做AI coding和讓開發者建agent而去的。他們主要做了這幾個方面的優化：

1. 擴展思維與工具使用：允許模型在思考和使用工具之間來回切換，形成"思考-執行-再思考"的循環

2. 改進的記憶能力：可以創建和維護"記憶文件"來存儲關鍵信息，支持長時間任務

3. 更強的指令遵循能力：可以處理超過10000個token的系統提示

4. 減少獎勵黑客行為：模型為了達到目標而走捷徑的傾向降低了80%以上

這些優化，放在Opus 4.5上，效果更明顯了。

相比之下，Gemini 3的優勢在于多模態。如果你的任務涉及視覺、圖片、視頻，Gemini 3會更強。但如果是純編程任務，Claude Opus 4.5幾乎沒有對手。

產品層面的配合

Opus 4.5的發布，不是孤立的。

Anthropic同時推出了幾個重要的產品更新：

1. Claude Code進入桌面端：支持并行運行多個本地和遠程會話，長對話自動總結早期上下文

2. Claude for Chrome：擴展至所有Max用戶

3. Claude for Excel：面向所有Max、Team和Enterprise用戶正式發布

這些產品更新，都是在強化一個信號：Claude不只是一個聊天模型，它是一個生產力工具。

尤其是Claude Code。

我之前說過，從工具層面來說，從Cursor這種IDE圖形界面退回到Claude Code這種終端命令行工具，其實是個挺大的退步。但Claude Code之所以還是比Cursor好用，就是因為它背后的模型能力太強了。

現在Opus 4.5出來了，Claude Code的優勢會更明顯。

而且，Anthropic還宣布了和Microsoft、NVIDIA的戰略合作：Claude擴展至Azure平臺，由NVIDIA提供算力支持。這意味著，Claude的To B布局在快速推進。

開發者該怎么選？

最后說點實際的：如果你是開發者，該選Claude還是Gemini？

我的建議是：

選Claude Opus 4.5，如果你的任務主要是：

純代碼編寫和調試
后端邏輯和復雜推理
長時間的編程任務（需要記憶和上下文管理）

選Gemini 3 Pro，如果你的任務主要是：

多模態任務（涉及圖片、視頻、視覺）
前端、UI設計
需要超強推理能力的研究級任務如果預算夠，最好的辦法是：兩個都用。

Claude處理編程，Gemini處理多模態。各取所長。

我前兩天剛剛同時用Claude Code+Gemini 3 Pro，開發了一個有儀式感地記錄日常生活和靈感碎片的app「小票筆記 - Thermal」，在開發這款app時，我的工作步驟和體驗是：

1）Gemini 3在生成和復刻前端效果上明顯表現更優

2）實際的開發和解決bug的過程，Claude Code還是比Cursor + Gemini 3 Pro，或者使用Antigravity的體驗，因為長程的編程能力還需要工具更好的工程化能力，以及模型更底層的編程能力。

最后

Opus 4.5的發布，不是孤立事件。

它是Anthropic在編程和Agent這條路上的又一次發力，是對Gemini 3的正面回應，也是對自己商業化策略的調整。

Anthropic這么跳，說明AI大模型的競爭進入白熱化了。

對開發者來說，這是好事。模型越來越強，價格越來越低，工具越來越好用。

接下來，看OpenAI怎么接招。

當然，如果你因為訂閱或者網絡問題不方便使用原版Claude Code的話，也歡迎試試我前段時間開發的GLM Code：

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

媒體：鄭麗文受邀訪大陸核心原因從當前局勢看不難猜

看看新聞Knews 2026-03-30 22:31:04
2102 跟貼 2102
“直接崩了，一天掉了一百多元！”有人瘋狂拋售，國際巨頭接連發布新技術……格局將被改變？

都市快報橙柿互動 2026-03-29 12:26:05
1883 跟貼 1883

中方決定對日本國會眾議員古屋圭司采取反制措施

央視新聞客戶端 2026-03-30 10:43:13
2267 跟貼 2267

江蘇一老太太花24塊錢買鹵菜，順走40多塊錢的大腸，偷第二次時被發現，店主：當時沒反應過來東西丟了，等老人走后清點了下才明白

洪觀新聞 2026-03-30 15:41:26
50 跟貼 50
兩艘中國巨輪順利通過霍爾木茲海峽

深圳新聞網 2026-03-31 11:45:53
599 跟貼 599

曾喊出“用中國制造干掉日本制造” 張雪機車做到了

澎湃新聞 2026-03-31 08:23:31
23 跟貼 23

美國如果發動地面戰本次戰事軍費或突破10萬億美元

都市快報橙柿互動 2026-03-30 13:49:54
1588 跟貼 1588
山東設立中小學春秋假期:原則上每次3天，安排在每學期期中前后

齊魯壹點 2026-03-30 20:46:10
808 跟貼 808

太心疼！全紅嬋談體重時哽咽：“我接受不了那么胖的自己”

上觀新聞 2026-03-30 13:07:07
1404 跟貼 1404
約80層樓高的神女大扶梯，把巫山縣城推向了臺前

新京報 2026-03-30 16:45:46
199 跟貼 199
LV，賣不動了？

中國新聞周刊 2026-03-30 18:15:39
189 跟貼 189
單依純在演唱會上唱《好想談戀愛》，全程放飛自我反差感拉滿

南陽日報 2026-03-30 19:30:21
193 跟貼 193
6月起，網約車司機超8小時長時間工作將結束

半島官網 2026-03-31 09:30:28
51 跟貼 51
海爾冷柜為海釣人群發布行業首個超低溫保鮮科技白皮書

中國經營報 2026-03-30 19:55:49
130 跟貼 130
“張飛古道已經重開”消息不實（2026·03·30）

今日辟謠 2026-03-30 18:53:07
115 跟貼 115
中國獨角獸企業數量創歷史新高湖北10家上榜

湖北省人民政府網 2026-03-31 09:14:42
2 跟貼 2
南太行徒步失聯20日廣東男子遺體已被確認，救援隊員：通宵耗了10小時才將遺體抬下山，隊員都累趴了

極目新聞 2026-03-31 12:25:15
0 跟貼 0
今年，蚊子瘋狂？

中國新聞周刊 2026-03-30 22:24:41
0 跟貼 0
日本陸上自衛隊在兩地部署遠程導彈

新京報 2026-03-31 10:23:04
0 跟貼 0
噩耗傳來，28歲川大博士黃鵬確認遇難

臺州交通廣播 2026-03-31 12:27:33
0 跟貼 0
杭州女子砸3萬追男主播，線下約2次連抱都被拒，要求退款卻被拉黑

行者聊官 2026-03-31 12:31:47
0 跟貼 0

2012年，用U型鎖砸日系車并重傷車主的蔡洋早已出獄，如今怎樣了

2012年，用U型鎖砸日系車并重傷車主的蔡洋早已出獄，如今怎樣了

談史論天地

2026-03-25 09:57:09

不想贏球！反超比分卻換下主力！騎士逃過一劫，哈登又送14助攻

不想贏球！反超比分卻換下主力！騎士逃過一劫，哈登又送14助攻

體壇小李

2026-03-31 11:49:25

中國移動原董事長楊杰出任要職

最通信

2026-03-31 09:37:16

里子面子都丟了！這一次，“不偷不搶”的王菲給單依純上了一課

里子面子都丟了！這一次，“不偷不搶”的王菲給單依純上了一課

阿淫記錄生活日常

2026-03-30 14:18:44

突發！又一艘油輪遭襲

數據寶

2026-03-31 12:34:17

退休不是“自由身”！2026嚴管：機關事業單位退休人員兼職紅線

退休不是“自由身”！2026嚴管：機關事業單位退休人員兼職紅線

今日搞笑分享

2026-03-30 12:04:20

坦格西里身亡

南方都市報

2026-03-30 16:02:16

為何慈禧一死，清朝的北洋軍連皇帝都指揮不動了？原因其實很簡單

為何慈禧一死，清朝的北洋軍連皇帝都指揮不動了？原因其實很簡單

老達子

2026-03-31 06:55:03

同學聚會，班長讓我給遲到的鎮長讓座，下一秒，縣長向我道歉

同學聚會，班長讓我給遲到的鎮長讓座，下一秒，縣長向我道歉

農村情感故事

2026-03-23 07:31:39

RAC1：巴薩將向萊萬提供一份低薪合同，頭號目標是阿爾瓦雷斯

RAC1：巴薩將向萊萬提供一份低薪合同，頭號目標是阿爾瓦雷斯

懂球帝

2026-03-31 05:50:27

張本智和父親怒了：請中國人別罵我兒子，他比你們99%的人都優秀

張本智和父親怒了：請中國人別罵我兒子，他比你們99%的人都優秀

拳擊時空

2026-03-31 06:22:23

爆冷掀翻衛冕冠軍！中國女籃26歲2米王牌閃耀：無懼3大內線名將

爆冷掀翻衛冕冠軍！中國女籃26歲2米王牌閃耀：無懼3大內線名將

李喜林籃球絕殺

2026-03-31 10:41:53

賴昌星前妻近狀曝光：拒絕政府安置，獨居3000平老宅，只做一件事

賴昌星前妻近狀曝光：拒絕政府安置，獨居3000平老宅，只做一件事

芳芳歷史燴

2026-03-23 03:53:23

伊朗譴責以色列襲擊科威特海水淡化廠

伊朗譴責以色列襲擊科威特海水淡化廠

看看新聞Knews

2026-03-30 23:51:05

恒大集團許家印坑的最慘的9位大佬

恒大集團許家印坑的最慘的9位大佬

地產微資訊

2026-03-29 19:08:15

國歌中一句話引發爭議，建國以來被反復修改，其中一版本只用四年

國歌中一句話引發爭議，建國以來被反復修改，其中一版本只用四年

顧秋韻

2026-03-30 14:39:53

柯藍坦言自己今年53歲，前陣子還在清邁和瞿穎一起過了春節

柯藍坦言自己今年53歲，前陣子還在清邁和瞿穎一起過了春節

小光侃娛樂

2026-03-31 07:10:08

遺產爭議僅三天，75歲劉曉慶就宣布了新的好消息

遺產爭議僅三天，75歲劉曉慶就宣布了新的好消息

手工制作阿殲

2026-03-31 06:48:11

斯諾克重大變革：世錦賽母球變綠，威爾遜點贊討論

斯諾克重大變革：世錦賽母球變綠，威爾遜點贊討論

譚顳愛搞笑

2026-03-31 09:32:50

連央視都報道了！PS5徹底打破“越放越貶值”定律

連央視都報道了！PS5徹底打破“越放越貶值”定律

游民星空

2026-03-30 17:15:44

AI進化論花生

AI博主，AppStore付費榜第一的小貓補光燈app開發者

169文章數 83關注度

往期回顧全部

科技要聞

尚未正式宣發，國行蘋果AI半夜"意外閃現"

頭條要聞

牛彈琴：中東新的大麻煩來了特朗普又盯上了新目標

頭條要聞

牛彈琴：中東新的大麻煩來了特朗普又盯上了新目標

體育要聞

縣城修車工，用20年成為世界冠軍

娛樂要聞

絲芭傳媒舉報鞠婧祎：瞞報收入竟達85%

財經要聞

高薪內推藏陷阱!"招轉培"騙局盯上求職者

汽車要聞

16萬級最強2.0T 全新一代瑞虎9來了

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機

游戲

房產

本地

健康

手機要聞

4月1日服務升級 realme將全面接入OPPO售后服務

夢幻西游第一23技能淚妖4200億MHB易主，紫禁城候總開出超否獸訣

房產要聞

14億！電競巨頭出手，海棠灣“超級運動綜合體”來了！

本地新聞

用Color Walk的方式解鎖城市春日

干細胞抗衰4大誤區,90%的人都中招

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<ul id="z1lqz"><thead id="z1lqz"></thead></ul>

<pre id="z1lqz"></pre>

<style id="z1lqz"></style>