<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Claude Opus 4.5來了:谷歌把Anthropic逼到了墻角

      0
      分享至

      上周,Google實在是太猛了,拳打OpenAI,腳踢Anthropic。Gemini 3 Pro模型在編程、數學、推理等能力上都達到了當之無愧的SOTA級別。


      被逼到墻角之后,就看誰先有能力掀桌坐不住了。

      于是,就在今天,Anthropic發布了Claude Opus 4.5。


      Opus 4.5的核心還是聚焦在編程能力,可以說很炸裂:SWE-bench Verified達到80.9%,首次突破80%,超越Gemini 3 Pro的76.2%。


      以及,很少見的是,他們甚至降價了!價格從之前的貴得離譜的$15/$75直接降到$5/$25 per million tokens,直降66%!!

      Opus 4.5的發布,說明Anthropic是真的急了——或者說,終于認真了。

      Opus 4.5到底有多強?

      先說benchmark數據。

      SWE-bench Verified:80.9%

      這是業界公認的編程能力測試標準。Opus 4.5是第一個突破80%的模型。

      對比一下:

      - Gemini 3 Pro:76.2%

      - Claude Sonnet 4.5:77.2%

      - GPT-5.1:76.3%/77.9%

      80.9%是什么概念?Anthropic內部拿性能工程師的面試題測試,Opus 4.5的得分超過了所有人類候選人。


      Terminal-bench 2.0:59.3%

      這個測試主要看模型在終端環境下的編程能力。Opus 4.5比Gemini 3 Pro高了5個百分點(54.2%),比自家的Sonnet 4.5高了近10個百分點(50.0%)。

      這個差距說明一個事實:Claude在真實開發環境下,就是比其他模型強。

      GPQA Diamond:87.0%

      這是研究生級別的推理測試,涵蓋物理、化學、生物。Opus 4.5在這個測試上落后于Gemini 3 Pro(91.9%),但87%的成績也不差。

      總結一下:編程能力世界第一,推理能力也不弱。

      價格策略的巨大轉變

      Opus 4.5最讓人意外的,是在性能提升的同時,價格還暴降了。

      新定價:

      - 輸入:$5 / million tokens

      - 輸出:$25 / million tokens

      Anthropic的官方說法是:"making Opus-level capabilities accessible to even more users, teams, and enterprises"(讓更多用戶、團隊和企業能用上Opus級別的能力)。

      邏輯很明顯:Anthropic需要更多人用Opus。

      之前Opus的定位是"高端用戶",但高端市場就那么大。現在降價,是要搶占"中端市場"——那些之前用Sonnet,但其實需要更強能力的開發者。

      不到一周,正面交鋒

      11月18日,Google發布Gemini 3 Pro。

      11月24日,Anthropic發布Claude Opus 4.5。

      不到一周,兩個頂級模型連續發布。

      這不是巧合。

      Gemini 3 Pro發布時,各種benchmark數據都很炸裂,尤其是GPQA Diamond的91.9%,直接刷新了推理能力的記錄。當時AI圈的共識是:Google這次真的起來了。


      Anthropic當然不會讓Google獨占風頭。

      Opus 4.5的發布時機,明顯是沖著Gemini 3來的。而且,Anthropic選擇的戰場很聰明:不和你比推理,和你比編程。

      Gemini 3 Pro在推理上確實強(91.9% vs 87.0%),但在編程上,Claude Opus 4.5領先了近5個百分點(80.9% vs 76.2%)。

      更關鍵的是,編程能力是開發者最關心的指標。推理能力再強,如果寫不出好代碼,開發者也不會買單。

      這就是Anthropic的策略:在自己最擅長的領域,做到絕對領先。

      為什么Anthropic能在編程上這么強?

      之前我在測試Claude Code時,有個很深的感受:

      Claude Code好用的邏輯,不是因為它是終端工具,而是因為Anthropic有模型成本和模型認知的優勢。

      他們可以更無所畏懼地投喂代碼上下文燒token,能知道如何擠壓模型Agentic的能力實現更長步驟的推理,可以用agentic search而非RAG的方式處理上下文。

      這些優勢,說白了就一個原因:Anthropic從一開始就是奔著編程和Agent去優化模型的。

      我之前評價Claude 4時說:最強編程模型 + 最強Agent基建。

      Anthropic對模型的所有優化,都是奔著To B做AI coding和讓開發者建agent而去的。他們主要做了這幾個方面的優化:

      1. 擴展思維與工具使用:允許模型在思考和使用工具之間來回切換,形成"思考-執行-再思考"的循環

      2. 改進的記憶能力:可以創建和維護"記憶文件"來存儲關鍵信息,支持長時間任務

      3. 更強的指令遵循能力:可以處理超過10000個token的系統提示

      4. 減少獎勵黑客行為:模型為了達到目標而走捷徑的傾向降低了80%以上

      這些優化,放在Opus 4.5上,效果更明顯了。

      相比之下,Gemini 3的優勢在于多模態。如果你的任務涉及視覺、圖片、視頻,Gemini 3會更強。但如果是純編程任務,Claude Opus 4.5幾乎沒有對手。

      產品層面的配合

      Opus 4.5的發布,不是孤立的。

      Anthropic同時推出了幾個重要的產品更新:

      1. Claude Code進入桌面端:支持并行運行多個本地和遠程會話,長對話自動總結早期上下文

      2. Claude for Chrome:擴展至所有Max用戶

      3. Claude for Excel:面向所有Max、Team和Enterprise用戶正式發布

      這些產品更新,都是在強化一個信號:Claude不只是一個聊天模型,它是一個生產力工具。

      尤其是Claude Code。

      我之前說過,從工具層面來說,從Cursor這種IDE圖形界面退回到Claude Code這種終端命令行工具,其實是個挺大的退步。但Claude Code之所以還是比Cursor好用,就是因為它背后的模型能力太強了。

      現在Opus 4.5出來了,Claude Code的優勢會更明顯。

      而且,Anthropic還宣布了和Microsoft、NVIDIA的戰略合作:Claude擴展至Azure平臺,由NVIDIA提供算力支持。這意味著,Claude的To B布局在快速推進。

      開發者該怎么選?

      最后說點實際的:如果你是開發者,該選Claude還是Gemini?

      我的建議是:

      選Claude Opus 4.5,如果你的任務主要是:

      • 純代碼編寫和調試

      • 后端邏輯和復雜推理

      • 長時間的編程任務(需要記憶和上下文管理)

      選Gemini 3 Pro,如果你的任務主要是:

      • 多模態任務(涉及圖片、視頻、視覺)

      • 前端、UI設計

      • 需要超強推理能力的研究級任務 如果預算夠,最好的辦法是:兩個都用。

      Claude處理編程,Gemini處理多模態。各取所長。

      我前兩天剛剛同時用Claude Code+Gemini 3 Pro,開發了一個有儀式感地記錄日常生活和靈感碎片的app「小票筆記 - Thermal」,在開發這款app時,我的工作步驟和體驗是:

      1)Gemini 3在生成和復刻前端效果上明顯表現更優

      2)實際的開發和解決bug的過程,Claude Code還是比Cursor + Gemini 3 Pro,或者使用Antigravity的體驗,因為長程的編程能力還需要工具更好的工程化能力,以及模型更底層的編程能力。




      最后

      Opus 4.5的發布,不是孤立事件。

      它是Anthropic在編程和Agent這條路上的又一次發力,是對Gemini 3的正面回應,也是對自己商業化策略的調整。

      Anthropic這么跳,說明AI大模型的競爭進入白熱化了。

      對開發者來說,這是好事。模型越來越強,價格越來越低,工具越來越好用。

      接下來,看OpenAI怎么接招。

      當然,如果你因為訂閱或者網絡問題不方便使用原版Claude Code的話,也歡迎試試我前段時間開發的GLM Code:

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      腦梗跟戴帽子有關?醫生警告:60歲后,天冷要注意這3件事

      腦梗跟戴帽子有關?醫生警告:60歲后,天冷要注意這3件事

      看世界的人
      2025-11-26 10:05:37
      快扔掉!戴一天,輻射量相當于拍117次胸片

      快扔掉!戴一天,輻射量相當于拍117次胸片

      FM93浙江交通之聲
      2025-10-28 00:01:43
      每體:弗拉霍維奇曾被推薦給巴薩,但球員即將和米蘭達成協議

      每體:弗拉霍維奇曾被推薦給巴薩,但球員即將和米蘭達成協議

      懂球帝
      2025-12-15 01:14:12
      又要交易?二年級的克內克特,表現什么水平?

      又要交易?二年級的克內克特,表現什么水平?

      籃球實錄
      2025-12-14 23:39:55
      山東醫院十強曝光,濟南霸占四席!

      山東醫院十強曝光,濟南霸占四席!

      醫脈圈
      2025-12-14 20:05:07
      錢再多有啥用?鞏俐帶77歲老公回北京,雪中騎一輛車,笑容藏不住

      錢再多有啥用?鞏俐帶77歲老公回北京,雪中騎一輛車,笑容藏不住

      洲洲影視娛評
      2025-12-13 19:57:10
      情況突變,大批售臺軍火被扣押,美軍敗局已定,賴清德輸了個精光

      情況突變,大批售臺軍火被扣押,美軍敗局已定,賴清德輸了個精光

      影孖看世界
      2025-12-13 20:33:48
      新華社快訊:悉尼槍擊事件一名槍手身份已確認

      新華社快訊:悉尼槍擊事件一名槍手身份已確認

      新華社
      2025-12-14 18:45:18
      祝賀!42歲尼格買提高調迎喜訊,央媒親自發文,看來撒貝寧說對了

      祝賀!42歲尼格買提高調迎喜訊,央媒親自發文,看來撒貝寧說對了

      小椰的奶奶
      2025-12-12 06:47:16
      趙心童領銜雷佩凡衛冕,中國17人爭奪冠軍

      趙心童領銜雷佩凡衛冕,中國17人爭奪冠軍

      郭夷包工頭
      2025-12-15 05:42:22
      眉骨縫了三針!徐杰更新社媒報平安:“新賽季 為廣東而戰”

      眉骨縫了三針!徐杰更新社媒報平安:“新賽季 為廣東而戰”

      狼叔評論
      2025-12-15 01:10:11
      92歲老人收藏的1982年全新奔馳500SL

      92歲老人收藏的1982年全新奔馳500SL

      MOTO
      2025-11-11 17:11:34
      美國議員直言:讓烏克蘭割地,像1938年的慕尼黑協定

      美國議員直言:讓烏克蘭割地,像1938年的慕尼黑協定

      桂系007
      2025-12-14 23:24:31
      日企集體加速撤離?又一家電巨頭關停中國工廠,央媒早有警告

      日企集體加速撤離?又一家電巨頭關停中國工廠,央媒早有警告

      燕梳樓頻道
      2025-12-12 18:06:43
      換了3臺冰箱,我終于悟了:寧可不買大的,冰箱也絕不能放這3處

      換了3臺冰箱,我終于悟了:寧可不買大的,冰箱也絕不能放這3處

      室內設計師有料兒
      2025-12-14 11:07:25
      宋軼的臉到底怎么了?她一句話讓全網炸鍋!

      宋軼的臉到底怎么了?她一句話讓全網炸鍋!

      毒舌八卦
      2025-08-31 22:34:38
      佳能中山工廠搬離,保潔阿姨補償30萬,員工排隊致謝

      佳能中山工廠搬離,保潔阿姨補償30萬,員工排隊致謝

      西門老爹
      2025-12-14 13:58:00
      芋頭再次被關注!研究發現:常吃芋頭的人,不用多久,或有4改善

      芋頭再次被關注!研究發現:常吃芋頭的人,不用多久,或有4改善

      阿兵科普
      2025-12-11 21:10:08
      德羅西:國米配得上勝利;社媒評論就像是毒藥,別再跟我提它

      德羅西:國米配得上勝利;社媒評論就像是毒藥,別再跟我提它

      懂球帝
      2025-12-15 06:13:06
      A股熱股榜十大熱門股

      A股熱股榜十大熱門股

      和訊網
      2025-12-14 21:30:16
      2025-12-15 06:36:49
      AI進化論花生 incentive-icons
      AI進化論花生
      AI博主,AppStore付費榜第一的小貓補光燈app開發者
      95文章數 40關注度
      往期回顧 全部

      科技要聞

      當人形機器人有了App Store,宇樹在賭什么

      頭條要聞

      澳海灘槍擊驚魂50分鐘:槍手占據天橋向下掃射

      頭條要聞

      澳海灘槍擊驚魂50分鐘:槍手占據天橋向下掃射

      體育要聞

      馬刺終結雷霆:以勇猛,以文班亞馬

      娛樂要聞

      何晴生前最大謠言!沒有再婚嫁廖京生

      財經要聞

      重大違法強制退市!10人被判刑

      汽車要聞

      硬核敞篷巴士?擲彈兵Game Viewer 2026年初量產

      態度原創

      本地
      藝術
      親子
      數碼
      時尚

      本地新聞

      云游安徽|阜陽三朝風骨,傳承千年墨香

      藝術要聞

      才女一生未嫁,畫史鑄就傳奇

      親子要聞

      保護孩子寶媽必學,什么是分離焦慮變異和飲食失調依賴進食?

      數碼要聞

      Beats攜手IShowSpeed合作短片 《速穩風云》全球上線

      終于在廣州最舒服的季節和你們見面啦

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 99在线视频免费观看| 南涧| 桐城市| 日韩不卡手机视频在线观看| 国产精品久久久亚洲| 国产精品香港三级国产av| 国产成人久久| 色吊丝中文国产| 97se亚洲精品一区| 麻豆一区二区三区蜜桃免费| 免费视频一区二区三区亚洲激情| jizzav| 密臀Av| 最新国产在线拍揄自揄视频| 成人免费一区二区三区视频| 国产成人啪精品午夜网站| 日本三级久久| 精品人妻伦九区久久aaa片| 日本免费一区二区三区高清视频| 久久这里都是精品一区| 91人人人| 真人抽搐一进一出视频| 日韩亚洲欧美中文高清| 久久久女人| 安康市| 日本成本人片免费网站| 精品无人乱码一区二区三区的优势| 国产精品久久久影院色| 色综合久久久久久中文网| 秋霞av鲁丝片一区二区| 色综合另类小说图片区 | 神马视频| 69堂在线观看线无码视频一| 亚洲口爆| 啪一啪射一射插一插| 日本黄页网站免费观看| 91在线播| 十八禁视频网站在线观看| 俄罗斯兽交黑人又大又粗水汪汪| 国产乱妇无码毛片A片在线看下载| 曲周县|