<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      性能持平價格大降80%,Anthropic新模型殺瘋了

      0
      分享至



      距離ClaudeOpus 4.6的發(fā)布僅過去12天,Anthropic就發(fā)布了新的中檔模型Claude Sonnet 4.6。

      這次發(fā)布的核心不在于技術突破本身,而在于它以低得多的價格,達到了與競品齊平的性能。。

      Sonnet 4.6的定價保持在每百萬token輸入3美元、輸出15美元,與前代 Sonnet 4.5相同。

      然而在多項基準測試中,Sonnet 4.6接近甚至超越了價格高出五倍的Opus 4.6。

      Anthropic表示,便宜不一定就沒有好貨。

      當然了,在一些關鍵的測試里,仍然還是Opus 4.6領先。

      具體表現(xiàn)如何呢?

      01

      Sonnet 4.6究竟有多驚艷?

      在SWE-bench Verified這個衡量真實軟件編碼能力的基準測試中,Sonnet 4.6得分79.6%,幾乎追平Opus 4.6的 80.8%,同時略微領先于OpenAI的GPT-5.2。

      在代理式金融分析任務中,Sonnet 4.6以63.3%的成績領先所有競爭對手,包括Opus 4.6的60.1%和GPT-5.2的59.0%。

      在辦公任務的GDPval-AA Elo評分中,Sonnet 4.6達到 1633 分,超過Opus 4.6的1606分和GPT-5.2的1462分。

      過去需要旗艦模型才能完成的任務,現(xiàn)在用Sonnet 4.6這種中檔模型就能做到。

      對于每天需要處理數(shù)百萬token的企業(yè)來說,這意味著可以大幅節(jié)省成本。

      Opus 4.6仍然在某些高復雜度領域保持優(yōu)勢。

      在終端編碼任務Terminal-Bench 2.0中,Opus 4.6得分65.4%,Sonnet 4.6為59.1%。

      在代理式搜索BrowseComp中,Opus 4.6達到84.0%, Sonnet 4.6為74.7%。

      在新穎問題解決測試ARC-AGI-2中,Opus 4.6得分68.8%,Sonnet 4.6為58.3%。



      這些差距表明,對于前沿研究和需要頂級準確度的場景,Opus 4.6仍是最好的模型。但對于大多數(shù)生產(chǎn)環(huán)境,這個差距已經(jīng)縮小到可以接受的程度。

      Sonnet 4.6最引人注目的進步出現(xiàn)在計算機使用能力上。在OSWorld-Verified基準測試中,它得分72.5%,高于Sonnet 4.5的61.4%,遠超GPT-5.2的38.2%。

      計算機使用能力指的是AI像人類一樣操作計算機的能力,通過鼠標點擊、鍵盤輸入來與軟件交互,而不依賴API接口。

      前一陣引發(fā)熱議的豆包手機助手,其底層的UI-TARS模型,就是在OSWorld基準上完成了權威測試,取得了47.5%的成績。

      豆包手機助手的表現(xiàn)是非常出色的,已經(jīng)能夠完成除了支付以外所有的操作。

      那么以此作為判斷依據(jù),進而不難推測,Sonnet 4.6的實際表現(xiàn)將會非常驚艷。

      這項能力之所以重要,是因為它打開了最廣泛的企業(yè)應用場景。

      一個能夠直接看屏幕并與之交互的模型,可以在不構建定制連接器的情況下,自動操作將所有可交互的系統(tǒng)。

      Anthropic在發(fā)布時提到,早期用戶已經(jīng)看到接近人類水平的表現(xiàn),能夠完成復雜的電子表格任務和多步驟網(wǎng)頁表單。

      保險科技公司Pace的CEO賈米·考夫(Jamie Cuffe)表示,Sonnet 4.6在他們復雜的保險計算機使用基準測試中達到94%的成績,是所有測試過的Claude模型中最高的。

      他說:“它以我們之前未見過的方式推理失敗原因并自我糾正?!?/p>

      惡意行為者可能在網(wǎng)頁中隱藏指令來劫持模型,這被稱為提示注入攻擊。

      Anthropic在公告中表示,Sonnet 4.6在抵御此類攻擊方面比Sonnet 4.5有重大改進。

      對于部署需要瀏覽網(wǎng)頁和與外部系統(tǒng)交互的代理的企業(yè)來說,這種安全防護是必須的。

      02

      價格只要五分之一

      那么Sonnet 4.6到底有多便宜呢?

      外媒報道,一些早期的Sonnet 4.6用戶表示,原本企業(yè)需要花五倍的錢才能買到的能力,現(xiàn)在用Sonnet 4.6就能獲得差不多的效果。

      這意味著運營成本可能直接降到原來的五分之一,而工作質(zhì)量幾乎不受影響。

      數(shù)據(jù)分析平臺Hex Technologies的CTO,同時也是Anthropic聯(lián)合創(chuàng)始人、首席產(chǎn)品官的凱特琳-科爾格羅夫 (Caitlin Colgrove)說,公司正在將大部分流量遷移到Sonnet 4.6。

      她指出通過自適應思考和高努力模式(high effort mode),“除了最困難的分析任務外,我們在所有任務上都看到了Opus級別的性能,且配置更高效靈活。以Sonnet的價格,這將降低工作成本?!?/p>

      云存儲公司Box的CTO本·喀什(Ben Kus)表示,Sonnet 4.6在真實企業(yè)文檔的重度推理問答中,比Sonnet 4.5的表現(xiàn)提高了15個百分點。

      Sonnet 4.6配備了100萬token的超長上下文窗口,以容納整個代碼庫、法律文件或數(shù)十篇研究論文。

      Anthropic聲稱模型能夠在整個上下文中有效推理,并通過Vending-Bench Arena這個基準測試來表現(xiàn)出Sonnet 4.6的有效推理。

      Vending-Bench Arena測試的是模型運營模擬企業(yè)的能力,不同AI模型相互競爭以獲得最大利潤。



      在沒有人類提示的情況下,Sonnet 4.6發(fā)展出一種新穎策略:在前十個模擬月份中大量投資產(chǎn)能,支出遠超競爭對手,然后在最后階段急轉彎專注于盈利能力。

      模型在365天模擬結束時的余額約為5700美元,而Sonnet 4.5約為2100美元。

      03

      Anthropic開啟印度市場

      Anthropic正處于上市前最關鍵的階段,因此他們不止要發(fā)布模型,還要借著模型去擴張業(yè)務。

      在Sonnet 4.6發(fā)布當天,印度IT巨頭Infosys宣布與Anthropic合作,構建企業(yè)級agent,將Claude模型集成到Infosys的Topaz AI平臺中,服務于銀行、電信和制造業(yè)。

      與此同時,Anthropic也在印度的班加羅爾開設了首個印度辦事處,印度現(xiàn)在占全球Claude使用量的約6%,僅次于美國。

      Anthropic的進步也導致了最近幾天軟件股的大規(guī)模拋售,就連業(yè)績大漲的微軟,也經(jīng)歷了股價暴跌。

      投資者越來越擔心AI對這些業(yè)務的潛在顛覆,Sonnet 4.6可能會加劇這種不安的氛圍。

      也不知道是不是Anthropic飄了,他們還將其免費層級默認升級到了Sonnet 4.6,開發(fā)者可以通過Claude API直接調(diào)用。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      除夕團圓夜急診爆滿!廣東省人民醫(yī)院卒中急救生死時速

      除夕團圓夜急診爆滿!廣東省人民醫(yī)院卒中急救生死時速

      今日養(yǎng)生之道
      2026-02-18 15:15:08
      你身邊的狠人都是什么樣?網(wǎng)友:第一個故事千萬別信,太變態(tài)了

      你身邊的狠人都是什么樣?網(wǎng)友:第一個故事千萬別信,太變態(tài)了

      解讀熱點事件
      2026-02-13 00:05:06
      摳摳嗖嗖省一年,架不住去長隆玩一次!

      摳摳嗖嗖省一年,架不住去長隆玩一次!

      閑搞機
      2026-02-17 11:22:13
      1998年數(shù)萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

      1998年數(shù)萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

      哄動一時啊
      2026-02-17 22:21:25
      淚目了!山東一男子深夜偷偷給幾家親戚拜年,只因自己混得不好…

      淚目了!山東一男子深夜偷偷給幾家親戚拜年,只因自己混得不好…

      火山詩話
      2026-02-18 21:28:36
      前中央政治局常委64歲主動請辭,臨終坦然:我死而無憾

      前中央政治局常委64歲主動請辭,臨終坦然:我死而無憾

      阿諢體育
      2026-02-13 04:28:34
      第2金!徐夢桃兩連冠歷史第一人 中國國家隊祝賀:桃花,又開了

      第2金!徐夢桃兩連冠歷史第一人 中國國家隊祝賀:桃花,又開了

      念洲
      2026-02-18 21:23:35
      女子哭訴:做好一桌飯菜被表弟掀桌子!原因曝光,網(wǎng)友:大逆不道

      女子哭訴:做好一桌飯菜被表弟掀桌子!原因曝光,網(wǎng)友:大逆不道

      夜深愛雜談
      2026-02-17 22:34:44
      王毅好猛,臺當局暴怒!日本外交部的一句話,可把中國網(wǎng)友樂壞了

      王毅好猛,臺當局暴怒!日本外交部的一句話,可把中國網(wǎng)友樂壞了

      觸摸史跡
      2026-02-18 05:42:43
      李淵退位之時,死死握住李世民的手:房玄齡此人太深,不可全信

      李淵退位之時,死死握住李世民的手:房玄齡此人太深,不可全信

      千秋文化
      2025-12-27 20:37:21
      四保險沖金!自由式滑雪空中技巧資格賽:4位中國選手全部晉級

      四保險沖金!自由式滑雪空中技巧資格賽:4位中國選手全部晉級

      全景體育V
      2026-02-18 18:25:49
      3.3億游艇到30億涂鴉,扎克伯格壕得如此高調(diào),挑戰(zhàn)了我的想象力

      3.3億游艇到30億涂鴉,扎克伯格壕得如此高調(diào),挑戰(zhàn)了我的想象力

      電影爛番茄
      2026-02-17 22:26:59
      馬年春晚4大槽點:王一博衣服,王菲選歌,龍洋眼睛,撒貝寧眉毛

      馬年春晚4大槽點:王一博衣服,王菲選歌,龍洋眼睛,撒貝寧眉毛

      天天熱點見聞
      2026-02-17 07:01:36
      太詭異,越南春聯(lián)上已沒有漢字!越南去漢字化確實很成功

      太詭異,越南春聯(lián)上已沒有漢字!越南去漢字化確實很成功

      魔都姐姐雜談
      2026-02-18 13:09:07
      坐3.6億飛機,戴1000萬名表,拿5000萬炒股的秦奮究竟什么背景

      坐3.6億飛機,戴1000萬名表,拿5000萬炒股的秦奮究竟什么背景

      涵豆說娛
      2026-01-19 17:21:55
      公司團建我給保安敬酒,次日董事長叫我去辦公室,他爸要提拔我

      公司團建我給保安敬酒,次日董事長叫我去辦公室,他爸要提拔我

      曉艾故事匯
      2025-11-21 17:10:17
      曾國藩晚年醒悟:精明不如厚道,厚道不如格局,格局不如拙誠

      曾國藩晚年醒悟:精明不如厚道,厚道不如格局,格局不如拙誠

      千秋文化
      2026-02-18 09:27:41
      湖北煙花店爆炸致12死:現(xiàn)場畫面流出,駭人細節(jié)披露,目擊者發(fā)聲

      湖北煙花店爆炸致12死:現(xiàn)場畫面流出,駭人細節(jié)披露,目擊者發(fā)聲

      博士觀察
      2026-02-18 18:41:02
      宋喆近況曝光,今隱居縣城太落魄,判若兩人,前妻楊慧過上新生活

      宋喆近況曝光,今隱居縣城太落魄,判若兩人,前妻楊慧過上新生活

      豐譚筆錄
      2026-01-08 07:20:07
      吳越納土歸宋的真相:3千多錢氏宗族遷居開封,錢弘俶本人被軟禁

      吳越納土歸宋的真相:3千多錢氏宗族遷居開封,錢弘俶本人被軟禁

      歷史擺渡
      2026-02-18 17:15:03
      2026-02-18 22:39:00
      字母榜 incentive-icons
      字母榜
      讓未來不止于大。
      2240文章數(shù) 8043關注度
      往期回顧 全部

      科技要聞

      怒燒45億,騰訊字節(jié)阿里決戰(zhàn)春節(jié)

      頭條要聞

      5位新能源車主春運開車出行 特斯拉車主:電車更好開

      頭條要聞

      5位新能源車主春運開車出行 特斯拉車主:電車更好開

      體育要聞

      奪銀被問丟金,谷愛凌回擊外媒:很荒謬

      娛樂要聞

      明星過年百態(tài)!黃曉明等現(xiàn)身三亞

      財經(jīng)要聞

      面條火腿香菇醬!上市公司這些年請你吃

      汽車要聞

      量產(chǎn)甲醇插混 吉利銀河星耀6甲醇插混版申報圖

      態(tài)度原創(chuàng)

      房產(chǎn)
      本地
      教育
      手機
      公開課

      房產(chǎn)要聞

      三亞新機場,又傳出新消息!

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      教育要聞

      提醒家長:過年,一定讓孩子遠離5種有毒的親戚

      手機要聞

      央視春晚首度將手機納入舞臺主鏡頭陣列,華為Mate 80系列唯一手機設備完成豎屏直播

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版