<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Anthropic半月兩發新模型 “史上最強Sonnet”劍指智能體 定價僅為旗艦五分之一

      0
      分享至

      《科創板日報》2月18日訊(編輯 宋子喬) 北京時間2月18日凌晨,Anthropic悄然發布了其新一代中型模型Claude Sonnet 4.6。這款被官方稱為“史上最強Sonnet”的模型,在多項基準測試中接近Opus水平,但價格僅為后者的五分之一。


      Anthropic半月兩發新模型

      此時距離Anthropic的旗艦模型Claude Opus 4.6發布不到半個月,Claude Opus 4.6于2026年2月5日正式發布。

      Claude Sonnet 4.6可以被視為智能體(Agent)的理想基礎模型。它的設計目標和核心能力升級,正是為了支撐復雜的智能體任務。據介紹,其在計算機使用能力和智能體規劃方面表現尤為突出,可以執行需要多個步驟的計算機操作,例如填寫網頁表單,然后跨多個瀏覽器標簽頁協調信息。Anthropic稱:“在操作計算機方面,該模型當然仍落后于最熟練的人類。但盡管如此,其進步速度依然驚人?!辈贿^,該模型在抵御提示詞注入攻擊(Prompt Injection Attacks)等安全威脅方面表現更好,這類攻擊是指通過惡意指令操控AI模型。

      Anthropic預計,到2029年將向亞馬遜、谷歌和微軟支付至少800億美元,以在其云服務器上運行Claude AI。

      性能躍升 逼近“旗艦級”

      Sonnet 4.6在編程、計算機操作、長上下文推理、智能體規劃等任務處理上有了跨越式提升。Anthropic公布的基準測試顯示,該模型在多項關鍵指標上已接近甚至超越其2月6日剛發布的旗艦模型Opus 4.6。

      在Agent金融分析和辦公任務(GDPVal-AA)兩項測評中,Sonnet 4.6的得分分別達到63.3%和1633 Elo,雙雙超過Opus 4.6的60.1%和1606 Elo。在評估真實世界軟件工程能力的SWE-bench測試中,其表現同樣逼近Opus水平。

      模型保留了100萬token的超大上下文窗口(測試版),這意味著它可以一次性處理整部《三體》trilogy級別的代碼庫或數百頁的研究論文。更重要的是,Anthropic強調Sonnet 4.6能夠“有效地在整個上下文中進行推理”,這對于需要長期規劃的復雜任務至關重要。

      在計算機使用能力方面,Sonnet 4.6在OSWorld基準測試中取得了72.5分,較一年前的28.0分實現質的飛躍。早期用戶反饋顯示,它在處理復雜電子表格、填寫多步驟網頁表單以及跨瀏覽器標簽協同操作等任務時,已展現出接近人類水平的能力。

      應用場景:從代碼重構到企業辦公

      Sonnet 4.6的升級直接轉化為廣泛的應用場景落地。在編程領域,一位開發者在社交平臺X上分享了他的驚艷體驗:Sonnet 4.6僅用一次API調用就重構了整個代碼庫——執行了25次工具調用,新增3000多行代碼,創建了12個全新文件,將單體應用成功模塊化。

      在企業級應用中,Box公司首席技術官Ben Kus證實:“Sonnet 4.6在深度推理和復雜Agent任務上表現出了顯著進步,在重度推理Q&A任務上比Sonnet 4.5提升了15個百分點?!苯鹑诳萍脊綡ebbia也報告稱,其內部基準測試的答案匹配率出現大幅躍升。

      值得注意的是,Sonnet 4.6展現出了一種近乎“戰略思考”的能力。在Vending-Bench Arena模擬商業運營的評測中,該模型發展出了一套獨特策略:前期重金投資能力建設,最后階段迅速轉向盈利,最終收益遠超競爭對手。

      Anthropic的“性價比之作”

      Claude Sonnet 4.6延續了Sonnet系列的經濟定價策略:每百萬token輸入3美元、輸出15美元,與Sonnet 4.5持平。由于性能直接逼近Opus級別,對于免費和Pro訂閱用戶,它已成為claude.ai和Claude Cowork的默認模型。

      AWS已第一時間宣布Sonnet 4.6在Amazon Bedrock上架,稱其為“Anthropic的最強計算機使用模型”。

      市場擔憂,Anthropic這種以低成本提供高性能模型的做法,正在加速AI融入真實工作流,并可能重構企業軟件的定價模式,這種情緒在短時間內轉為焦慮與擔憂:AI是否會顛覆或是直接取代SaaS乃至軟件行業。

      在與Opus 4.5的對比測試里,用戶有59%的時間更偏好Sonnet 4.6。開發者普遍認為,Sonnet 4.6在修改代碼前能更有效地讀取上下文,整合共享邏輯而非簡單復制,并且“過度工程化更少、幻覺更少、多步驟任務執行更穩”。一位開發者直言:“Claude Sonnet 4.6以更低的成本實現了接近Opus的智能水平,這對預算有限的團隊意義非凡?!?/p>

      不過,也有部分用戶認為Sonnet 4.6未達到預期,指出其在編程方面并未全面超越Opus 4.5,更像是“Cowork功能的升級”。

      關于Anthropic

      Anthropic由前OpenAI研究副總裁達里奧·阿莫迪兄妹于2021年創立,核心團隊曾參與GPT-2和GPT-3的早期研發。因對OpenAI的發展方向存在分歧,他們離職創辦了這家致力于AI安全與研究的公司。

      憑借創始人團隊的光鮮背景,該公司融資步伐迅猛,自成立以來累計融資額已超300億美元。2026年2月,公司剛完成300億美元G輪融資,投后估值飆升至3800億美元,使其成為全球估值第二高的AI獨角獸,僅次于OpenAI。本輪融資參與方包括光速創投(Lightspeed Venture Partners)、門洛風險投資(Menlo Ventures)、摩根士丹利投資(Morgan Stanley Investment)、NX1資本(NX1 Capital)及卡塔爾投資局(Qatar Investment Authority)。

      Anthropic最核心的產品是Claude系列大語言模型,按照能力梯隊劃分為三個層級:

      Claude Opus系列:旗艦級模型,代表當前最高智能水平。
      Claude Sonnet系列:性能與成本的平衡之選,也是大眾用戶接觸最多的模型。
      Claude Haiku系列:輕量級模型,主打快速響應和低成本,適用于實時交互場景。

      基于上述模型,Anthropic開發了AI編程助手Claude Code和辦公場景智能體Claude Cowork。Anthropic的年化營收在2025年年底超過90億美元,其中,Claude Code的年化收入已達25億美元。

      責任編輯:荀建國_NN7379

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      美國為何不愿平視中國?牢A揭秘:在西方眼里,我們不能算“人”

      美國為何不愿平視中國?牢A揭秘:在西方眼里,我們不能算“人”

      史智文道
      2026-02-15 17:31:46
      2026臺中市長激戰!江啟臣楊瓊瓔對決鄭麗文規則,誰將破局?

      2026臺中市長激戰!江啟臣楊瓊瓔對決鄭麗文規則,誰將破局?

      阿天愛旅行
      2026-02-18 14:03:42
      98元漲到963元,最近價格飛漲近十倍,網友直呼離譜!有的已突破2000元

      98元漲到963元,最近價格飛漲近十倍,網友直呼離譜!有的已突破2000元

      浙江之聲
      2026-02-17 17:35:40
      喬冠華后人現狀:兒子子承父業,女兒成軍醫,繼女名字家喻戶曉

      喬冠華后人現狀:兒子子承父業,女兒成軍醫,繼女名字家喻戶曉

      林雁飛
      2026-02-14 18:52:26
      美國啟動中國行動計劃,驅趕華裔科學家用印度人替代后,后果初顯

      美國啟動中國行動計劃,驅趕華裔科學家用印度人替代后,后果初顯

      鳶飛九天
      2026-02-13 21:48:00
      印度外長蘇杰生拍桌怒吼:世界不是中美說了算!中等國家要掀桌子

      印度外長蘇杰生拍桌怒吼:世界不是中美說了算!中等國家要掀桌子

      愛意隨風起呀
      2026-02-17 16:42:00
      王健林搞到錢了,萬達翻身有望

      王健林搞到錢了,萬達翻身有望

      財經三分鐘pro
      2026-02-18 15:25:55
      痛失兒子一年后,84歲高明和老伴在云南安享晚年,孫女夾菜很孝順

      痛失兒子一年后,84歲高明和老伴在云南安享晚年,孫女夾菜很孝順

      小虎新車推薦員
      2026-02-17 10:20:59
      慌了 !比起申花輸球!拉唐紅牌!大家更擔心還是米內羅的傷勢!

      慌了 !比起申花輸球!拉唐紅牌!大家更擔心還是米內羅的傷勢!

      80后體育大蜀黍
      2026-02-17 23:47:50
      劉宇寧這條褲子啊,估計演出還沒演完,就得被他拉進“黑名單”了

      劉宇寧這條褲子啊,估計演出還沒演完,就得被他拉進“黑名單”了

      小光侃娛樂
      2025-11-23 11:50:03
      為何大多數國家造不了C919?機身鍛壓機全球僅7臺,被稱為BIG7

      為何大多數國家造不了C919?機身鍛壓機全球僅7臺,被稱為BIG7

      近史談
      2026-01-21 21:34:42
      5位兵團級少將,他們都是誰,軍銜偏低的原因是什么?

      5位兵團級少將,他們都是誰,軍銜偏低的原因是什么?

      幽州校尉
      2025-12-19 18:03:20
      撿漏買到二手物品遠比新的還要香!網友:?這比電視劇拍的都要牛

      撿漏買到二手物品遠比新的還要香!網友:?這比電視劇拍的都要牛

      另子維愛讀史
      2026-02-11 18:29:27
      90年代,跟隨吳學謙副總理8年的秘書調到地方工作,是什么級別?

      90年代,跟隨吳學謙副總理8年的秘書調到地方工作,是什么級別?

      歷史甄有趣
      2026-01-31 07:10:07
      央視記者:短道速滑局面像八年前的平昌,主要看臨場的發揮

      央視記者:短道速滑局面像八年前的平昌,主要看臨場的發揮

      懂球帝
      2026-02-18 15:07:08
      不可錯過!2月18日晚18:30比賽!中央5套CCTV5、CCTV5+直播節目表

      不可錯過!2月18日晚18:30比賽!中央5套CCTV5、CCTV5+直播節目表

      皮皮觀天下
      2026-02-18 14:55:35
      陳沖棄養的中國雙胞胎,25年無下落?蘿莉島300萬頁文件讓人不安

      陳沖棄養的中國雙胞胎,25年無下落?蘿莉島300萬頁文件讓人不安

      壹月情感
      2026-02-10 23:43:27
      放過觀眾吧!這5位春晚“混子”演啥都不好看,難怪遭到觀眾抵制

      放過觀眾吧!這5位春晚“混子”演啥都不好看,難怪遭到觀眾抵制

      徐徐道史
      2025-12-19 20:01:39
      日本投降并非因原子彈?美軍截獲一封密報,揭開了日本投降的真相

      日本投降并非因原子彈?美軍截獲一封密報,揭開了日本投降的真相

      談史論天地
      2026-02-12 09:10:13
      她和奧運冠軍馬琳離婚分走千萬,再婚嫁給金融學霸,如今怎樣了?

      她和奧運冠軍馬琳離婚分走千萬,再婚嫁給金融學霸,如今怎樣了?

      優趣紀史記
      2025-12-28 14:47:11
      2026-02-18 16:36:49
      財聯社 incentive-icons
      財聯社
      以“準確、快速、權威、專業”為新聞準則,為投資者提供專業的投資資訊。
      686008文章數 1017663關注度
      往期回顧 全部

      科技要聞

      怒燒45億,騰訊字節阿里決戰春節

      頭條要聞

      賴清德新年發福袋 宮廟主委突然捂嘴嘔吐噴濺他身上

      頭條要聞

      賴清德新年發福袋 宮廟主委突然捂嘴嘔吐噴濺他身上

      體育要聞

      奪銀被問丟金,谷愛凌回擊外媒:很荒謬

      娛樂要聞

      6大衛視春晚收視出爐 北京臺穩居第一

      財經要聞

      面條火腿香菇醬!上市公司這些年請你吃

      汽車要聞

      量產甲醇插混 吉利銀河星耀6甲醇插混版申報圖

      態度原創

      數碼
      教育
      旅游
      健康
      本地

      數碼要聞

      AMD否認MI455X跳票,重申2026下半年如期交付Helios

      教育要聞

      “新校長”應有的模樣

      旅游要聞

      弦子的山海經|從“成為中國人”到“在中國過春節”,老外為啥都愛上了中國?

      轉頭就暈的耳石癥,能開車上班嗎?

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      無障礙瀏覽 進入關懷版