<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Claude Sonnet 4.6 發布

      0
      分享至

      大年初二,祝大家新年好

      然后,Anthropic 今天發布了 Claude Sonnet 4.6

      編碼、Computer Use、長上下文推理、Agent 規劃、知識工作、設計,全線升級。上下文窗口拉到 100 萬 token(beta)。價格沒變,還是 $3/$15 每百萬 token,跟 Sonnet 4.5 一樣


      模型價格對比

      Free 和 Pro 用戶現在打開 claude.ai 和 Claude Cowork,默認模型已經換成 Sonnet 4.6 了

      到底強多少

      Anthropic 在 Claude Code 里做了內測,用戶 70% 的時候更喜歡 Sonnet 4.6 而不是 Sonnet 4.5

      更狠的數據是,用戶拿它跟去年 11 月發的旗艦模型 Opus 4.5 比,59% 的時候更喜歡 Sonnet 4.6

      內測用戶的反饋集中在幾個點:修改代碼之前會先好好讀上下文,會主動合并重復邏輯而不是到處復制粘貼,長時間使用不那么讓人抓狂了。過度工程化和「偷懶」的情況明顯少了,instruction following 好了一截。虛報完成、幻覺、多步任務半途而廢的情況都在減少


      Sonnet 4.6 benchmark 對比

      基準測試上,Sonnet 4.6 全面接近 Opus 級別的智力水平。前端代碼和金融分析是客戶反饋里提升最突出的兩個方向,多個客戶獨立地說視覺輸出更精致了,布局、動畫、設計感都比之前的模型好,迭代輪次也少了

      100 萬 token 上下文

      1M token 的上下文窗口能裝下整個代碼庫、長合同、幾十篇論文

      但關鍵不只是能裝,是裝進去之后還能有效推理。Anthropic 拿 Vending-Bench Arena 測了一下,這個評測讓模型去經營一家(模擬的)公司,不同 AI 模型之間還會互相競爭

      Sonnet 4.6 搞出了一個有意思的策略:前 10 個模擬月大量投入產能,花得比競爭對手多很多,然后在最后階段急轉彎聚焦盈利。靠這個時間差,最終利潤遠超其他模型


      Vending-Bench Arena 策略對比圖 Computer Use

      2024 年 10 月 Anthropic 首發通用 Computer Use 的時候,自己都說「還是實驗性的,用起來有時候笨手笨腳還容易出錯」

      16 個月過去了,OSWorld 基準測試(讓模型在真實軟件環境里完成任務,用的是 Chrome、LibreOffice、VS Code 這些,沒有特殊 API,就是看屏幕、點鼠標、打字)上,Sonnet 系列模型的分數一路在漲


      OSWorld 分數趨勢

      早期用戶反饋,在操作復雜電子表格、填寫多步驟網頁表單、跨多個瀏覽器標簽頁協同這些任務上,Sonnet 4.6 已經接近人類水平了

      安全方面,Computer Use 最大的風險是 prompt injection,惡意網站藏指令讓模型執行。Sonnet 4.6 在抵御 prompt injection 上比 Sonnet 4.5 有大幅提升,跟 Opus 4.6 水平接近

      平臺更新

      API 側,Sonnet 4.6 同時支持 adaptive thinking 和 extended thinking,context compaction(beta)可以在對話接近上限時自動壓縮舊上下文

      Claude 的 web search 和 fetch 工具現在會自動寫代碼來過濾和處理搜索結果,只保留相關內容在上下文里。code execution、memory、programmatic tool calling、tool search、tool use examples 這幾個功能正式 GA 了

      Claude in Excel 插件現在支持 MCP connectors,可以在 Excel 里直接調用 S&P Global、LSEG、Daloopa、PitchBook、Moody's、FactSet 這些工具。如果你在 claude.ai 已經配好了 MCP connectors,Excel 里直接能用。Pro、Max、Team、Enterprise 計劃可用

      Anthropic 的建議是,extended thinking 關掉的情況下 Sonnet 4.6 表現也很好,可以根據具體場景調整 thinking effort 找到速度和質量的平衡點。需要最深度推理的任務(代碼庫重構、多 Agent 協調、對精度要求極高的場景),Opus 4.6 仍然是更好的選擇

      怎么用

      所有 Claude 計劃、Claude Cowork、Claude Code、API、各大云平臺,現在都能用

      免費版也升級到 Sonnet 4.6 了,還帶上了 file creation、connectors、skills 和 compaction

      開發者用 API 調用的模型名是 claude-sonnet-4-6

      安全評估方面,Anthropic 的安全研究員對 Sonnet 4.6 的總結是:整體跟其他近期 Claude 模型一樣安全或者更安全,性格溫和、誠實、親社會,偶爾還挺有趣,安全行為很強,沒有發現重大的高風險 misalignment 跡象

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      電動車或將淘汰!替代品已落地:不充電、不怕冷、續航超100公里

      電動車或將淘汰!替代品已落地:不充電、不怕冷、續航超100公里

      沙雕小琳琳
      2026-04-02 08:49:11
      姆巴佩:梅西強得太夸張了,足球里幾乎每樣事他都做得特別好

      姆巴佩:梅西強得太夸張了,足球里幾乎每樣事他都做得特別好

      懂球帝
      2026-04-03 07:48:15
      蘋果宣布,此產品系列全面下架停產!

      蘋果宣布,此產品系列全面下架停產!

      XCiOS俱樂部
      2026-04-02 15:07:45
      第一個準備下場參戰的中東強國已經挨打,伊朗要槍斃所有出頭鳥

      第一個準備下場參戰的中東強國已經挨打,伊朗要槍斃所有出頭鳥

      幾人盡棄
      2026-04-03 15:28:26
      民進黨,極有可能在下一屆臺灣地區選舉后,成為長期一家獨大政黨

      民進黨,極有可能在下一屆臺灣地區選舉后,成為長期一家獨大政黨

      共工之錨
      2026-03-31 00:27:37
      開盒Claude Code的原來是中國00后!曾怒懟Anthropic竊取用戶代碼

      開盒Claude Code的原來是中國00后!曾怒懟Anthropic竊取用戶代碼

      量子位
      2026-04-02 15:24:09
      94年,我借宿在女同學家,夜晚聽見她娘問:那后生,你中意不?

      94年,我借宿在女同學家,夜晚聽見她娘問:那后生,你中意不?

      阿凱銷售場
      2026-03-29 18:58:18
      普京亮出王牌:美軍若敢踏入伊朗,車臣精銳就敢下場死戰

      普京亮出王牌:美軍若敢踏入伊朗,車臣精銳就敢下場死戰

      起喜電影
      2026-04-03 13:17:06
      云南30歲女子賣淫:一天接客多達十幾人,每次時長不限價格僅百元

      云南30歲女子賣淫:一天接客多達十幾人,每次時長不限價格僅百元

      老貓觀點
      2026-04-03 08:13:49
      睡前默念這5個字,百歲高僧開示:這是最簡單的“修心聚能”法

      睡前默念這5個字,百歲高僧開示:這是最簡單的“修心聚能”法

      溫情郵局
      2026-03-31 09:34:25
      中東危機只是小菜?更大危機還在后面,外媒:中國將徹底顛覆戰場

      中東危機只是小菜?更大危機還在后面,外媒:中國將徹底顛覆戰場

      嘆知
      2026-03-29 18:13:46
      快船本賽季遭馬刺三殺!加蘭連續兩戰提前離開更衣室拒絕接受采訪

      快船本賽季遭馬刺三殺!加蘭連續兩戰提前離開更衣室拒絕接受采訪

      Emily說個球
      2026-04-03 14:30:12
      皇馬逃過一劫!阿隆索力薦的 7000 萬水貨,在英超徹底現原形

      皇馬逃過一劫!阿隆索力薦的 7000 萬水貨,在英超徹底現原形

      瀾歸序
      2026-04-03 04:06:56
      山東泰安一小學要求6:40前到校、遲到罰站,教體局先稱“不可能”后改口:已統一要求7點30分到校,將加強家校溝通,保障學生休息時間

      山東泰安一小學要求6:40前到校、遲到罰站,教體局先稱“不可能”后改口:已統一要求7點30分到校,將加強家校溝通,保障學生休息時間

      大風新聞
      2026-04-02 16:03:10
      一節崩?湖人首節21-44落后雷霆23分 東契奇6中1里夫斯腰部不適

      一節崩?湖人首節21-44落后雷霆23分 東契奇6中1里夫斯腰部不適

      醉臥浮生
      2026-04-03 10:15:21
      世預賽小組賽墊底也能進世界杯?瑞典晉級世界杯引爆爭議

      世預賽小組賽墊底也能進世界杯?瑞典晉級世界杯引爆爭議

      星耀國際足壇
      2026-04-03 00:32:30
      網友哭泣:孩子考公9年沒上岸,人廢了!

      網友哭泣:孩子考公9年沒上岸,人廢了!

      黯泉
      2026-04-02 14:36:07
      奧萊報:阿根廷26人大名單敲定22人,最后4席爭奪進入白熱化

      奧萊報:阿根廷26人大名單敲定22人,最后4席爭奪進入白熱化

      懂球帝
      2026-04-02 15:55:50
      美國宣布:4月2日重返月球!尷尬的是:美國目前沒有載人登月能力

      美國宣布:4月2日重返月球!尷尬的是:美國目前沒有載人登月能力

      粵語音樂噴泉
      2026-04-01 13:11:23
      出大事了,伊朗導彈精準斬首!11國對美國發出通牒,特朗普變臉

      出大事了,伊朗導彈精準斬首!11國對美國發出通牒,特朗普變臉

      孤酒老巷QA
      2026-04-03 13:42:57
      2026-04-03 16:04:49
      賽博禪心
      賽博禪心
      拜AI古佛,修賽博禪心
      357文章數 50關注度
      往期回顧 全部

      科技要聞

      5萬輛庫存車,給了特斯拉一記重拳

      頭條要聞

      小米宣布部分手機調價 盧偉冰、魏思琪:望大家理解

      頭條要聞

      小米宣布部分手機調價 盧偉冰、魏思琪:望大家理解

      體育要聞

      沖擊世界杯失敗,80歲老帥一氣之下病倒了

      娛樂要聞

      《浪姐7》最新人氣TOP 曾沛慈斷層第一

      財經要聞

      專家稱長期攝入“飄香劑”存在健康隱患

      汽車要聞

      你介意和遠房親戚長得很像嗎?

      態度原創

      本地
      家居
      教育
      健康
      數碼

      本地新聞

      跟著歌聲游安徽,聽古村回響

      家居要聞

      溫馨多元 愛的具象化

      教育要聞

      教育部:義務教育學校嚴禁設立重點班、實驗班、快慢班

      干細胞抗衰4大誤區,90%的人都中招

      數碼要聞

      同一塊主板連“殺”三顆銳龍7 用戶稱華擎B850M已成“連環殺手”

      無障礙瀏覽 進入關懷版