![]()
最強(qiáng)模型易主,Claude Opus 4.5 今日上線!
Anthropic 稱其為目前世界上最適合編程、Agent(智能體)和計(jì)算機(jī)操作的模型。不僅更聰明、更高效,在深度研究、處理ppt和電子表格等日常任務(wù)上也實(shí)現(xiàn)了顯著提升
![]()
![]()
![]()
![]()
![]()
一句話總結(jié):Opus 4.5 是 AI 能力的一次跨越,預(yù)示著未來工作方式的改變
現(xiàn)在即可使用
開發(fā)者:通過 API 調(diào)用 claude-opus-4-5-20251101
價(jià)格:輸入 輸 出 25(每百萬 token)
平臺(tái):覆蓋自家 App、API 及三大云平臺(tái)
對于訂閱用戶(Max 和 Team Premium),Anthropic 移除了 Opus 專屬的限制,并提高了整體使用限額,確保用戶能在日常工作中充分使用 Opus 4.5
核心亮點(diǎn)速覽:
編程能力碾壓:在內(nèi)部入職測試中,得分超過所有人類求職者
更聰明:能夠通過“曲線救國”解決復(fù)雜問題(如通過升艙來修改不可改簽的機(jī)票)。
更省錢:引入“努力程度”控制,中等設(shè)置下比 Sonnet 4.5 節(jié)省 76% token,性能持平
價(jià)格真香:API 價(jià)格定為 25(每百萬 token),價(jià)格只有原來 Opus 4.1 的 1/3
編程能力:超越人類候選人
Anthropic 給 Opus 4.5 安排了一場“硬仗”,自家公司出了名難的性能工程入職筆試
結(jié)果令人咋舌:在規(guī)定的 2 小時(shí)時(shí)限內(nèi),Claude Opus 4.5 的得分高于以往任何一位人類候選人
雖然這并不代表它擁有人類的協(xié)作與溝通技巧,但在技術(shù)能力和抗壓判斷力上,AI 已經(jīng)跑到了前面。
在實(shí)際體驗(yàn)中,測試人員反饋極為一致:Opus 4.5 能夠處理模糊性問題,無需手把手指導(dǎo)即可權(quán)衡利弊。面對復(fù)雜的多系統(tǒng) Bug,它能獨(dú)立找出修復(fù)方案。幾周前 Sonnet 4.5 幾乎無法完成的任務(wù),現(xiàn)在 Opus 4.5 都能搞定
![]()
”鉆空子”也是一種智慧
在考察 Agent 能力的 τ-bench 基準(zhǔn)測試中,Opus 4.5 展現(xiàn)出了驚人的變通能力。
測試場景是:作為航空公司客服,幫助一位焦慮的客戶修改機(jī)票。規(guī)則是基礎(chǔ)經(jīng)濟(jì)艙不可修改
大多數(shù)模型會(huì)直接拒絕。但 Opus 4.5 找到了一條合規(guī)的解決路徑:先幫客戶升艙,然后再修改航班
雖然基準(zhǔn)測試判定其為失敗(因?yàn)槲窗搭A(yù)期拒絕),但這正是人類所期待的創(chuàng)造性解決問題的能力。同時(shí),Anthropic 也在安全測試中加強(qiáng)了對此類行為的約束,防止模型為了達(dá)成目標(biāo)而玩弄規(guī)則
引入“努力程度”控制:效率提升 76%
模型變強(qiáng)了,通常意味著更貴、更慢?Opus 4.5 給出了新解法。
開發(fā)者現(xiàn)在可以通過 API 中的 effort parameter(努力程度參數(shù)) 來平衡時(shí)間、成本和性能:
中等努力(Medium effort): 在 SWE-bench Verified 榜單上,Opus 4.5 達(dá)到了 Sonnet 4.5 的最高分,但輸出 token 減少了 76%
最高努力(High effort): 性能比 Sonnet 4.5 高出 4.3 個(gè)百分點(diǎn),同時(shí) token 消耗仍減少了 48%
配合上下文壓縮和高級(jí)工具使用,Opus 4.5 能夠運(yùn)行更久、做更多事,且需要的人工干預(yù)更少。
全家桶更新:Excel、Chrome 都能用了
伴隨 Opus 4.5 的發(fā)布,Claude 開發(fā)者平臺(tái)和消費(fèi)級(jí)應(yīng)用也迎來了全面升級(jí):
Claude Code:新增 Plan Mode(計(jì)劃模式),在執(zhí)行前會(huì)先問清楚需求并生成可編輯的計(jì)劃文件。桌面版支持并行運(yùn)行多個(gè)會(huì)話(如一個(gè)修 Bug,一個(gè)查資料)
Claude for Excel:Beta 版現(xiàn)已向所有 Max、Team 和 Enterprise 用戶開放
Claude for Chrome:Max 用戶現(xiàn)可使用 Claude 跨標(biāo)簽頁處理任務(wù)。
長對話無障礙:Claude 應(yīng)用現(xiàn)在會(huì)自動(dòng)總結(jié)早期上下文,長對話不再撞墻
最后最重要的是記得??我,這對我非常重要,每天都在更新:
一鍵三連,歡迎點(diǎn)贊轉(zhuǎn)發(fā)推薦評論,別忘了關(guān)注我
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.