![]()
似乎每個節假日前,模型嘗試都開始卷起來。DeepSeek V3.2-EXP 剛發完,Claude 4.5 也跟著來了。
看這個版本號就應該知道,這是一個重要的版本,那么到底更新了什么?先給忙碌的你三句話總結:
能連軸轉:官方與多家媒體實測,Claude 4.5 可以連續自主工作 30+ 小時,長鏈路任務穩定性肉眼可見。
更會“用電腦”:在真實電腦操作評測 OSWorld 上升到 61.4%(上一代是 42.2%),瀏覽器里點點點、表格里填填填,熟練度顯著提升。
工程化升級:SWE-bench Verified 達 77.2%(高算力配置可到 82.0%),同時產品側一口氣上了Agent SDK、代碼執行與文件生成功能、VS Code 擴展、記憶與上下文編輯等一攬子工具。
![]()
01|到底更新了什么?
① 長時自主 + 電腦使用能力躍遷
這是Sonnet 4.5最令人驚嘆的特性之一!
這次的主軸很明確:把“能干活、能長期干活、能像人一樣用電腦”做實。
以前的AI模型,你讓它干個復雜的活,可能幾個小時就“累了”或者“忘了”。但現在:
超長待機:Claude Sonnet 4.5 可以連續自主工作長達30個小時!是上一代(Claude 4 Opus)的4倍多。
能動手,不吵吵:它不再僅僅是語言模型,而是可以實際操作電腦的“智能體”。OSWorld 指標也從 4 月的 42.2% 拉到 61.4%,屬于質變區間。
OSWorld:一項測試 AI 模型在真實計算機任務中表現的基準測試。
② 編碼與工程能力
![]()
在全球最權威的編程能力測試 SWE-Bench Verified 上,Sonnet 4.5 拿下了歷史最高分,這意味著它解決復雜編程問題的能力已經超越了所有對手。
更關鍵的是,它支持并行工具執行、更強的錯誤自糾與計劃能力,適合做“端到端”工程活,而不僅是寫段 Demo。
③ 產品線一攬子增強
Claude Code:配套的 Claude Code 也迎來了“史詩級”增強,比如:
檢查點 (Checkpoints):寫代碼寫到一半崩了?沒關系,現在可以像玩游戲一樣“讀檔”,一鍵回到之前的版本。
原生VS Code插件:直接在你的編程工具里就能用,無縫銜接,體驗拉滿。
Claude 應用:對話里直接執行代碼、新建文件(表格、PPT、文檔),減少在各工具間來回切。
開發者平臺 / API:新增上下文編輯與Memory 工具,讓 Agent 跑得更久、管理復雜度更低;同步推出Claude Agent SDK,把官方在 Claude Code 上用的基建開放出來。
瀏覽器能力:Chrome 擴展向此前加入候補的 Max 用戶開放,讓“會用電腦”的能力更易用。
④ 安全與對齊
官方給 4.5 貼上“最對齊的前沿模型”標簽:在奉承、欺騙、越權、誘導等行為上進一步壓降;并針對提示注入等 Agent 常見風險做了強化。
本次按 ASL-3 安全級別發布,同時配套 CBRN 等敏感領域分類器。
02|價格與可用性
價格不變:API 側維持 $3 / $15(百萬輸入 / 輸出 token),這相當是加量不加價了。
哪里用:Claude.ai 網頁 / iOS / Android 直接可用;Claude Developer Platform 原生提供;Amazon Bedrock、Google Cloud Vertex AI 同步上架(企業集成更順手)。
研究預覽:面向 Max 用戶推出“Imagine with Claude”為期 5 天的實驗項目(自 9 月 29 日 起算),現場看它“即寫即跑”生成軟件。
03|這對我們意味著什么?
對開發者而言:開發效率將迎來指數級提升。大量基礎、重復的編碼和調試工作可以交給AI,開發者能更專注于創新和架構設計。
對普通人而言:AI 的動手能力變得更強。未來,你可能只需要動動嘴,你的AI助理就能幫你預訂機票、管理日程、處理郵件,甚至完成更復雜的工作。
對行業而言:AI智能體(Agents)的商業化落地將大大加速。從自動化客服到企業流程自動化(RPA),各行各業都將看到AI帶來的顛覆性變革。
04|我對這次升級的判斷
戰略位移從“會答題”到“會干活”:30 小時這個數字背后,是對穩定性與流程化的押注。它讓“自動化 + 治理”真正可運營。
不止是跑分,更是產品化能力:文件生成、代碼執行、VS Code 擴展、瀏覽器擴展 + SDK,把“模型”變成“工具鏈”。
最后:這次的 Claude 4.5,更像一位能“通宵加班不喊累”的準同事。如果你團隊里已經在試探 Agent 化,不妨就從這版開始,把真正的長鏈路、可回滾、可治理當成默認配置。
本文由「AI 范兒」出品
我每天都在更新,如果你覺得這些內容對你有用,
那我們就加個關注、交個朋友。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.