10分鐘前,Anthropic 發布了 Claude Haiku 4.5
![]()
先說結論:
- 性能接近五個月前的旗艦 Sonnet 4
- 成本降到三分之一,速度快了一倍多
- 某些任務上甚至超過 Sonnet 4
直到上個月,Sonnet 4 還都是旗艦模型,現在一個小模型就能達到
性能表現
![]()
從完整的 benchmark 來看,Haiku 4.5 的表現很有意思
編程能力:
- Agentic coding(SWE-bench):73.3%
- Terminal coding:41.0%
- 跟 Sonnet 4(72.7%、36.4%)基本持平
數學能力:
- Python 工具支持:96.3%
- 無工具:80.7%
- 這個表現甚至超過了很多大模型
Computer Use:
- OSWorld:50.7%
- 這個成績是亮點,直接超過 Sonnet 4 的 42.2%
說實話,在計算機使用這個任務上,Haiku 4.5 的表現確實讓人意外
速度升級
Anthropic 特別強調了速度這個點
原話是:more than twice the speed
體感就是:同樣的任務,等待時間直接砍半,Claude Code 寫代碼的速度感會好很多
對于需要頻繁調用 API 的應用來說,這個速度提升的價值可能比成本降低更重要
價格便宜
對比 Sonnet 4 的價格,Haiku 4.5 便宜了三分之一:
- 輸入:$1 / 百萬 tokens
- 輸出:$5 / 百萬 tokens
對比一下 Sonnet 4 的價格,Haiku 4.5 便宜了三分之一
![]()
部署渠道:
- Claude API
- Amazon Bedrock
- Google Cloud Vertex AI
- Claude Code
- Claude 網頁版和 App
基本上,能用 Claude 的地方,現在都能用 Haiku 4.5
模型名稱:claude-haiku-4-5
安全性
這里有個很有意思的點:Haiku 4.5 是 Anthropic 目前最安全的模型
按照 Anthropic 的自動化對齊評估,Haiku 4.5 的 misaligned behaviors 比例甚至低于 Sonnet 4.5 和 Opus 4.1
然后,因為在 CBRN(化學、生物、放射性、核武器)風險評估中表現良好,Haiku 4.5 被歸類為 ASL-2
![]()
相比之下,Sonnet 4.5 和 Opus 4.1 都是更嚴格的 ASL-3
最后說兩句
我覺得吧,Haiku 4.5 的發布,其實展示了一個很清晰的趨勢:
AI 能力的「下沉」速度,遠比我們想象的快
五個月前還是旗艦的性能,現在已經變成了小模型的標配
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.