網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

剛剛，馬斯克新模型撞車Claude，口碑崩了

2026-02-18 07:12:23　來源: AppSo

廣東舉報

分享至

完成 300 億美元融資后，Anthropic 交出了第一份 AI 答卷。就在剛剛，Claude Sonnet 4.6 正式發(fā)布，定位是「史上最強 Sonnet」。

編程、計算機操作、長上下文推理、智能體規(guī)劃，全面升級。價格沒變，還是每百萬 token 3 美元輸入/15 美元輸出，但性能直接逼近 Opus 級別。

在與 Opus 4.5 的對比測試?yán)铮脩粲?59% 的時間更偏好 Sonnet 4.6。理由也很實在：過度工程化更少、幻覺更少、多步驟任務(wù)執(zhí)行更穩(wěn)。

計算機操作能力是這次升級的重頭戲。

在 OSWorld 基準(zhǔn)測試上，Sonnet 系列過去 16 個月持續(xù)進步，現(xiàn)在處理復(fù)雜電子表格、填寫多步驟網(wǎng)頁表單已接近人類水平。

這個能力戳中的是一個真實痛點：很多企業(yè)的老舊軟件沒有現(xiàn)代 API 接口，過去只能專門開發(fā)連接器，現(xiàn)在模型直接像人一樣看屏幕、點鼠標(biāo)就行了，省掉了一大截工程成本。

順帶一提，Excel 中的 Claude 插件這次也同步升級，新增了 MCP 連接器支持，對金融從業(yè)者來說，這個更新很實用。

Sonnet 4.6 另一個亮點是支持 100 萬 token 超大上下文，足以在一次請求里塞進完整代碼庫、數(shù)十篇論文或一堆合同。

在 Vending-Bench Arena 這個模擬企業(yè)運營的評估里，Sonnet 4.6 摸索出一套有意思的策略：前期大舉投資產(chǎn)能，最后階段猛轉(zhuǎn)盈利導(dǎo)向，靠這個轉(zhuǎn)折時機甩開其他模型。支撐這套打法的，正是它的長期規(guī)劃能力。

對普通用戶來說，F(xiàn)ree 和 Pro 方案的默認(rèn)模型已經(jīng)切換為 Sonnet 4.6，claude.ai 和 Claude Cowork 同步更新。

開發(fā)者方面，API 模型標(biāo)識是 claude-sonnet-4-6，支持自適應(yīng)思考、擴展思考，上下文壓縮功能可以在對話快撐爆上下文時自動總結(jié)舊內(nèi)容，省 token 又省心。

? 而就在 Sonnet 4.6 發(fā)布的同期，馬斯克旗下 xAI 的 Grok 4.20 測試版也正式上線了 grok.com。

Grok 4.20 支持并行調(diào)度 4 個專業(yè)智能體——Grok、Harper、Benjamin、Lucas——協(xié)同執(zhí)行任務(wù)。然而整體口碑兩極分化嚴(yán)重，且過往預(yù)期拔得太高，導(dǎo)致不少用戶期望落空，差評偏多。

后續(xù)馬斯克罕見連發(fā)多條推文滅火「救場」。他解釋稱，目前的 Grok 4.20 只是參數(shù)量 500B 的小型基礎(chǔ)模型，尚處公測階段。他還強調(diào)，Grok 4.20 的底層架構(gòu)具備每周自我迭代的能力，遞歸式智能增長空間很大。

按他的說法，公測結(jié)束后，Grok 4.20 的智能和速度將比 Grok 4 提升約一個數(shù)量級。但這個承諾能否兌現(xiàn)，只能說拭目以待吧。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

馬斯克vs奧特曼終極決戰(zhàn)！不要1870億，把OpenAI還給我

新智元 2026-04-25 13:40:32
48 跟貼 48
馬斯克拿1萬億工資，為什么大家都覺得超值

雷科技 2025-11-08 14:17:34
5 跟貼 5

馬斯克：年底有望推出 FSD v15 版，HW4.0 車輛可用！

新浪財經(jīng) 2026-04-24 23:31:25
181 跟貼 181

馬斯克用Grok替代X員工，裁員90%

量子位 2025-11-29 16:58:47
0 跟貼 0
人活著的唯一理由是善良

葉檀財經(jīng) 2026-02-01 17:07:04
0 跟貼 0

馬斯克豪擲600億美元收購AI編程神器Cursor

量子位 2026-04-23 11:44:16
0 跟貼 0

馬斯克的小目標(biāo)：星艦10000發(fā)/年，太空AI算力1太瓦/年

量子位 2026-02-08 23:37:12
0 跟貼 0
黃仁勛GTC直言：現(xiàn)在是OpenClaw的時代，SaaS都將變AgaaS

機器之心Pro 2026-03-17 17:22:21
0 跟貼 0

在四五年內(nèi)，在太空運行大規(guī)模AI將比地面更劃算

每日經(jīng)濟新聞 2026-01-22 12:48:26
0 跟貼 0
老外看中國小伙創(chuàng)意發(fā)明：他比馬斯克還要聰明，發(fā)揮到了極致

愛歌唱的叮當(dāng)貓 2026-04-24 13:21:25
0 跟貼 0
貝佐斯創(chuàng)業(yè)，馬斯克嘲笑，兩人的恩怨糾葛20年

量子位 2025-11-22 12:44:22
0 跟貼 0
馬斯克：全球最大晶圓工廠定了！將采用Intel 14A工藝制造芯片

快科技 2026-04-24 01:05:15
0 跟貼 0
馬斯克的紅顏知己，美國的第一公主伊萬卡，頂級的白富美！

春山愛生活 2026-04-23 11:04:43
49 跟貼 49
特斯拉一季度凈賺4.77億美元，擬建最大芯片工廠

每日經(jīng)濟新聞 2026-04-23 17:49:35
0 跟貼 0
馬斯克最寵愛的小兒子，一刻都離不開父親，抱腿一刻全場沸騰

快樂笑星坊 2026-04-24 14:19:30
1 跟貼 1
馬斯克4秒掙的錢相當(dāng)于普通人一年的收入

每日經(jīng)濟新聞 2026-01-21 00:05:31
0 跟貼 0
谷愛凌媽媽看馬斯克滿是崇拜，谷愛凌不卑不亢，表情成對比

閃光日記 2026-04-24 13:04:13
1 跟貼 1
DeepSeek過于樸素了

虎嗅APP 2026-04-25 17:32:05
105 跟貼 105
Anthropic實驗火了！Claude替人類做了186筆買賣，用Opus能多賺70%

新智元 2026-04-25 19:04:24
1 跟貼 1
馬斯克承認(rèn)HW3車型不支持FSD，要花錢升級硬件

極果酷玩 2026-04-24 16:38:31
2 跟貼 2
科技圈3大肝帝！最后一個連睡覺都在干活

雷科技 2026-02-03 20:54:35
0 跟貼 0
卡帕西都整破防了：AI Coding沒門檻，可部署環(huán)節(jié)真嗯啊的難

量子位 2026-03-27 12:12:46
0 跟貼 0
我在Word里用Claude替換了Copilot：一周后回不去了

賽博蘭博 2026-04-24 10:54:32
0 跟貼 0
Claude Design 真正沖擊的，不是設(shè)計師，而是公司里那層“把想法翻成東西”的中間人力

熱點研究 2026-04-22 19:59:08
25 跟貼 25
馬斯克承認(rèn)一直當(dāng)著特斯拉客戶的面撒謊，謊稱自己是自動駕駛

董董歷史燴 2026-04-26 00:36:20
0 跟貼 0
全國首個！這一健康大模型在福州發(fā)布！省立醫(yī)院未來將率先試行

福建衛(wèi)生報 2026-04-25 18:53:54
9 跟貼 9
26萬特斯拉沒出門就被撞，4S店拒賠：手續(xù)已辦完，找撞車的人

看曉天下事 2026-04-24 10:47:19
0 跟貼 0
SpaceX放出“IPO重磅炸彈”：太空AI技術(shù)未經(jīng)驗證，未必能商業(yè)化！

財聯(lián)社 2026-04-23 11:36:17
0 跟貼 0
馬斯克下場搶人? xAI組建人才狙擊隊? 讓工程師做HR 馬斯克親自組建xAI“人才狙擊隊”：讓工程

量子位 2026-01-22 12:57:14
0 跟貼 0
別問樹模型了!死磕結(jié)構(gòu)化數(shù)據(jù),清華團隊把大模型表格理解推到極限

機器之心Pro 2025-11-21 12:05:36
1 跟貼 1
離譜！特斯拉 Roadster 超級跑車，又跳票了

芝麻科技訊官方號 2026-04-26 00:26:39
0 跟貼 0
貝佐斯討好特朗普，買紀(jì)錄片花四千萬，只為拿五角大樓合同

感謝過往 2026-04-26 03:10:54
0 跟貼 0
馬斯克官宣，無方向盤剎車油門的無人駕駛出租車Cybercab開始生產(chǎn)

鏈聞科技 2026-04-24 16:03:20
7 跟貼 7
又一量產(chǎn)車型落地！奔馳純電 GLC 全面接入豆包大模型

雷峰網(wǎng) 2026-04-25 19:36:05
5 跟貼 5
孤獨流行病：我們治錯了方向？

時光慢郵啊 2026-04-23 10:46:19
0 跟貼 0
馬斯克盛贊中國：人口更多更努力，美國靠機器人才能贏

量子位 2026-02-12 03:27:32
0 跟貼 0
癱瘓23年后，他用腦機接口打魔獸

量子位 2026-03-20 04:40:54
0 跟貼 0
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
【你的AI靠不靠譜？】大模型項目落地評測標(biāo)準(zhǔn)：5 大類 30項指標(biāo)，從技術(shù)到商業(yè)全覆蓋！AI大模型

盧菁老師 2026-04-22 09:25:00
0 跟貼 0
故事 · 典藏 | 斗氣車

故事會 2026-04-21 15:45:19
0 跟貼 0

手機 / 數(shù)碼

房產(chǎn) / 家居

剛剛，馬斯克新模型撞車Claude，口碑崩了

90%訂單消失，中東旺季沒了

牛彈琴：伊朗放了美國人鴿子 特朗普被氣壞了

牛彈琴：伊朗放了美國人鴿子 特朗普被氣壞了

那一刻開始，兩支球隊的命運悄然改變了

《我們的爸爸2》第一季完美爸爸翻車了

漲價浪潮下，DeepSeek推動AI“價格戰(zhàn)”

2026款樂道L90亮相北京車展 樂道L80正式官宣

態(tài)度原創(chuàng)

打卡淄博：從千年文脈到市井煙火

學(xué)校管理：“管”出規(guī)范，“理”出活力

云游中國｜逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

干細(xì)胞如何讓燒燙傷皮膚"再生"？

牛彈琴：伊朗放了美國人鴿子特朗普被氣壞了

牛彈琴：伊朗放了美國人鴿子特朗普被氣壞了

2026款樂道L90亮相北京車展樂道L80正式官宣

云游中國｜逛世界風(fēng)箏都留學(xué)生探秘中國傳統(tǒng)文化