<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      剛剛,Claude Opus 4.7突然發(fā)布:不是最強(qiáng),但奧特曼又得失眠

      0
      分享至


      今年 Anthropic 的勢頭異常兇猛。

      不僅熱度居高不下,口碑也持續(xù)攀升,穩(wěn)坐 AI 圈「頂流」的交椅。現(xiàn)在幾乎每天醒來,都能看到他們準(zhǔn)點(diǎn)推送的新產(chǎn)品或新功能。久而久之,大家也從興奮變成了「是你,果然又是你」的默契感。

      而就在剛剛,萬眾期待的 Claude Opus 4.7 也正式發(fā)布,依舊是熟悉的配方,熟悉的高分選手。


      有趣的是,Anthropic 在公告里非常坦誠,甚至帶著點(diǎn)驕傲:「這并非我們最強(qiáng)大的模型。」那個傳說強(qiáng)得可怕的 Claude Mythos Preview 依然還在藏。

      但就是這個并非最強(qiáng)的 Opus 4.7,卻依舊引發(fā)了極大的關(guān)注。因?yàn)樗鉀Q了一個比聰明更重要的痛點(diǎn):靠譜。不是那種你說什么它就做什么的靠譜,而是當(dāng)你提出一個愚蠢的方案時,它敢于反駁你,并自己把坑填上的靠譜。

      當(dāng)靠譜成為比聰明更稀缺的品質(zhì)

      基準(zhǔn)測試結(jié)果顯示,在業(yè)界公認(rèn)最硬核的 SWE-bench Pro 上,4.7 從前代的 53.4% 直接拉到 64.3%,單代升級漲了近 11 個百分點(diǎn),把 GPT-5.4(57.7%)和 Gemini 3.1 Pro(54.2%)都甩在了身后。

      視覺推理的 CharXiv 基準(zhǔn)從 69.1% 跳到 82.1%,對應(yīng)的是它新獲得的 2576 像素長邊識別能力——清晰度是前代的 3 倍以上。

      這不只是「看得更清楚」這么簡單。更高的分辨率直接帶動了輸出質(zhì)量的連鎖提升:生成界面、制作幻燈片、排版文檔,細(xì)節(jié)精度也全面提升。

      工具調(diào)用規(guī)模化評測 MCP-Atlas 上,4.7 跑出 77.3%,超過 GPT-5.4 的 68.1% 和 Gemini 的 73.9%。法律 AI 平臺 Harvey 測試中,4.7 在 BigLaw 基準(zhǔn)上拿下 90.9%,正確區(qū)分了歷來是前沿模型死穴的「轉(zhuǎn)讓條款」與「控制權(quán)變更條款」。


      不過,4.7 也并非全然遙遙領(lǐng)先,在 Agentic search 評測 BrowseComp 上,4.7 反而從前代的 83.7% 下降到了 79.3%,被 GPT-5.4(89.3%)和 Gemini(85.9%)超越。

      這個退步并非偶然。一個遇到缺失信息會直接報(bào)錯、不肯亂編答案的 Agent,在以「是否給出答案」為評判標(biāo)準(zhǔn)的基準(zhǔn)上,天然會吃虧。

      而數(shù)據(jù)之外,更值得關(guān)注的問題是:這種「靠譜」,在真實(shí)工作里到底意味著什么?

      過去一年,業(yè)界對代碼大模型的期待,普遍還停留在「寫個函數(shù)、找個 Bug」的層面,但 Claude 4.7 在早期測試?yán)铮宫F(xiàn)出了一種截然不同的氣質(zhì)。

      知名云端開發(fā)平臺 Replit 的負(fù)責(zé)人這樣描述:「它在技術(shù)討論中會反駁我,幫我做出更好的決定。它真的感覺像一個更好的同事。」


      它不再一味地「唯命是從」,也不再為了交差而胡編亂造。在數(shù)據(jù)科學(xué)平臺 Hex 的測試?yán)铮?.7 遇到缺失數(shù)據(jù)時會直接報(bào)錯,而不是像前代那樣塞一個「看似合理但完全錯誤」的備選值。Hex 團(tuán)隊(duì)甚至直言:「低消耗狀態(tài)下的 4.7,等同于中等消耗狀態(tài)下的 4.6。」

      這種「拒絕順從」的特質(zhì),恰恰是高級軟件工程里最稀缺的東西。

      當(dāng)然,凡事有兩面。為舊模型寫的 prompt,到了 4.7 手里可能會產(chǎn)生意想不到的結(jié)果。那些過去被模型「意會」掉的模糊指令,4.7 會一字一字地字面執(zhí)行。這也意味著越懂得清楚表達(dá)需求的人,越能從 4.7 這里拿到好結(jié)果。

      光會「頂嘴」還不夠,遇到挫折就罷工的 AI 同樣不是好同事。4.7 的另一個大的變化,是任務(wù)韌性。


      以往大模型在多步任務(wù)中遇到工具調(diào)用失敗,往往直接停機(jī)報(bào)錯。Notion 團(tuán)隊(duì)測試發(fā)現(xiàn),4.7 的工具錯誤率降到了原來的三分之一,更關(guān)鍵的是,它能在工具鏈崩潰時自己繞過障礙,繼續(xù)把任務(wù)跑完。

      當(dāng) AI 停止諂媚,真正的生產(chǎn)力才開始爆發(fā)。

      Anthropic 公布的一個極端案例里,4.7 在沒有任何人類干預(yù)的情況下,從零構(gòu)建了一個完整的 Rust 文本轉(zhuǎn)語音引擎——寫神經(jīng)網(wǎng)絡(luò)模型、SIMD 內(nèi)核和瀏覽器演示,還自己把輸出喂給語音識別器做驗(yàn)證,連測試都一并完成了。

      前端框架巨頭 Vercel 還發(fā)現(xiàn)了一個過去從未有過的行為:4.7 會在開始寫系統(tǒng)級代碼之前,先自己進(jìn)行數(shù)學(xué)證明。這已經(jīng)超出了寫代碼的范疇,進(jìn)入了嚴(yán)謹(jǐn)工程設(shè)計(jì)的領(lǐng)域。

      雇傭 AI「資深專家」的代價(jià)

      為了驗(yàn)證它在細(xì)節(jié)上的處理能力,我設(shè)定了三個前端交互場景,評判標(biāo)準(zhǔn)只有一個:細(xì)節(jié)是否敷衍,一眼便知。

      第一個場景,是讓它做一個俯視視角的黑膠唱片機(jī)界面,其難點(diǎn)在于「金屬光澤」與「呼吸光暈」的呈現(xiàn)。4.7 并沒有用廉價(jià)的色彩漸變敷衍了事,而是通過復(fù)雜的 CSS 樣式疊加,逼真地還原了金屬質(zhì)感。


      第二個場景是只用 CSS,不用 JavaScript 做一個老式電風(fēng)扇。 面對這個限制嚴(yán)格的題目,一些模型會悄悄違規(guī)使用 JS,但 4.7 遵守了規(guī)則。它用純 CSS 做出了風(fēng)扇的立體結(jié)構(gòu),低中高三檔過渡流暢,底座透視和陰影的處理也真有一點(diǎn)實(shí)物感,它在規(guī)則允許的范圍內(nèi)找到了很好的解決辦法。


      第三個場景是做一個復(fù)古磁帶隨身聽,帶有錄像帶那種老舊的噪點(diǎn)效果。磁帶轉(zhuǎn)動的細(xì)節(jié)也是有的。


      當(dāng)然,變聰明是有代價(jià)的。Opus 4.7 現(xiàn)已在所有 Claude 產(chǎn)品和 API、Amazon Bedrock、Google Cloud 的 Vertex AI 以及 Microsoft Foundry 平臺上推出。

      基礎(chǔ)定價(jià)維持在每百萬輸入 5 美元、輸出 25 美元不變。但 4.7 引入了全新分詞器,同樣的文本會拆分出比原來多 1.0 到 1.35 倍的 Token。


      疊加上它在高強(qiáng)度任務(wù)中本身就傾向于「多想一會兒」,實(shí)際消耗幾乎必然上升。

      此外,Anthropic 在原有的難度選項(xiàng)之上,加入了全新的 xhigh(超高)級別。在這個級別下,面對復(fù)雜難題,Claude 4.7 會消耗更多的 Token,花更多的時間去「思考」。Claude Code 已經(jīng)把所有套餐的默認(rèn) effort level 直接拉到了 xhigh。

      Anthropic 用行動告訴所有人,對于真正的編碼任務(wù),省著用不如想清楚。

      為了匹配這種工作流,Claude Code 順勢推出了兩個殺手級功能:

      /ultrareview(深度審查):開啟一個專門的審查會話,像一個極其挑剔的資深 Reviewer 一樣,通讀所有代碼更改,精準(zhǔn)標(biāo)記出深層的架構(gòu)設(shè)計(jì)缺陷和 Bug。Pro 和 Max 用戶可以免費(fèi)試用三次。

      Auto Mode(自動模式)擴(kuò)展到 Max 用戶:一種介于「逐項(xiàng)授權(quán)」和「跳過所有權(quán)限」之間的新權(quán)限模式。Claude 會在你授權(quán)的范圍內(nèi)自主做決策,既能跑完漫長無聊的任務(wù),又比完全放權(quán)更安全。

      為了防止這個「太能思考」的 AI 把賬戶余額刷爆,API 端還推出了「任務(wù)預(yù)算」(Task Budgets)功能公測版,讓開發(fā)者可以顯式規(guī)劃 Claude 在長任務(wù)中的 Token 支出優(yōu)先級。


      當(dāng)然,4.7 并不是 Anthropic 手里最強(qiáng)的牌。

      那個更強(qiáng)的 Claude Mythos Preview,本月剛以「Project Glasswing」的名義,小范圍開放給了一批企業(yè)用于網(wǎng)絡(luò)安全研究。Mythos 沒有公開發(fā)布,原因則是因?yàn)樗木W(wǎng)絡(luò)攻防能力太強(qiáng),Anthropic 覺得還沒想清楚怎么安全地推給所有人。

      4.7 本身也做了主動取舍,訓(xùn)練階段就壓低了網(wǎng)絡(luò)攻防能力,內(nèi)置自動攔截機(jī)制,碰到高風(fēng)險(xiǎn)請求直接擋掉。有合規(guī)需求的安全研究人員,可以通過官方渠道單獨(dú)申請。

      不急著把最強(qiáng)的牌打出去,和不停地往桌上加新牌,背后是同一套邏輯。實(shí)際上,Anthropic 真正的護(hù)城河,是交付節(jié)奏本身。

      在今年 2 月 1 日至 3 月 24 日,短短 52 天里,Anthropic 一共更新了 74 款產(chǎn)品,平均不到兩天一個。Cowork、插件……這些動作扎扎實(shí)實(shí)地?fù)糁辛寺殘鲛k公的痛點(diǎn)。

      如今的 Claude 生態(tài),早就超越了單純的「聊天機(jī)器人」。對于那些渴望將 AI 深度嵌入實(shí)際工作流的團(tuán)隊(duì)而言,這種穩(wěn)定、高頻且可預(yù)期的更新節(jié)奏,才是最讓人感到踏實(shí)的定心丸。

      今天發(fā)布的 Claude 4.7,是這條鏈條上最新的一塊壓艙石。而那個 Mythos Preview,遲早也會來。到那時候,我們現(xiàn)在覺得已經(jīng)很能打的 4.7,可能只是個開端。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      A股,尾盤傳來一個“重磅利好”信號,下周,或?qū)⒂瓉泶笞儽P!

      A股,尾盤傳來一個“重磅利好”信號,下周,或?qū)⒂瓉泶笞儽P!

      夜深愛雜談
      2026-04-24 21:31:35
      文班能不能打?ESPN預(yù)測G3勝率:馬刺66.8%,開拓者33.2%

      文班能不能打?ESPN預(yù)測G3勝率:馬刺66.8%,開拓者33.2%

      懂球帝
      2026-04-25 00:28:08
      中國游客暴跌55.9%,日本361萬游客擠爆櫻花季,缺口被全球填平

      中國游客暴跌55.9%,日本361萬游客擠爆櫻花季,缺口被全球填平

      芳姐侃社會
      2026-04-21 16:37:18
      伊朗高官集體寫信勸最高領(lǐng)袖談判 秘密信件被曝光

      伊朗高官集體寫信勸最高領(lǐng)袖談判 秘密信件被曝光

      桂系007
      2026-04-24 23:58:38
      演訓(xùn)結(jié)束,中國艦隊(duì)離開西太!日本徹底傻眼了,反華竟反到大動脈

      演訓(xùn)結(jié)束,中國艦隊(duì)離開西太!日本徹底傻眼了,反華竟反到大動脈

      夢想的現(xiàn)實(shí)
      2026-04-24 21:57:28
      高德地圖殺瘋了:臺灣下載量狂飆第一,臺當(dāng)局禁令再次慘遭打臉!

      高德地圖殺瘋了:臺灣下載量狂飆第一,臺當(dāng)局禁令再次慘遭打臉!

      影像溫度
      2026-04-24 17:58:11
      歐盟宣布最大的第20輪對俄制裁!完全禁止俄石油海上運(yùn)輸

      歐盟宣布最大的第20輪對俄制裁!完全禁止俄石油海上運(yùn)輸

      項(xiàng)鵬飛
      2026-04-24 12:34:28
      情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

      情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

      新歐洲
      2026-04-21 19:37:05
      “自稱空姐機(jī)艙鬧事”當(dāng)事人還原事發(fā)經(jīng)過,律師稱同機(jī)乘客可索賠

      “自稱空姐機(jī)艙鬧事”當(dāng)事人還原事發(fā)經(jīng)過,律師稱同機(jī)乘客可索賠

      封面新聞
      2026-04-24 05:08:04
      伊朗邊境開火

      伊朗邊境開火

      陸棄
      2026-04-23 09:31:59
      河南12歲貧困女孩,被校長收留免費(fèi)讀書,校長待她如親生。誰知,多年后,無意看見校長車內(nèi)的一件衣服,她竟2次退學(xué)…

      河南12歲貧困女孩,被校長收留免費(fèi)讀書,校長待她如親生。誰知,多年后,無意看見校長車內(nèi)的一件衣服,她竟2次退學(xué)…

      勵職派
      2026-04-24 12:48:47
      太意外了!2032奧運(yùn)舉辦地敲定:結(jié)果驚呆眾人,奧運(yùn)格局大變!

      太意外了!2032奧運(yùn)舉辦地敲定:結(jié)果驚呆眾人,奧運(yùn)格局大變!

      小濤叨叨
      2026-04-22 17:06:20
      張雪機(jī)車召回事件升級!63歲技術(shù)專家:0型圈不是裝反 是位置裝錯

      張雪機(jī)車召回事件升級!63歲技術(shù)專家:0型圈不是裝反 是位置裝錯

      周哥一影視
      2026-04-24 18:37:28
      兩只大熊貓將前往亞特蘭大,外交部:將為增進(jìn)中美人民友誼做出新貢獻(xiàn)

      兩只大熊貓將前往亞特蘭大,外交部:將為增進(jìn)中美人民友誼做出新貢獻(xiàn)

      澎湃新聞
      2026-04-24 15:30:30
      笑不活了!當(dāng)你覺得在工作中捅了很大的簍子的時候,不妨看看他

      笑不活了!當(dāng)你覺得在工作中捅了很大的簍子的時候,不妨看看他

      蘭妮搞笑分享
      2026-04-24 12:59:31
      安妮海瑟薇《穿普拉達(dá)的女王2》首映驚艷,再度獲封全球最美

      安妮海瑟薇《穿普拉達(dá)的女王2》首映驚艷,再度獲封全球最美

      瘋狂影視圈
      2026-04-24 11:13:56
      24號收評:三大指數(shù)集體下挫,所有人都注意,大盤下周開始這樣看

      24號收評:三大指數(shù)集體下挫,所有人都注意,大盤下周開始這樣看

      春江財(cái)富
      2026-04-24 15:28:32
      穆鐵柱的最后一天:在家中蹬自行車健身,突然兩眼一黑癱倒在地

      穆鐵柱的最后一天:在家中蹬自行車健身,突然兩眼一黑癱倒在地

      大運(yùn)河時空
      2026-04-21 16:30:03
      燃?xì)夤旧祥T安檢,根本不是查漏氣!真正目的其實(shí)是這3個

      燃?xì)夤旧祥T安檢,根本不是查漏氣!真正目的其實(shí)是這3個

      匹夫來搞笑
      2026-04-20 13:24:51
      悲催!北京土著欲娶北方小縣城留京女,因彩禮問題,男方果斷分手

      悲催!北京土著欲娶北方小縣城留京女,因彩禮問題,男方果斷分手

      火山詩話
      2026-04-23 06:28:37
      2026-04-25 00:55:00
      愛范兒 incentive-icons
      愛范兒
      消費(fèi)科技第一媒體
      38763文章數(shù) 2601556關(guān)注度
      往期回顧 全部

      科技要聞

      DeepSeek V4牽手華為,價(jià)格依然"屠夫級"

      頭條要聞

      航班提前起飛10分鐘 大學(xué)生把海航告了

      頭條要聞

      航班提前起飛10分鐘 大學(xué)生把海航告了

      體育要聞

      上海男籃23連勝+主場全勝 姚明之后最強(qiáng)一季

      娛樂要聞

      停工16個月!趙露思證實(shí)接拍新劇

      財(cái)經(jīng)要聞

      LG財(cái)閥內(nèi)斗:百億美元商業(yè)帝國爭奪戰(zhàn)

      汽車要聞

      零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

      態(tài)度原創(chuàng)

      手機(jī)
      本地
      健康
      時尚
      公開課

      手機(jī)要聞

      四大國產(chǎn)Ultra旗艦均已發(fā)布:誰才是2026年的安卓影像之王?

      本地新聞

      云游中國|逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

      干細(xì)胞如何讓燒燙傷皮膚"再生"?

      今日熱點(diǎn):愛奇藝回應(yīng)暫停頁面廣告爭議;經(jīng)紀(jì)公司否認(rèn)THEBOYZ解約成功……

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 亚洲色欲精品综合网| A片精品| 开鲁县| 国产女人喷潮视频免费| 久久精品无码中文字幕| www国产亚洲精品久久麻豆| 91新视频| 国产欧美日韩视频一区二区三区| 色五月丁香五月综合五月亚洲| 久久久婷婷成人综合激情| 人妻va精品va欧美va| 艳妇乳肉豪妇荡乳xxx| 精品无码av无码专区| 成人片黄网站色大片免费| 国产农村激情免费专区| 湛江市| 亚洲中文字幕A| 免费裸体无遮挡黄网站免费看| 亚洲色图另类| 国产精品自在线拍国产手机版| 国内少妇偷人精品视频| 欧美人与动zozo| 一本色道久久综合| 久久综合亚洲色hezyo社区| 亚洲无码成人网| 成在线人av免费无码高潮喷水 | 人妻A?V在线| 老子午夜精品无码不卡| 久草视频网| 亚洲精品v欧洲精品v日韩精品| 中文性爱片| 粗大的内捧猛烈进出| 男人天堂网址| av东京热一区二区三区| 女人张开让男人桶出水视频免费版 | 成年无码av片在线蜜芽| canopen草棚类别9791怎么查| 日本人妻中文| 国产成人A片| 成人色一区二区三区| 亚洲国产精品久久久久婷婷图片 |