<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Manus都點贊的Claude 4,究竟好在哪兒?

      0
      分享至


      目睹完今天 Claude 4 的發(fā)布會全程,我只看到了一句話 ——大模型正在范式轉(zhuǎn)變, AI智能體時代真的來了。


      AI 編程的唯一真神 Claude 3.7 Sonnet,終于被 Antrhopic 的下一代 AI 大模型——Claude Opus 4 和 Claude Sonnet 4 徹底淘汰掉了。各國網(wǎng)友對此有非常直觀的感受,比如有人在一手實測中瘋狂夸贊 Claude 4:「它一下子就能寫出 8000 行代碼」。


      除了 Claude 4 的推出之外,他們還順手給了幾個新智能體時代的功能拓展。

      我們先從大模型講起。

      01

      Claude 4 瞄準了 AI 智能體編程

      這次,他們推出的 Claude Opus 4 和 Claude Sonnet 4 這兩款模型都是混合模型:及時響應與深度思考并重。

      可見,混合思考架構已然成為未來大模型的趨勢,用戶需要在簡單的需求下獲得更快的回復,在復雜要求中獲得更好的生成結(jié)果。兩款模型在性能、功能和應用場景上有了顯著提升,價格卻與之前的 Opus 和 Sonnet 模型保持一致,內(nèi)部優(yōu)化做得很好。

      先從評分開始看起。Claude 4 模型在用于評估真實軟件工程任務性能的 SWE-bench Verified 基準上堪稱「遙遙領先」。值得一提的是,在本次評分對比中,Claude 4 特意被拉來與 OpenAI 前幾天剛剛高調(diào)發(fā)布的「最強 AI 編程智能體 Codex-1」進行正面較量。


      Claude Opus 4 在編碼、研究、寫作和科學發(fā)現(xiàn)等人類復雜性高的任務方向,拓展了邊界。比如,在編碼領域它被 Cursor 稱為頂尖技術,顯著提升復雜代碼庫的理解能力,適合處理復雜的編程任務。Cognition則強調(diào)Opus 4已經(jīng)能夠解決其他模型無法應對的復雜任務。

      Claude Sonnet 4 將“天賦”融入日常使用場景,這款均衡型模型在內(nèi)部和外部應用中兼顧了性能與效率,雖在多數(shù)領域不及 Opus 4,但提供了能力與實用性的最佳結(jié)合。它非常適合需要自主性的場景。iGent 的報告指出,Sonnet 4 在自主開發(fā)多功能應用方面表現(xiàn)驚艷,錯誤率幾從 20% 驟降至幾乎為零。

      在下面這張綜合基準測試評分表中,Claude 4 與其他市場主流大模型在編程、推理、多模態(tài)能力、智能體任務方面都拉開了一定差距。


      有趣的一點是,Anthropic 將最左側(cè)的數(shù)個基準測試名稱中都加入了「Agentic」。

      2025 是 AI 智能體時代這一說法,再次被確認。

      在 Anthropic 的官方發(fā)布中,有很大的篇幅著重介紹了 Claude 4 系列在「復雜項目」構建中的震撼級能力。其中,官方著重引用了 Github Copilot、iGent,甚至是 Manus 等平臺的反饋。日本一家名叫樂天得企業(yè),甚至讓Claude Opus 4獨立編程7h,團隊自己都有些驚訝。

      前段時間剛一問世就被網(wǎng)絡平臺譽為「上帝之手」的 Manus 則在報告中大贊 Claude Sonnet 4,稱它復雜指令遵循能力和輸出的美觀度非常高。


      可以預見的是,目前智能體賽道的各個選手將會第一時間集成 Claude 4,因為它相對于之前的 Claude 模型在智能體任務中有了太多的改進。

      比如:

      1. Opus 4 和 Sonnet 4 不再像 Sonnet 3.7 那樣愛走捷徑和漏洞了,這種不正常的行為發(fā)生率直接降低了 65%。

      2. Opus 4 也迅速跟進了「記憶增強」,現(xiàn)在它可以更好地執(zhí)行長期任務了。

      3. 使用小型模型壓縮冗長的思考過程,自己去做思考摘要。


      圖注:Claude Opus 4 在玩《寶可夢時》自主記錄筆記。

      02

      Claude 4 其實是 LLM + Agent 的混合體?

      除了 Claude 4 發(fā)布之外,整場發(fā)布會的另一個側(cè)重點是:Claude 代碼已經(jīng)發(fā)布。用戶已經(jīng)能夠通過終端、IDE (VS Code 和 JetBrains)及通過 Claude 代碼 SDK 后臺將 Claude 融入開發(fā)流程。用戶可以在終端中直接利用 Claude,瞬間搜索百萬行代碼庫。


      在官方介紹中,Claude Code搭載 Claude Opus 4,可以通過智能體搜索全面理解代碼庫,無需手動選擇上下文即可協(xié)調(diào)多個文件更改,無縫融入工作流,直接運行于終端。


      只需在 IDE 終端運行 Claude 代碼即可安裝,可擴展的 Claude 代碼 SDK 還能讓用戶輕松「打造自定義智能體和應用」。Anthropic 給想要構建智能體的用戶們又打上了一劑強心針。


      Anthropic 還發(fā)布了幾個面向智能體的新功能:代碼執(zhí)行工具、MCP 連接器、文件 API,以及最多可緩存一小時提示詞的能力,讓 Claude 4 幾乎成為了智能體專精模型。在我看來,這就是 Anthropic 在 AI 下半程「智能體入口爭奪戰(zhàn)」中的大動作。允許模型將推理與外部資源結(jié)合的設計,使 Claude 4 架構更像是一個 LLM+Agent 的混合體。

      可以這么說,整場發(fā)布會看下來,Claude 4 幾乎是將自己確立為「AI 智能體時代」最能用也是最好用的大模型。

      除了技術側(cè)內(nèi)容,Anthropic 在安全上的操作一直都非常令人「印象深刻」,封號封的各個社區(qū)怨聲載道。官方這回依舊強調(diào)了這些模型都經(jīng)過了廣泛的測試和評估,比如他們用了ASL-3 安全分類,在這個風險標準下:「AI 系統(tǒng)具有顯著增加災難性濫用風險」。

      他們還是沿襲了Anthropic的標志性安全策略——“憲法AI”(Constitutional AI)。該方法為模型嵌入了一套“憲法”原則,通過額外的AI模型對用戶的輸入和模型的輸出進行再度掃描,檢查是否有「壞」的內(nèi)容,決定是否放行。這回,Anthropic放出來的模型卡PDF中足足有123頁,其中大部分仍然是在專注于AI安全的測試。


      比如,Anthropic決定根據(jù) AI 安全級別 3 標準發(fā)布 Claude Opus 4,根據(jù) AI 安全級別 2 標準發(fā)布 Claude Sonnet 4,分級分的非常精準。

      但是,現(xiàn)在的外網(wǎng)針對 Claude 4「過于高」的安全措施的討論,幾乎亂成了一鍋粥。因為有網(wǎng)友似乎基于Claude給出的系統(tǒng)卡文件爆料:Claude 4 會檢測用戶內(nèi)容,并自主「報警」……


      雖然暫無法確定這些爆料是否真實,但也確實反映了大家認為 Claude 4 的安全措施真的太過于嚴格了,甚至到了可能影響用戶體驗或功能性的地步。畢竟,國內(nèi)的Claude使用者已經(jīng)流行起了「打一槍,換一個地」的使用策略。

      03

      Claude 4 在實測中全面提升

      目前各個社區(qū)、各個國家的網(wǎng)友全部在瘋狂測試這款即將取代 Claude 3.7 Sonnet 的大模型。為了支撐智能體中常常需要的長序列復雜處理任務,具有美感輸出能力且超強的 AI 編程能力的大模型仍然是極度稀缺的。Claude 4 系列只是看前方無人在,順勢補缺而已。

      那么說到底,Claude 4 面對復雜性任務,表現(xiàn)到底有多超綱?

      下面來看看全網(wǎng)實測案例:

      Claude 4 與 Blender MCP 的連接,讓產(chǎn)品 3D 模型設計幾乎有了質(zhì)的飛躍。像是有網(wǎng)友使用 Claude 4 和 Blender 通過 MCP 聯(lián)動制作了日本清水寺的 3D 模型。這回的 Claude 4 相比于前代 Claude 3.7,編程時間大幅減少,全程無需「人類陪伴」,AI 的幻覺發(fā)生率也下降了很多。


      甚至還有網(wǎng)友使用 Claude Opus 4 制作了類似 Bemani 2DX 風格的游戲。不僅重現(xiàn)了經(jīng)典的音樂游戲體驗,還融入了許多創(chuàng)新元素,提升了游戲的可玩性和趣味性。

      Claude 4 在面對復雜任務的處理上十分得心應手。比如有網(wǎng)友輸入提示詞:用立體相機拍攝物體,推測 3D 空間坐標,并通過交互式可視化展示,并支持拖動。

      除了硬核編程能力的提升之外,Claude 4 在設計感上正如 Manus 所說,有了很大的美學提升。很多網(wǎng)友曾在各個社區(qū)評論下笑稱:各個智能體什么小游戲都能做,但是沒見過做 PPT 的。

      一位外網(wǎng)網(wǎng)友就試著讓 Claude 4 制作說明幻燈片,呈現(xiàn)出來的效果非常具有設計感,整體要素也更加簡潔。

      在美學的提升方面,這有個更直觀的 Case。一位網(wǎng)友只給了 Claude Opus 4 一小段提示詞:“將書籍 《Piranesi》作為 p5js 3d 空間,do it for me”,沒有摻雜任何其他元素。

      Claude Opus 4 甚至在初版原型中加入鳥、光照、水面等元素,雖然效果還比較基礎,但仍能反應這款旗艦模型的性能。

      目前,大量的 AI 編程平臺(像是 Cursor、Trae、WindsurfVapi、Codegen)、智能體產(chǎn)品(像是 Flowith)內(nèi)幾乎都迅速接入了 Claude 4 系列,畢竟它可能是能進一步提升智能體表現(xiàn)的重要模型。


      Anthropic 由于一直以來專注于安全頂層設計,而常常被認為「他們還沒有找到一個合適的 AI 入口,只能當個掃地神僧,甚至沒有辦法參加到最高級別的公開賽場之中」。

      當 Claude 4 系列模型發(fā)布,以及其他像是代碼執(zhí)行器、MCP 連接器、Claude 代碼等等面向智能體產(chǎn)品的功能模塊推出,Anthropic 可以說已經(jīng)拿到了一個非常好的「智能體入口」,正式站到了頂級賽場。

      從 Anthropic 去年推出 MCP 協(xié)議以來,再到 Claude 4 的出現(xiàn),他們已經(jīng)在事實上為 AI 智能體時代按下了「加速鍵」。Anthropic 的 CEO——Dario Amodei 為整個 AI 大模型賽道明確了一個未來的方向:真正優(yōu)秀的 AI 大模型,一定是「大模型」與「智能體」的深度融合 —— 它能編程、能思考,還能自主解決復雜問題,甚至具備了美學與設計感。

      AI 的下半場早已經(jīng)開啟,Claude 4 正在引領一場新的「 AI 大模型+智能體」范式轉(zhuǎn)變。

      歡迎在評論區(qū)留言~
      如需開白請加小編微信:dongfangmark

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中國網(wǎng)貸技術全球領先,為啥出海收割老外卻慘敗?

      中國網(wǎng)貸技術全球領先,為啥出海收割老外卻慘敗?

      流蘇晚晴
      2025-12-14 16:17:52
      國足有戲!南美足聯(lián)主席再次呼吁:下下屆世界杯擴軍到64隊!

      國足有戲!南美足聯(lián)主席再次呼吁:下下屆世界杯擴軍到64隊!

      邱澤云
      2025-12-15 16:02:35
      中國“摸著石頭過河”數(shù)十年,“石頭”終于快被摸完了

      中國“摸著石頭過河”數(shù)十年,“石頭”終于快被摸完了

      朔方瞭望
      2025-11-08 11:29:44
      身價上億有什么用?68歲趙本山如今家庭情況,給中老年人提了個醒

      身價上億有什么用?68歲趙本山如今家庭情況,給中老年人提了個醒

      白面書誏
      2025-12-08 13:24:49
      臺海觀瀾 民進黨成了“民禁擋”,賴清德成了“賴獨裁”

      臺海觀瀾 民進黨成了“民禁擋”,賴清德成了“賴獨裁”

      經(jīng)濟觀察報
      2025-12-15 11:05:39
      賈躍亭和仨兒女美國團聚,甘薇給他準備了桃酥,賈總樂開了花

      賈躍亭和仨兒女美國團聚,甘薇給他準備了桃酥,賈總樂開了花

      阿廢冷眼觀察所
      2025-12-03 10:52:47
      中國足球留洋利好:大黑將志首次成為日本職業(yè)聯(lián)賽主教練!

      中國足球留洋利好:大黑將志首次成為日本職業(yè)聯(lián)賽主教練!

      邱澤云
      2025-12-15 16:08:36
      700億騙局曝光,專門收割有錢人,上海貴酒到底有多瘋狂?

      700億騙局曝光,專門收割有錢人,上海貴酒到底有多瘋狂?

      毒sir財經(jīng)
      2025-12-14 23:15:34
      86年我放走一個越南女兵,33年后我剛出越南機場就被一排軍車接走

      86年我放走一個越南女兵,33年后我剛出越南機場就被一排軍車接走

      蕭竹輕語
      2025-12-05 17:38:25
      大回暖真來了:南方將迎春天或初夏般溫暖,新一輪大降溫雨雪已醞釀

      大回暖真來了:南方將迎春天或初夏般溫暖,新一輪大降溫雨雪已醞釀

      中國氣象愛好者
      2025-12-15 23:34:11
      東盟也要變天了,印尼終于清醒,柬埔寨被摁著摩擦不是偶然的,不是柬王室的事,柬埔寨洪森是掌控柬埔寨的實權人物,王室被架空了?

      東盟也要變天了,印尼終于清醒,柬埔寨被摁著摩擦不是偶然的,不是柬王室的事,柬埔寨洪森是掌控柬埔寨的實權人物,王室被架空了?

      軍霆說
      2025-12-16 01:18:17
      他在失蹤網(wǎng)站看到和自己一模一樣的臉,竟由此破獲30多年謎案…

      他在失蹤網(wǎng)站看到和自己一模一樣的臉,竟由此破獲30多年謎案…

      英國那些事兒
      2025-12-14 23:06:36
      宗慶后DNA被調(diào)取,3個私生子力證血緣關系,宗慶后72歲生小兒子?

      宗慶后DNA被調(diào)取,3個私生子力證血緣關系,宗慶后72歲生小兒子?

      削桐作琴
      2025-07-14 20:20:04
      冬煮蘋果水,內(nèi)熱自己退!3種神仙搭配,清內(nèi)熱、養(yǎng)脾胃、補津液

      冬煮蘋果水,內(nèi)熱自己退!3種神仙搭配,清內(nèi)熱、養(yǎng)脾胃、補津液

      江江食研社
      2025-12-13 16:30:08
      最新消息!廣東再發(fā)消費券

      最新消息!廣東再發(fā)消費券

      廣東發(fā)布
      2025-12-15 21:25:31
      所有人不許吃肉?準大一素食女生發(fā)文求助,網(wǎng)友:誰做她室友誰倒霉

      所有人不許吃肉?準大一素食女生發(fā)文求助,網(wǎng)友:誰做她室友誰倒霉

      趣筆談
      2025-08-18 15:51:25
      中國凍結(jié)巖崎茂在華資產(chǎn);同時不再向日本提供熊貓

      中國凍結(jié)巖崎茂在華資產(chǎn);同時不再向日本提供熊貓

      跟著老李看世界
      2025-12-16 00:01:14
      12月事業(yè)財運雙雙登頂?shù)男亲鵗OP3!

      12月事業(yè)財運雙雙登頂?shù)男亲鵗OP3!

      朗威談星座
      2025-12-16 06:50:21
      洪森危險了,不在佩通坦報復,而是馬仔陳志的150億比特幣被抄!

      洪森危險了,不在佩通坦報復,而是馬仔陳志的150億比特幣被抄!

      南宮一二
      2025-10-26 07:52:25
      遼寧最多領先21分吊打衛(wèi)冕冠軍 威爾斯成王牌王嵐嵚填趙繼偉空缺

      遼寧最多領先21分吊打衛(wèi)冕冠軍 威爾斯成王牌王嵐嵚填趙繼偉空缺

      醉臥浮生
      2025-12-15 21:40:03
      2025-12-16 08:11:00
      直面派 incentive-icons
      直面派
      講述值得講述的真實故事
      239文章數(shù) 236關注度
      往期回顧 全部

      科技要聞

      L3車型可以上路了!重慶北京兩款車獲批

      頭條要聞

      天津警察學院兩干部論文查重率超70% 校方:官方?jīng)]認定

      頭條要聞

      天津警察學院兩干部論文查重率超70% 校方:官方?jīng)]認定

      體育要聞

      戰(zhàn)勝完全體雷霆,馬刺“瘋狂動物城”只是半成品

      娛樂要聞

      何晴告別式現(xiàn)場,前夫許亞軍雙眼泛紅?

      財經(jīng)要聞

      新農(nóng)合漲到400元 農(nóng)民斷繳背后的扎心真相

      汽車要聞

      主駕配按摩還可選6座 新款捷途X90PRO售13.59萬起

      態(tài)度原創(chuàng)

      教育
      手機
      游戲
      家居
      軍事航空

      教育要聞

      年薪30萬+!數(shù)據(jù)工程師必學3大專業(yè)

      手機要聞

      全新紗緞光刻工藝!vivo S50圖賞

      當手機能自動清每日任務,玩家天天上線是為了什么?

      家居要聞

      溫暖色調(diào) 大空間不冷清

      軍事要聞

      澤連斯基稱烏方已妥協(xié)不加入北約 俄方發(fā)聲

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中国少妇无码专区| 国产黄在线观看| www成人国产高清内射| 国产欧美久久一区二区三区| 激情综合色综合啪啪五月丁香 | 通河县| 国产乱人伦无无码视频试看| 亚洲www啪成人一区二区| 国产精品疯狂输出jk草莓视频 | 国产一区二区三区AV在线无码观看| 精品久久一区| 91你懂的| 国产成人精品无码免费看夜聊软件| 午夜天堂一区人妻| 日韩精品一区二区三区中文| 国产精品久久无码不卡黑寡妇 | 又粗又黄又硬又爽的免费视频| 日韩黄色av一区二区三区 | 国产成年无码久久久久毛片| 无码专区 人妻系列 在线| 撸色网| 九九免费成年人在线观看| 欧美综合自拍亚洲综合图| 亚洲最大有声小说AV网| 久久久久厕拍| 尚义县| 黑人大战中国av女叫惨了| 国内精品久久久久影院不卡| 国产中文字幕制服| 色噜噜人妻丝袜AⅤ资源| 久久精品人人做人人爽电影蜜月| 人妻va精品va欧美va| 亚洲成人色情| 崇左市| 男人的天堂av社区在线| 999精品视频在线| 人妻精品久久久久中文字幕69| 91狠狠爱| 国产人妻精品无码av在线| 日韩精品人成在线播放| 国产一本二本三本在线观看|