<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Claude Opus 4.6一天內被超兩次,這次來自國產模型

      0
      分享至

      前兩天 APPSO 提到,大模型即將迎來史上最殘酷的一個月,這就來了。

      而Claude Opus 4.6 「不幸」成為背景板,一天之內被超越兩次。

      早上,在 SWE-bench Pro 上拿下 77.8%,把 Opus 4.6 的 57.3% 甩在身后。這個分數意味著它能在真實 GitHub 倉庫里定位并修復高難度工程 Bug,已經超過了絕大多數人類程序員。

      可 Mythos Preview 暫時不對普通用戶開放,與此同時,另外一個超 Opus 4.6 的模型出現了——智譜開源了 GLM-5.1。


      GLM-5.1 SWE-bench Pro 得分 58.4%,超過 Opus 4.6 的 57.3%,也超過 GPT-5.4 的 57.7%。

      HuggingFace CEO Clement Delangue 也發推祝賀:「SWE-Bench Pro 上表現最好的模型現在在 HuggingFace 上開源了!歡迎 GLM 5.1!」


      全球第三,開源第一。雖然沒等來 DeepSeek V4,但開源新一哥還是來了,依然是咱們國產大模型。

      說實話,我第一反應是又來了,大模型的「榜單狂歡」,每次發布會都是「史詩級進步」,各家模型在榜單上各領風數小時,這次的劇本有什么不同呢。

      APPSO 看完 GLM-5.1 的技術細節和體驗后,帶你看看這個模型是什么水平

      從 20 步到 1700 步,持續工作 8 小時

      GLM-5.1 最讓人沒想到的,不是跑分,是它能工作多久。

      智譜有一個案例讓我印象比較深。8 小時從零構建 Linux 桌面系統。

      不是寫幾個 demo 文件那種「構建」,是真的從零開始,畫架構、寫代碼、跑測試、修 bug,歷時 8 小時整,執行了 1200 多步,最后產出了一套功能完善的 Linux 桌面系統。

      包括完整的桌面、窗口管理器、狀態欄、應用程序、VPN 管理器、中文字體支持、游戲庫,4.8MB 的配套文件。這相當于一個 4 人團隊一周的工作量。

      全程沒有人參與測試、審查代碼。GLM-5.1 甚至給自己的代碼寫了回歸測試,而且跑過了。

      知乎程序員博主 Toyama nao 做了個更狠的測試。他給 GLM-5.1 扔了三個工程項目:用 Swift 寫 macOS 的 OpenGL 渲染器、用 Flutter 開發全功能聊天軟件同時用 Golang 開發服務端、自選技術棧開發純網頁端視頻剪輯應用。每個項目跑 10-12 輪提示詞,每輪 1500-2000 字。

      結果 GLM-5.1 成為第一個通過他全部測試工程的國產模型,也是第一個正式超越 Sonnet 4.5 Thinking 的國產模型。


      他的評價是:「GLM-5.1 大幅擴展了編程的適應范圍,不再是前端 only 戰神,也不只是 oneshot 樣子貨,是可以在復雜工況下充當編程主力。」但他也指出了問題:「超長上下文時容易幻覺爆炸,如果遇到 2 輪改不好一個問題,不要抱有僥幸,直接重開。」

      去年年底,AI 智能體大約只能完成 20 個步驟。GLM-5.1 現在可以完成 1700 個步驟。這是模型能不能真正「獨立工作」的分水嶺。

      智譜在技術報告里解釋了關鍵突破點:以前的模型,包括 GLM-5,會在早期快速取得收益后就進入瓶頸期。它們反復嘗試已知的優化手段,但無法在一條路走不通時主動切換策略。

      GLM-5.1 的訓練目標就是突破這個瓶頸,讓模型能夠在一個固定策略內進行增量調優,當收益趨于停滯時,主動分析 Benchmark 日志、定位當前瓶頸,然后跳轉到結構性不同的方案

      向量數據庫優化案例就是典型的「階梯型」優化軌跡。GLM-5.1 用了 655 次迭代,把查詢吞吐從 3108 QPS 一路推到 21472 QPS,提升了 6.9 倍。


      這個過程中,模型自己完成了從全庫掃描切到 IVF 分桶召回、引入半精度壓縮、加入量化粗排、做兩級路由,再到提前剪枝的整套優化鏈條。每一次跳躍都伴隨著短暫的 Recall 下降,因為模型在探索新方向時會暫時打破約束,隨后再調回來。這個「打破-修復」的循環本身就是有效優化的標志。

      在 KernelBench Level 3 優化基準上,GLM-5.1 對 50 個真實機器學習計算負載進行了超過 24 小時的不間斷迭代,最終取得 3.6 倍的幾何平均加速比,顯著高于 torch.compile max-autotune 模式的 1.49 倍。

      模型自主編寫定制 Triton Kernel 和 CUDA Kernel,運用 cuBLASLt epilogue 融合并實施 shared memory tiling 與 CUDA Graph 優化,覆蓋了從高層算子融合到微架構級調優的完整技術棧。


      還有一個更有意思的測試:Vending Bench 2。這個基準要求模型模擬經營一年的自動售貨機業務,需要長期規劃和資源管理。GLM-5.1 最終賬戶余額達到 $4,432,在開源模型中排名第一,接近 Claude Opus 4.5 的水平。


      744B 參數,零英偉達芯片,成本降低 97%

      GLM-5.1 的技術規格值得細看:744B 參數的混合專家模型(MoE),每個 token 激活 40B 參數,28.5T tokens 訓練數據,集成了 DeepSeek Sparse Attention(DSA)來降低部署成本同時保持長上下文能力。200K 上下文窗口,最大輸出 131,072 tokens。

      更關鍵的是,整個模型全部使用華為昇騰 910B 芯片訓練,沒有英偉達 GPU 參與。在算力被卡脖子的情況下,國產模型依然能做到全球第三、開源第一。

      開發者 Beau Johnson 把自己部署的 OpenClaw 背后的模型從 Claude Opus 4.6 切換到 GLM-5.1,體驗上沒有任何差別,但成本從 1000 美元暴砍至 30 美元左右,降低了 97%。

      GLM-5.1 的輸入成本是 Claude Opus 的 1/5,輸出成本是 1/8。簡單來說:接近 Opus 的能力,20% 的價格。


      而且GLM-5.1 是開源的。MIT License,最寬松的開源許可證之一。你可以拿去改,拿去商用,拿去做任何事。支持 vLLM、SGLang、xLLM 等主流推理框架,可以直接在本地部署。

      當然 GLM-5.1 也不是沒有提升的空間,部分開發者反饋,GLM-5.1 的推理速度只有 44.3 tokens/秒,在同類產品沒太大優勢。復雜任務甚至要一小時起步,哪怕 Pro 套餐額度是 Claude 的 15 倍,也可能不太夠用。

      這些問題都是真實存在的。GLM-5.1 不是完美的,但這不妨礙它成為一個里程碑。

      GLM-5.1 的意義,不在于它比 Opus 4.6 強多少,而在于它證明了,在算力被卡脖子的情況下,國產模型依然能做到開源第一。而且它是開源的,任何人都可以用,任何人都可以改。

      你睡覺的 8 小時,現在可以是 AI 上班的 8 小時了。而且這個 AI ,是開源的,是國產的,是任何人都可以用的。

      附開源與體驗方式

      1. 1.官方 API 接入

      • BigModel開放平臺:https://docs.bigmodel.cn/cn/guide/models/text/glm-5.1
      • Z.ai:https://docs.z.ai/guides/llm/glm-5.1
      1. 2.產品體驗

      • GLM-5.1即將登陸Z.ai:https://chat.z.ai
      • GLM-5.1已納入GLM Coding Plan(Max/Pro/Lite),支持Claude Code、OpenCode等主流開發工具。

      1. 3.開源鏈接

      • GitHub:https://github.com/zai-org/GLM-5
      • Hugging Face:https://huggingface.co/zai-org/GLM-5.1
      • ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5.1

      我們正在招募伙伴

      簡歷投遞郵箱hr@ifanr.com

      ?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      我贍養姑媽10年,她把8套房全給了4個子女,第二天我把她送回老家

      我贍養姑媽10年,她把8套房全給了4個子女,第二天我把她送回老家

      游戲收藏指南
      2026-04-24 07:49:11
      御姐穿搭:氣場不是天生的,是穿出來的

      御姐穿搭:氣場不是天生的,是穿出來的

      疾跑的小蝸牛
      2026-04-25 23:00:21
      教師大勢已定:如無意外的話,2026年中國教師隊伍將會有3大變化

      教師大勢已定:如無意外的話,2026年中國教師隊伍將會有3大變化

      解說阿洎
      2026-04-26 07:34:54
      遭袁立指控風波后,人民日報揭張國立真實現狀,有一點他一直沒變

      遭袁立指控風波后,人民日報揭張國立真實現狀,有一點他一直沒變

      橙星文娛
      2026-04-26 09:27:53
      炸鍋了!俄戰地大佬公開認慫:2026必輸,趕緊轉防御保命

      炸鍋了!俄戰地大佬公開認慫:2026必輸,趕緊轉防御保命

      老馬拉車莫少裝
      2026-04-23 21:32:27
      現場視頻丨突發安全事件 特朗普緊急撤離白宮記者晚宴

      現場視頻丨突發安全事件 特朗普緊急撤離白宮記者晚宴

      新京報
      2026-04-26 09:45:51
      貴陽花果園:共有311棟高層,房價從3000漲到14000,如今價格分化

      貴陽花果園:共有311棟高層,房價從3000漲到14000,如今價格分化

      專業聊房君
      2026-04-24 19:28:34
      烏度卡談最后崩盤:我不知道他們是太年輕,還是懼怕關鍵時刻

      烏度卡談最后崩盤:我不知道他們是太年輕,還是懼怕關鍵時刻

      懂球帝
      2026-04-25 12:18:07
      內塔被上百國通緝,中方打破沉默,在安理會出手,明牌清算以色列

      內塔被上百國通緝,中方打破沉默,在安理會出手,明牌清算以色列

      軒逸阿II
      2026-04-26 08:44:53
      尼日爾撕毀4億美元合同,驅逐中國高管,我方暗藏后手,給它狠狠教訓

      尼日爾撕毀4億美元合同,驅逐中國高管,我方暗藏后手,給它狠狠教訓

      詭譎怪談
      2025-04-30 23:32:55
      太狠了!3000元招保姆,要求承擔做飯、帶娃并無償試用,引發爭議

      太狠了!3000元招保姆,要求承擔做飯、帶娃并無償試用,引發爭議

      火山詩話
      2026-04-25 16:38:17
      A股:無需等待周一開盤了,市場已清晰,明天行情已可預見!

      A股:無需等待周一開盤了,市場已清晰,明天行情已可預見!

      財經大拿
      2026-04-26 09:22:44
      世界冠軍1球不進!80后名將12-9奪賽點,羅伯遜3-1逆轉韋克林!

      世界冠軍1球不進!80后名將12-9奪賽點,羅伯遜3-1逆轉韋克林!

      劉姚堯的文字城堡
      2026-04-25 19:23:27
      爆料!全紅嬋網暴案,犯案的真正目的

      爆料!全紅嬋網暴案,犯案的真正目的

      藝利森
      2026-04-23 22:29:28
      特斯拉為什么不參加北京車展?

      特斯拉為什么不參加北京車展?

      華庭講美食
      2026-04-25 20:47:07
      臺高層已抵達非洲,大陸徹底看清:特朗普的最壞打算是什么

      臺高層已抵達非洲,大陸徹底看清:特朗普的最壞打算是什么

      不甜的李子
      2026-04-26 08:23:54
      74年,毛主席牽頭為賀龍恢復名譽,葉帥:我和他私下關系不是很好

      74年,毛主席牽頭為賀龍恢復名譽,葉帥:我和他私下關系不是很好

      我不是沃神
      2026-04-26 06:00:03
      泰國潑水節一名15歲少女遭軍人尾隨進公廁性侵,監控曝光,嫌疑人已投案自首,將被移送軍事法庭

      泰國潑水節一名15歲少女遭軍人尾隨進公廁性侵,監控曝光,嫌疑人已投案自首,將被移送軍事法庭

      揚子晚報
      2026-04-21 22:25:47
      莫雷諾剛重返上海就進球!同時做出重要決定,直言申花就是他的家

      莫雷諾剛重返上海就進球!同時做出重要決定,直言申花就是他的家

      張麗說足球
      2026-04-25 12:51:47
      又一外貿大廠倒閉,巔峰期曾有1000多名員工

      又一外貿大廠倒閉,巔峰期曾有1000多名員工

      派代
      2026-04-25 16:05:20
      2026-04-26 10:20:49
      AppSo incentive-icons
      AppSo
      讓智能手機更好用的秘密
      6311文章數 26830關注度
      往期回顧 全部

      科技要聞

      漲價浪潮下,DeepSeek推動AI“價格戰”

      頭條要聞

      牛彈琴:伊朗放了美國人鴿子 特朗普被氣壞了

      頭條要聞

      牛彈琴:伊朗放了美國人鴿子 特朗普被氣壞了

      體育要聞

      那一刻開始,兩支球隊的命運悄然改變了

      娛樂要聞

      《我們的爸爸2》第一季完美爸爸翻車了

      財經要聞

      90%訂單消失,中東旺季沒了

      汽車要聞

      2026款樂道L90亮相北京車展 樂道L80正式官宣

      態度原創

      旅游
      親子
      家居
      公開課
      軍事航空

      旅游要聞

      打卡淄博:從千年文脈到市井煙火

      親子要聞

      喂得她自己都咽口水了!

      家居要聞

      自然肌理 溫潤美學

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗總統:不會在壓力、威脅下進行談判

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产伦精品一区二区三区免费迷| 欧美乱强伦xxxxx| 久久超碰97人人做人人爱| 亚洲AV无码久久精品色欲| 国产日产欧洲无码视频| 亚洲综合欧美在线一区在线播放| 宜宾县| 99精品国产丝袜在线拍国语 | 影音先锋中文字幕人妻| 国产精品白浆一区二小说| 性男女做视频观看网站| 狠狠五月深爱婷婷网| 色综合久| 中文字幕欧美人妻精品| 伊人久久大香线蕉av色婷婷色| 亚洲爆乳WWW无码专区| 国产精品视频一区二区三区不卡 | 行唐县| 精品国产亚洲一区二区三区| 亚洲天堂男人天堂| 一本色道久久综合精品婷婷| 欧美亚洲另类自拍偷在线拍| 日本熟妇浓毛| 久久被窝亚洲精品爽爽爽| 好男人WWW社区视频在线资源| 好湿好紧水多aaaaa片| 日本一区二区在线播放| 永久免费AV无码网站大全| 久久久久久久无码高潮| 久久久久亚洲AV青青草原| 亚洲精品一区二区三区小| 亚洲欧美人成人让影院| 成人无码专区免费播放三区| 涩欲国产一区二区三区四区| 九九热免费在线视频| 久久性色欲av免费精品观看| 成人免费无码毛片黄网| 两个人日本www免费版| 江津市| 精品国产免费第一区二区三区| 欧美成人午夜无码A片秀色直播|