<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易科技 > 網易科技 > 正文

      10倍速的一夜:智譜GLM-5官宣,MiniMax與DeepSeek的暗戰

      0
      分享至

      10倍速的一夜:智譜GLM-5官宣,MiniMax與DeepSeek的暗戰

      出品 |《態度》欄目

          作者 | 袁寧

          編輯 | 丁廣勝

      2月11日深夜到12日清晨,短短幾個小時內,中國三家知名的大模型公司幾乎同時完成了一輪關鍵更新:

      智譜正式發布 GLM-5,MiniMax M2.5在產品中悄然上線體驗,DeepSeek 也啟動新一輪能力升級。

      智譜 GLM-5:從“寫代碼”到“搞工程”

      2月12日,智譜正式官宣上線并開源新模型 GLM-5。同時確認:此前在 OpenRouter 上爆火的匿名模型 Pony Alpha,正是 GLM-5。

      在匿名測試階段,這個模型已經被全球開發者當作真實生產工具使用。有人用它做橫版解謎游戲,有人搭建 Agent 交互世界,也有人直接基于它開發出論文版“抖音”等完整應用形態。模型在沒有品牌背書的情況下完成真實市場驗證,本身已經說明了能力層級的變化。

      10倍速的一夜:智譜GLM-5官宣,MiniMax與DeepSeek的暗戰

      智譜對 GLM-5的定位非常明確:它不是一個聊天模型,而是一個 Agentic Engineering 基座模型

      過去兩年,大模型的主流敘事是“寫代碼”“寫前端”;而現在,行業共識正在轉向:模型需要完成完整工程與復雜任務,即從「Vibe Coding」走向「Agentic Engineering」。GLM-5正是這一階段的代表產物。

      10倍速的一夜:智譜GLM-5官宣,MiniMax與DeepSeek的暗戰

      與上一代相比,GLM-5不再滿足于生成一個漂亮 demo 或一段 Python 腳本,而是為穩定交付生產級結果而生。在真實編程場景的使用體感上,GLM-5已經被認為逼近當前行業天花板 Claude Opus 4.5。

      在底層能力上,GLM-5進行了全面擴展:

      ● 參數規模: 從上一代的355B(激活32B)擴展至744B(激活40B)。

      ● 數據量級: 預訓練數據從23T 提升至28.5T。

      ● 架構創新: 首次集成了 DeepSeek Sparse Attention 機制。這一技術在維持長文本效果無損的同時,大幅降低了模型部署成本,提升了 Token 的生成效率。

      ● 異步強化學習: 構建了全新的“Slime”框架,讓模型能夠在長程交互中持續學習,不再是“聊幾句就忘”。

      10倍速的一夜:智譜GLM-5官宣,MiniMax與DeepSeek的暗戰

      在全球權威的 Artificial Analysis 榜單中,GLM-5位居全球第四、開源第一。

      10倍速的一夜:智譜GLM-5官宣,MiniMax與DeepSeek的暗戰

      GLM-5在編程能力上實現了對 Claude Opus 4.5的對齊,在工程師最看重的 SWE-bench-Verified(軟件工程基準測試)中,GLM-5拿下了77.8的高分;在 Terminal Bench 2.0(終端操作能力)中達到了56.2。這兩個分數不僅是開源模型的 SOTA(State Of The Art),更直接超越了 Google 的 Gemini 3 Pro。

      在智譜內部的 Claude Code 評估集合中,GLM-5在后端重構和深度調試等“硬骨頭”任務上,比 GLM-4.7平均提升了超過20%。

      10倍速的一夜:智譜GLM-5官宣,MiniMax與DeepSeek的暗戰

      GLM-5在 Agent 能力上實現開源 SOTA,在多個評測基準中取得開源第一。

      10倍速的一夜:智譜GLM-5官宣,MiniMax與DeepSeek的暗戰

      更有意思的是 Vending Bench 2的測試結果。這個測試要求模型在一年期內經營一個模擬的自動售貨機業務。GLM-5最終的賬戶余額達到了4432美元。這意味著它不僅會寫代碼,還懂得資源管理和長期規劃,這種“經營能力”是邁向 AGI 的關鍵一步。

      10倍速的一夜:智譜GLM-5官宣,MiniMax與DeepSeek的暗戰

      同一夜:MiniMax 與 DeepSeek

      就在智譜官宣的同時,另外兩家巨頭的布局也在進行。

      昨晚,細心的用戶發現,在 MiniMax Agent 產品中,底層模型選項里悄然出現了一個新名字——MiniMax M2.5

      10倍速的一夜:智譜GLM-5官宣,MiniMax與DeepSeek的暗戰

      雖然公司尚未正式官宣,但這顯然是一次在產品端的“實彈演習”。據早期測試用戶反饋,“M2.5 Agent能力炸裂”,“編程和工具調用又強又便宜”。

      10倍速的一夜:智譜GLM-5官宣,MiniMax與DeepSeek的暗戰

      據我們了解,MiniMax M2.5定位為全球首個為Agent場景原生設計的生產級模型。其編程與智能體性能 (Coding & Agentic)比肩國際頂尖模型,直接對標 Claude Opus 4.6,支持PC、App、跨端應用的全棧編程開發,尤其在 Excel高階處理、深度調研、PPT等Office核心生產力場景中處于SOTA地位。

      同時,M2.5模型激活參數量僅 10B,在顯存占用和推理能效比上優勢明顯,支持 100 TPS 超高吞吐量。

      此外,就在眾人還在猜測DeepSeek V4何時到來時,DeepSeek也在悄然更新。

      我們在昨晚嘗試詢問 DeepSeek 的最新狀態,在關閉“深度思考”和“聯網搜索”后查詢模型信息時發現,其上下文長度已提升至1M Token(此前為128K),知識庫截止日期更新至2025年5月。

      10倍速的一夜:智譜GLM-5官宣,MiniMax與DeepSeek的暗戰

      2026年,注定不會平靜。

      智譜用 GLM-5證明了中國模型在復雜工程能力上已能與世界最強掰手腕;MiniMax 在產品端極速狂奔,搶占用戶心智;而所有人依舊在等待 DeepSeek 出招。

      對于此時此刻的身處浪潮中的我們來說,唯一的選擇就是——跟上速度。畢竟,在這個10倍速的夜晚過后,掉隊可能只是一瞬間的事。

      延伸閱讀
      相關推薦
      熱點推薦
      報告:近六成日企計劃今年擴大或維持對華投資

      報告:近六成日企計劃今年擴大或維持對華投資

      第一財經資訊
      2026-02-12 11:01:30
      鄭秀文稱劉德華有社交恐懼癥,生活重心只圍繞家庭和女兒

      鄭秀文稱劉德華有社交恐懼癥,生活重心只圍繞家庭和女兒

      紅星新聞
      2026-02-11 17:16:18
      老山戰場巡診,戰士患爛襠病不讓看,女軍醫:我是你大姐,怕什么

      老山戰場巡診,戰士患爛襠病不讓看,女軍醫:我是你大姐,怕什么

      云霄紀史觀
      2026-02-10 13:48:52
      牧民草原撿來小馬駒養了5年,獸醫摸摸它失聲大叫:這根本不是馬

      牧民草原撿來小馬駒養了5年,獸醫摸摸它失聲大叫:這根本不是馬

      飛云如水
      2025-05-15 21:32:09
      你有知道哪些炸裂的秘密?網友:我有個秘密說出來肯定大家要笑死

      你有知道哪些炸裂的秘密?網友:我有個秘密說出來肯定大家要笑死

      帶你感受人間冷暖
      2026-01-29 00:10:05
      正負值+22!我能幫哈登減壓,施羅德賽后攤牌,米切爾迎最好結局

      正負值+22!我能幫哈登減壓,施羅德賽后攤牌,米切爾迎最好結局

      巴叔GO聊體育
      2026-02-13 08:46:58
      這些事,盡量不要跟孩子分享

      這些事,盡量不要跟孩子分享

      十點讀書
      2026-02-12 03:30:49
      換心風波僅1個月,李連杰再傳噩耗,淪落到如今的下場怪不了別人

      換心風波僅1個月,李連杰再傳噩耗,淪落到如今的下場怪不了別人

      鄉野小珥
      2026-02-05 15:03:34
      商務部回應加拿大油菜籽問題:將在規則框架內充分考慮加方合理訴求

      商務部回應加拿大油菜籽問題:將在規則框架內充分考慮加方合理訴求

      澎湃新聞
      2026-02-12 15:56:26
      不會唱別上了,小年夜春晚這個混子毀了節目,劉宇寧周深都救不了

      不會唱別上了,小年夜春晚這個混子毀了節目,劉宇寧周深都救不了

      娛樂圈十三太保
      2026-02-12 17:47:00
      年薪5400萬,又一次賽季報銷!交易徹底失敗,你也應該退役了

      年薪5400萬,又一次賽季報銷!交易徹底失敗,你也應該退役了

      籃球掃地僧
      2026-02-09 23:23:15
      沈飛宣傳片曝光殲35大連屏駕駛艙,殲35:壞了!剛服役就成牛夫人

      沈飛宣傳片曝光殲35大連屏駕駛艙,殲35:壞了!剛服役就成牛夫人

      阿龍聊軍事
      2026-02-12 17:25:09
      生姜立大功?美國研究發現:生姜可在48小時內清除50%老化細胞?

      生姜立大功?美國研究發現:生姜可在48小時內清除50%老化細胞?

      39健康網
      2026-02-11 09:11:33
      金正恩同志教大家如何贏了又贏!

      金正恩同志教大家如何贏了又贏!

      微微熱評
      2026-02-12 12:44:23
      納稅起征點調整!2026年1月1日起執行

      納稅起征點調整!2026年1月1日起執行

      祥順財稅俱樂部
      2026-02-12 09:13:55
      2場5-2!中國斯諾克1勝2負:傅家俊淘汰丁俊暉,鞏晨智不敵小司機

      2場5-2!中國斯諾克1勝2負:傅家俊淘汰丁俊暉,鞏晨智不敵小司機

      劉姚堯的文字城堡
      2026-02-12 20:59:28
      七個姐妹湊70萬開咖啡店,結果從“七仙女”變成“戰國七雄”互掐

      七個姐妹湊70萬開咖啡店,結果從“七仙女”變成“戰國七雄”互掐

      達文西看世界
      2026-02-12 11:31:45
      朝鮮戰爭表面上是中國贏得的,但實際上是一個巨大的損失

      朝鮮戰爭表面上是中國贏得的,但實際上是一個巨大的損失

      安安說
      2026-02-02 12:18:03
      官媒親宣,33歲韋東奕再破天花板,讓王虹和整個學術圈“沉默”了

      官媒親宣,33歲韋東奕再破天花板,讓王虹和整個學術圈“沉默”了

      趣文說娛
      2026-01-24 15:17:05
      立陶宛政府舉白旗,全面接受中國條件,惡斗5年,中方大獲全勝

      立陶宛政府舉白旗,全面接受中國條件,惡斗5年,中方大獲全勝

      吳欣純Deborah
      2026-02-12 14:15:05
      2026-02-13 11:47:00

      科技要聞

      DeepSeek更新后被吐槽變冷變傻?

      頭條要聞

      中戲院長落馬不足兩個月 兩任表演系主任主動投案

      頭條要聞

      中戲院長落馬不足兩個月 兩任表演系主任主動投案

      體育要聞

      這張照片背后,是米蘭冬奧最催淚的故事

      娛樂要聞

      米蘭冬奧摘銀 谷愛凌再遭美國網友網暴

      財經要聞

      華萊士母公司退市 瘋狂擴張下的食安隱憂

      汽車要聞

      最大續航703km!全新奔馳純電GLC 350 L即將國產

      態度原創

      健康
      時尚
      藝術
      親子
      游戲

      轉頭就暈的耳石癥,能開車上班嗎?

      50+女人怎么穿更好看?過來人告訴你答案,越老越美贏麻了

      藝術要聞

      書法大師的神作現身,引發網友熱議!

      親子要聞

      國家衛健委:今年全國計劃新增15萬個普惠托位

      除了打槍外,為什么還有人喜歡在游戲中“打嘴炮”?

      無障礙瀏覽 進入關懷版
      ×