<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      GLM-5真夠頂:超24小時跑代碼,700次工具調用、800次切上下文!

      0
      分享至

      金磊 發自 凹非寺
      量子位 | 公眾號 QbitAI

      當看到GLM-5正式發布后的能力,才驚覺前幾天神秘模型Pony Alpha的熱度還是有點保守了。

      因為這一次,GLM-5直接把開源AI也拽進了長任務時代

      瞧,GLM-5直接身兼數職,自己連續跑代碼超過24小時,700次工具調用、800次上下文切換之后……

      它直接用JavaScript,從零手搓了一個Game Boy Advance(GBA)模擬器!

      外觀渲染畫面是這樣的:



      屏幕里是這樣的:



      在沒有渲染情況下的動態效果如下:



      視頻地址:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

      要知道,這對于AI來說,是一個絕對無法取巧的工程任務。

      因為GBA模擬器涉及到了500多條CPU指令集、內存分頁機制、音頻子系統和圖形渲染時序等任務。

      哪怕一條指令遵循出錯,或者一次文件寫入偏差,整個項目就會在幾個小時后崩盤。

      并且GLM-5面對的還是無并行、無任何參考代碼、關閉網絡搜索的那種。

      即便如此,從視頻給出的結果中我們也不難發現,GLM-5確實是發揮非常穩定:

      • 工具調用穩定:第700次和第一次在語法、格式、準確度上沒有差異;
      • 指令遵循持久:上下文即使切換了800次,依舊遵守Meta-Prompt的規范、約定和流程;
      • 工作判斷穩定:GLM-5知道自己什么時候該測試、信息記錄、切換策略等;
      • 上下文夠可靠:每次上下文清空后,GLM-5能從筆記和文件中準確恢復工作狀態。

      這也難怪不少網友在看完之后直呼:

      • 它(GLM-5)可以制作精美的CAD模型!



      并且目前GLM-5的評測結果也已出爐,在權威榜單Artificial Analysis中,直接到了與Claude Opus 4.5比肩的水平。



      在業內公認的主流基準測試中,GLM-5的編程能力也是實現了與Claude Opus 4.5對齊:



      并且在衡量模型經營能力的Vending Bench 2中,GLM-5取得了開源第一的成績:



      但畢竟Claude Opus是閉源,護城河一下子被GLM-5這個開源模型給端掉,也是引得不少網友歡呼:

      • 感謝開源!



      那么GLM-5這位開源界的第一位“全棧架構師”,還有什么樣的實力?

      接下來,一波深度實測開源版Opus級別的模型,走起~

      已經有人申請上架App Store了

      我們的測試將在Claude Code中調用GLM-5 API的方式展開。

      因此,我們第一個測試就是做最考驗模型的邏輯閉環能力的游戲——要求GLM-5從零生成一個3D版大富翁



      接下來,我們直接來看下效果:



      視頻地址:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

      可以看到,面對如此復雜的需求,GLM-5穩穩地把所有功能都實現了出來。

      若是Prompt更加精細,我們就可以得到一個OpenClaw對戰的《龍蝦版3D大富翁》



      視頻地址:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

      而且已經有用戶使用GLM-5做了個學術版“抖音”,并且提交上架蘋果App Store!



      視頻地址:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

      10余款APP都要上架了(showcase.z.ai):



      實測繼續。

      這一次,我們要測試GLM-5對復雜物理規律描述的理解能力,請聽Prompt:

      • 創建一個玻璃十二面體,每個面是一個遮罩,顯示中央相同旋轉基底環結的不同設計(看起來像拼貼/濾鏡)。應用一些細微的泛光效果。在它外面再加一層大約兩倍大小的第二層(透明)玻璃殼,并讓每個面透過時改變內部玻璃的外觀成不同類型,比如透過外層的某一面,整個內殼看起來像是染色玻璃、彩繪玻璃或線框等,僅供參考。使用 three.js,……



      視頻地址:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

      GLM-5依舊是精準地捕捉到了Prompt中的關鍵詞,生成的HTML文件打開后,一個光影交錯的十二面體懸浮在空中。

      除此之外,包括像全棧類型任務,例如制作一個完整、有設計感的電商網站,GLM-5也是可以拿捏。

      以及有人也用GLM-5手搓了個3D版可交互的《我的世界》!



      開源,Win Again

      GLM-5的出現,不論是從實測還是網友們的反響來看,都在標志一件事情:

      開源大模型完成了一次從助手到獨立工程師的質變。

      以前,我們用AI是寫一句Prompt,但需要不斷地去做調試的工作;但現在,用GLM-5可以是給它一個目標,然后去喝咖啡,偶爾回來看看它有沒有跑偏。

      更宏觀地來看,這對于SaaS行業來說,也可能是一場風暴。

      畢竟就在前幾天,隨著Claude Opus等具備長任務能力的閉源模型展現威力,國外市場已經出現了恐慌。

      例如當時金融數據服務商FactSet最慘盤中暴跌10%,S&P Global、穆迪、納斯達克公司紛紛下跌,各大指數全線跳水。

      Fortune和CNBC報道稱,SaaS軟件類股票遭到拋售,投資者擔心,如果AI能現場手搓一個CRM系統,誰還去買年費軟件。

      雖然黃仁勛安撫說AI會增強現有工具,但GLM-5的實測表現告訴我們:重塑或許已經在發生。

      更重要的是,之前這種能力是閉源巨頭的特權。現在,GLM-5把這把鑰匙交到了所有開發者手里。

      或許這次開源模型24小時不間斷自己跑代碼只是一個起點,未來會更長、更快、更好、更強。

      Two More Things:

      GLM其實從4.5版本開始就死磕AI編程這件事,現在這個國產AI的coding套餐在國內外也是相當火爆;這次智譜一上來就限售,外國網友們都是在“求”的狀態。

      以及,智譜公司的大樓,現在也是成了個打卡點



      開頭我們提到的GBA模擬器,由于GLM-5一直在跑,程序員小哥哥下班打車是這樣的:Agent乘客。



      GitHub:
      https://github.com/zai-org/GLM-5

      Hugging Face:
      https://huggingface.co/zai-org/GLM-5

      ModelScope:
      https://modelscope.cn/models/ZhipuAI/GLM-5

      GameBoy Advance體驗:
      https://e01.ai/gba

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      春晚后臺曝光!明星共用一個場地休息太熱鬧,主持人劉心悅首亮相

      春晚后臺曝光!明星共用一個場地休息太熱鬧,主持人劉心悅首亮相

      萌神木木
      2026-02-14 14:00:45
      廣東湛江一海灘發現疑似儒艮尸體,長度超過1.5米,其2022年被宣布在中國大陸沿海功能性滅絕,目前正待鑒定

      廣東湛江一海灘發現疑似儒艮尸體,長度超過1.5米,其2022年被宣布在中國大陸沿海功能性滅絕,目前正待鑒定

      揚子晚報
      2026-02-13 12:22:25
      為什么高薪女士在相親市場不吃香?網友:誰也不想娶個菩薩供家里

      為什么高薪女士在相親市場不吃香?網友:誰也不想娶個菩薩供家里

      夜深愛雜談
      2026-02-13 18:53:30
      四天過去,中國反制準時執行,局勢變成6對21,歐盟內部陷入混亂

      四天過去,中國反制準時執行,局勢變成6對21,歐盟內部陷入混亂

      滄海旅行家
      2026-02-14 16:23:04
      小心!高鐵車廂的電源插座,真的有點兒傷手機

      小心!高鐵車廂的電源插座,真的有點兒傷手機

      果殼
      2026-02-14 17:13:35
      美國制裁古巴的太陽了嗎?援助的大米是自己游泳過去的嗎?

      美國制裁古巴的太陽了嗎?援助的大米是自己游泳過去的嗎?

      忠于法紀
      2026-01-27 08:57:12
      “五常”變“六常”?美俄達成一致,中方講明標準,印度認清現實

      “五常”變“六常”?美俄達成一致,中方講明標準,印度認清現實

      涼了時光人
      2026-02-14 01:48:23
      剛剛!證監會對三家券商發出了警示函

      剛剛!證監會對三家券商發出了警示函

      新浪財經
      2026-02-14 14:12:15
      玉碎還是瓦全?被擄一個月后,委代總統做出選擇,石油流入以色列

      玉碎還是瓦全?被擄一個月后,委代總統做出選擇,石油流入以色列

      阿芒娛樂說
      2026-02-14 15:37:44
      勝率62.3%!超過上賽季,杜蘭特效應來了,火箭因傷病缺席達139場

      勝率62.3%!超過上賽季,杜蘭特效應來了,火箭因傷病缺席達139場

      巴叔GO聊體育
      2026-02-14 15:58:55
      張馨予自駕新疆旅游!何捷為老婆拍照要淪陷了,拍的比攝影師還美

      張馨予自駕新疆旅游!何捷為老婆拍照要淪陷了,拍的比攝影師還美

      樂悠悠娛樂
      2026-02-14 12:12:32
      從海南打車到哈爾濱后續:最后結算了3萬元,還送了司機很多禮物

      從海南打車到哈爾濱后續:最后結算了3萬元,還送了司機很多禮物

      夜深愛雜談
      2026-02-11 18:12:56
      福建艦拜年,戰忽局又來拍照了,航母和官兵一樣高

      福建艦拜年,戰忽局又來拍照了,航母和官兵一樣高

      三叔的裝備空間
      2026-02-14 15:18:17
      國家出手,中戲大佬接連投案!舉報人再添猛料,遭殃的不止閆學晶

      國家出手,中戲大佬接連投案!舉報人再添猛料,遭殃的不止閆學晶

      觀察者海風
      2026-02-14 15:12:30
      二戰后蘇聯男丁稀缺姑娘難嫁,政府出妙計完美化解難題

      二戰后蘇聯男丁稀缺姑娘難嫁,政府出妙計完美化解難題

      嘮叨說歷史
      2025-12-24 17:38:23
      張雪峰:如果你不好好學習,一旦掉入社會底層,和一群沒有素質的人混在一起.....

      張雪峰:如果你不好好學習,一旦掉入社會底層,和一群沒有素質的人混在一起.....

      山東教育
      2026-01-27 11:38:18
      49頁密約藏驚天代價:臺美“貿易協定”徹底掏空臺灣

      49頁密約藏驚天代價:臺美“貿易協定”徹底掏空臺灣

      上觀新聞
      2026-02-14 15:52:07
      中日韓最大財團對比:三星3.2萬億,三菱21萬億,中國第一是誰?

      中日韓最大財團對比:三星3.2萬億,三菱21萬億,中國第一是誰?

      阿器談史
      2026-01-30 08:40:58
      倒在黎明前的生鮮鼻祖,反被700萬人封神

      倒在黎明前的生鮮鼻祖,反被700萬人封神

      金錯刀
      2026-02-14 17:18:33
      新有菜、桃乃木香奈、翼舞、七海娜美、新川空 日本美女明星動態

      新有菜、桃乃木香奈、翼舞、七海娜美、新川空 日本美女明星動態

      鹿鹿156
      2026-02-14 10:46:14
      2026-02-14 17:56:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12171文章數 176384關注度
      往期回顧 全部

      科技要聞

      字節跳動官宣豆包大模型今日進入2.0階段

      頭條要聞

      委石油收入超10億美元 資金將存入美財政部新開設賬戶

      頭條要聞

      委石油收入超10億美元 資金將存入美財政部新開設賬戶

      體育要聞

      金博洋:天才少年的奧運終章

      娛樂要聞

      吳克群變“吳克窮”助農,國臺辦點贊

      財經要聞

      春節搶黃金,誰賺到錢了?

      汽車要聞

      星光730新春促銷開啟 80天銷量破2.6萬臺

      態度原創

      數碼
      家居
      健康
      旅游
      公開課

      數碼要聞

      奧圖碼推出家庭娛樂UHD激光投影儀UHZ36,亮度3500 ISO流明

      家居要聞

      中古雅韻 樂韻伴日常

      轉頭就暈的耳石癥,能開車上班嗎?

      旅游要聞

      發照片證明你在山東過大年 贏山東百余家景區免費暢游卡

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版