<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      看草圖直出代碼!實測智譜最新多模態Coding模型

      0
      分享至


      智東西
      作者 江宇
      編輯 漠影

      智東西4月2日報道,今日,“國產大模型第一股”智譜發布了其首個多模態Coding基座模型GLM-5V-Turbo,將AI大模型的感知邊界從純文本推到視覺世界。這是繼GLM-5-Turbo之后,智譜短時間內在Coding基座模型上的又一次快速迭代。

      據官方新聞稿介紹,GLM-5V-Turbo不僅能讀懂代碼,還能“看懂畫面再寫代碼”。給定一張設計稿截圖,它能直接生成完整可運行的前端工程;在接入OpenClaw、AutoClaw等龍蝦Agent之后,它也能看懂屏幕、讀懂K線圖、瀏覽各類網頁,然后自主完成一整套長程任務。

      得益于出色的視覺編程性能,GLM-5V-Turbo在海外引發了廣泛的關注,截至發稿前,其官方推文已經獲得了130萬+的瀏覽量,海外開發者甚至夸張地打趣道:“對Anthropic來說,現在游戲結束了?!?/p>


      X網友@Zaid表示,“Anthropic現在的處境岌岌可危?!?/p>


      如今,放眼整個行業來看,GLM-5V-Turbo推出的意義正變得越來越清晰:當Coding模型開始進入真實生產環境,光靠文本確實已經不夠用了,而剛剛發布的GLM-5V-Turbo,將為「視覺編程」新范式提供一個全新的啟示。

      一、上手實測:看見即復刻,圖像即代碼

      說再多不如直接上手。我們用三個實測案例,看看GLM-5V-Turbo在不同輸入方式下的前端復刻能力。

      案例一:畫個草圖,也能復刻?

      先從最離譜的場景開始,我們只給GLM-5V-Turbo畫幾個框框,讓它做個酷炫的音樂播放器。結果模型還真搞得像模像樣,布局合理、配色協調、連播放控件都安排得明明白白,讓它改個配色也是言出法隨。建議各位產品經理抓緊體驗,以后改需求再也不用看前端的臉色了。

      案例二:輸入網址,直接復刻

      這是GLM-5V-Turbo的主打功能之一。因為模型有強大的GUI Agent能力,只要給它一個目標網站URL,它就能自主瀏覽頁面,梳理布局結構、采集視覺素材與交互細節,然后直接生成完整可運行的前端工程。不需要手動截圖、不需要描述需求,一個鏈接就夠了。

      例如,我們讓GLM-5V-Turbo復刻這個頗具設計感的網站:https://niore.webflow.io/


      這是復刻效果,可以看到,不論是布局、字體,甚至是插圖都非常相似。

      案例三:輸入錄屏,還原動效

      將一段網頁操作錄屏發給模型,GLM-5V-Turbo能從視頻中理解頁面的動態交互邏輯——滾動效果、彈窗切換、表單聯動、按鈕反饋等,然后將這些交互細節還原為可運行的代碼。不只是”還原長什么樣”,而是”還原怎么動”。

      我們把這個美食網站的錄屏發給GLM-5V-Turbo,讓它復刻一下。

      ▲錄屏

      可以看到,網站的布局、照片、字體都比較還原,浮現動效和字體特效這類動態細節也基本復刻到位。

      ▲結果

      二、技術探索:不是簡單“加了個視覺模塊”

      與以往傳統方法不同,GLM-5V-Turbo不是在一個純文本Coding模型上“外掛”了一個視覺理解模塊,而是從預訓練階段就開始進行文本與視覺能力的深度融合,解決了“視覺能力與純文本編程和推理能力無法兼得”的問題。

      具體來說,智譜團隊研發了新一代CogViT視覺編碼器,在通用物體識別、細粒度理解、幾何與空間感知上均做到了領先水平,同時設計了一套兼容多模態輸入且推理友好的MTP結構,在多模態場景下實現了較高的推理效率。

      更關鍵的是,在強化學習階段,智譜團隊采用了30+任務類型的協同優化策略,覆蓋STEM推理、視覺grounding、視頻理解、GUI Agent等多個子領域。這種多任務協同強化學習的好處在于,它有效緩解了單領域訓練容易出現的不穩定性,也就是說,不會因為某一項能力的提升而犧牲其他能力。

      而且從評測數據來看,這套方案確實跑通了。

      在多模態Coding維度,GLM-5V-Turbo在設計稿還原、視覺代碼生成、多模態檢索與問答、視覺探查等基準上均取得領先表現;在衡量真實GUI環境操控能力的AndroidWorld、WebVoyager等基準上同樣表現突出。


      而在純文本Coding維度,GLM-5V-Turbo在CC-Bench-V2的Backend、Frontend和Repo Exploration三項核心測試中保持了穩定表現——也就是說,視覺能力的引入并沒有拖累純文本編程能力。


      用一句話總結:GLM-5V-Turbo不是在“看圖”和“寫代碼”之間做取舍,而是“全都要”

      結語:Coding基座模型的下一步,是“看見世界”

      從GLM-5-Turbo到GLM-5V-Turbo,智譜在Coding基座模型上的迭代邏輯非常清晰:先讓模型在文本世界里把任務跑通,再讓它“看見”視覺世界,從而進入更廣闊的應用空間。

      這背后的判斷是:Agent時代,模型能力不只由智能水平定義,還由它能處理的context容量定義。一個只能處理純文本的模型,哪怕推理能力再強,在真實世界里的應用邊界也是有限的。因為真實世界的信息,絕大多數以圖片、視頻、界面等視覺形式存在。

      從這個角度來看,GLM-5V-Turbo不只是智譜的一次產品更新,更像是一個行業信號:Coding模型的競爭,正在從“誰的代碼寫得好”升級到“誰能看懂世界并寫出代碼”。

      而隨著越來越多的Coding模型開始進入真實生產環境,“看得懂、寫得出、跑得通”這三項能力的整合程度,將成為區分模型之間差距的關鍵維度。

      這場競賽,才剛剛進入深水區。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      孫穎莎賽后全隊離場,唯獨邱貽可獨坐看臺等她,師徒同框太暖心

      孫穎莎賽后全隊離場,唯獨邱貽可獨坐看臺等她,師徒同框太暖心

      小娛樂悠悠
      2026-04-03 08:46:34
      夫妻過了66歲,必須馬上停下四種行為,不然連個安穩覺都睡不成。

      夫妻過了66歲,必須馬上停下四種行為,不然連個安穩覺都睡不成。

      大熊歡樂坊
      2026-04-03 12:32:41
      現在A股進入了一個很奇怪的循環。

      現在A股進入了一個很奇怪的循環。

      玉辭心
      2026-04-03 07:07:25
      75歲姜昆近況曝光,與46歲單身愛女相依為命,晚年日子太讓人羨慕

      75歲姜昆近況曝光,與46歲單身愛女相依為命,晚年日子太讓人羨慕

      橙星文娛
      2026-04-01 16:32:42
      重慶給張雪機車劃了200畝地,但真正動起來的是整個摩托車產業鏈

      重慶給張雪機車劃了200畝地,但真正動起來的是整個摩托車產業鏈

      藍色海邊
      2026-04-03 08:43:49
      沈伯洋松口參選臺北市長,謝龍介質疑:拿美國人的錢沒有一個解釋

      沈伯洋松口參選臺北市長,謝龍介質疑:拿美國人的錢沒有一個解釋

      海峽導報社
      2026-04-02 11:49:17
      人老了,想多活幾年,先管住自己這10點:1、不摔倒,2、不勞累…

      人老了,想多活幾年,先管住自己這10點:1、不摔倒,2、不勞累…

      荷蘭豆愛健康
      2026-03-28 09:28:48
      道歉僅48小時,單依純再迎3大噩耗,個個戳她心窩

      道歉僅48小時,單依純再迎3大噩耗,個個戳她心窩

      寒士之言本尊
      2026-04-01 16:12:35
      恒大這些年掙的錢,到底都去了哪里。

      恒大這些年掙的錢,到底都去了哪里。

      流蘇晚晴
      2026-04-01 20:55:11
      老婆被領導排擠,無奈選擇辭職,行業晚宴她領導看到我頓時愣住了

      老婆被領導排擠,無奈選擇辭職,行業晚宴她領導看到我頓時愣住了

      奶茶麥子
      2026-04-02 17:57:05
      廈門那場大暴雨里,曾毅帶頭耍帥把雨傘丟掉,玲花在旁邊嘟囔煩人

      廈門那場大暴雨里,曾毅帶頭耍帥把雨傘丟掉,玲花在旁邊嘟囔煩人

      林輕吟
      2026-04-02 17:07:23
      為什么從開的車能看出一個人的家庭條件,網友說得巨真實,太心服

      為什么從開的車能看出一個人的家庭條件,網友說得巨真實,太心服

      椰青美食分享
      2026-04-02 02:13:00
      律師:旺達和伊卡爾迪的離婚手續將在5月6日至7日完成

      律師:旺達和伊卡爾迪的離婚手續將在5月6日至7日完成

      懂球帝
      2026-04-03 10:40:18
      大瓜,特朗普稱中國富豪有56個美國孩子!各種猜測越來越離譜了!

      大瓜,特朗普稱中國富豪有56個美國孩子!各種猜測越來越離譜了!

      眼光很亮
      2026-04-02 06:09:52
      曾國藩:真正拉開人與人差距的,從來不是能力,而是做好這三件事

      曾國藩:真正拉開人與人差距的,從來不是能力,而是做好這三件事

      千秋文化
      2026-03-31 20:52:57
      王晶再揭關之琳秘史!高爾夫球只是冰山一角,劉鑾雄自爆真相太扎心

      王晶再揭關之琳秘史!高爾夫球只是冰山一角,劉鑾雄自爆真相太扎心

      動物奇奇怪怪
      2026-04-01 18:50:33
      向太也沒想到,自己那指望不上的兒子向佐,如今竟把老臉都丟光了

      向太也沒想到,自己那指望不上的兒子向佐,如今竟把老臉都丟光了

      顧史
      2026-03-31 20:58:46
      女網紅組織“嫁給自己”集體婚禮,本想白嫖婚紗,結果喜提50萬債務

      女網紅組織“嫁給自己”集體婚禮,本想白嫖婚紗,結果喜提50萬債務

      觀世記
      2026-04-02 21:43:54
      真假?專家建議:對失業人征收失業稅以防故意躺平影響社會發展?

      真假?專家建議:對失業人征收失業稅以防故意躺平影響社會發展?

      黯泉
      2026-04-03 10:13:33
      森海塞爾這款耳機半價甩賣,60小時續航讓索尼用戶沉默

      森海塞爾這款耳機半價甩賣,60小時續航讓索尼用戶沉默

      灰度測試中
      2026-04-03 10:18:14
      2026-04-03 13:15:00
      智東西 incentive-icons
      智東西
      聚焦智能變革,服務產業升級。
      11502文章數 117022關注度
      往期回顧 全部

      科技要聞

      5萬輛庫存車,給了特斯拉一記重拳

      頭條要聞

      牛彈琴:美國干了一件令人發指的事 全世界都無法接受

      頭條要聞

      牛彈琴:美國干了一件令人發指的事 全世界都無法接受

      體育要聞

      沖擊世界杯失敗,80歲老帥一氣之下病倒了

      娛樂要聞

      《浪姐7》最新人氣TOP 曾沛慈斷層第一

      財經要聞

      專家稱長期攝入“飄香劑”存在健康隱患

      汽車要聞

      你介意和遠房親戚長得很像嗎?

      態度原創

      健康
      時尚
      房產
      手機
      本地

      干細胞抗衰4大誤區,90%的人都中招

      為什么“這個顏色”成為今年頂流?這樣穿好看又治愈

      房產要聞

      理科生的浪漫,都藏在細節里!中交·藍色港灣這場交付太硬核!

      手機要聞

      vivo X300s手機開售:天璣9500、蔡司2億主攝,4999元起

      本地新聞

      跟著歌聲游安徽,聽古村回響

      無障礙瀏覽 進入關懷版