大家好,我是冷逸。
今天,咱們接著奏樂接著肝。
前幾天,帶大家陸續體驗了、、等模型。今天,我們來聊下豆包大模型2.0(Doubao-Seed-2.0)。
一句話介紹:豆包大模型2.0是一個多模態理解能力全面升級的基礎模型,提供了Pro、Lite、Mini三款多模態通用模型,和專門面向開發者的Code模型。
目前,Seed 2.0 Code 模型已經可以在TRAE中使用。
![]()
這是豆包大模型2.0 Pro在公開測試集上的表現。
![]()
視覺理解方面,基本與Gemini 3 Pro不相上下。尤其是在空間理解、運動理解、視頻理解和圖表理解上,表現不俗。
同時,還發布了79頁的Model Card。
![]()
Model Card:
https://lf3-static.bytednsdoc.com/obj/eden-cn/lapzild-tss/ljhwZthlaukjlkulzlp/seed2/0214/Seed2.0%20Model%20Card.pdf
![]()
一手實測
這次,Doubao-Seed-2.0一共發了4個版本。
包括Pro、Lite、Mini三款通用Agent模型和一款Code模型。
![]()
Pro面向深度推理與長鏈路任務執行場景,全面對標GPT 5.2與Gemini 3 Pro;
Lite兼顧性能與成本,綜合能力超越豆包1.8;
Mini面向低時延、高并發與成本敏感場景,性能媲美豆包1.6 Pro;
Code則是專為編程場景打造,與Trae使用效果更佳。
Seed 2.0 Code,是基于2.0 Pro底座,專門針對編程場景進行優化的Coding模型,也是我們今天測試的主角。
測試平臺主要是在TRAE和Claude Code。
1)前端:視覺理解
隨便給了它張截圖,讓它復刻這個網頁,并實現眼珠隨鼠標轉動的效果。
![]()
不一會兒,它就寫好了,高度還原截圖的背景色、卡片布局和大眼睛的UI,交互動畫也做出來了。

左邊是Trae窗口,右邊是網頁結果
再來一個,我喂給它一張Transformer架構圖,讓它做一個動畫演示網頁,給大家科普Transformer架構。
![]()
來看下結果。

對架構圖的理解還挺準確的,編碼器、解碼器都有,而且做了個SVG動畫里演示整個Transformer工作流程。
這個倒有點出乎我的意料,因為它不是完全復刻,而是要先理解架構圖的邏輯,再來寫代碼演示整個過程。這對模型的推理要求,其實挺高的。
在官方demo中,我還看到了一個很有意思的case。
先給到幾張x-y-z坐標的靜態數據圖,然后讓模型生成匹配的matplotib Python代碼。

Seed 2.0 Code直接生成了一個3D坐標網頁,對圖表的理解和還原非常。
我感覺,今后用這個模型來做圖表轉代碼,非常方便。
2)3D:逆向魔方
逆向魔方這個Case,我做了很多測試了,目前能跑出來的模型,屈指可數。
包括豆包上一代模型Seed 1.8,都跑不出來。
提示詞:Create a single HTML file containing a fully functional 3D Rubik's Cube simulation using Three.js (via CDN). The cube must be able to automatically solve itself.
中文:創建一個HTML文件,其中使用Three.js(通過CDN方式引入)來實現一個功能完備的3D魔方模擬程序。該魔方必須能夠自動完成自己的“解謎”過程。但這次Seed 2.0 Code一次出。

打亂后,能夠100%還原。
能記住打亂過程的所有步驟,自動還原時會以相反的順序和相反的方向執行這些步驟。
3)長任務:AI廟會
下面這個Case(by官方),并非One short直出,而是迭代了幾次才出來。
這也符合我們真實的開發環境,沒有任何開發是一句話生成的,都需要與模型對話修改、調試,才能出真正能用的產品。
這是一個比較復雜的“AI春節廟會”web游戲,開發者通過TRAE+Seed 2.0 Code,通過幾輪提示詞調整,就做出來了。
在這個廟會中,每個AI小人都擁有環境感知、認知推理和記憶系統,能夠自主產生連貫行為、社交互動,并進行真實的生活與任務流程。
像極了“中國新春版”的斯坦福小鎮。
4)Agentic任務:文章轉視頻
這個Case的Prompt如下:
提煉這篇文章:https://mp.weixin.qq.com/s/8WfpTaQLOeilRRghEaiGTg,用Remotion Skills做一個視頻,向大家展示Doubao Seed 2.0
除了考驗模型的Coding能力外,還考驗它的Agentic和工具調用能力,它需要自己瀏覽文章并提煉內容,然后調用Remotio Skills來制作視頻,并最終把視頻渲染出來。
![]()
我把這種視頻叫做“HTML式視頻”,最近對它愛不釋手。
這是Seed 2.0 Code花了10來分鐘,給我做的視頻(BGM是我自己加的)。
效果還不錯,就是UI這塊跟頂級旗艦模型還有差距。
![]()
總結一下。
相較Seed 1.8,Seed 2.0在Coding上的表現超出我的預期。尤其是視覺理解和Agentic任務上,進步非常明顯。
它不是簡單的視覺識別,而是帶推理的深度理解。有了視覺理解&Agentic的加持,可以讓模型的使用場景更寬、更深。
當然,不足之處也有。譬如前端審美距離頂級模型還有差距,長鏈任務偶爾出現忘記需求的情況。這些,都是后期可以優化的方向。
但,瑕不掩瑜。國內能有這么強大的多模態模型,實屬難得。
對了,最后我還寫了一個新年煙花的網頁,所有人都可以玩。

體驗地址:
https://www.doubao.com/share/code/0d429f942f9bb8c0
祝大家新年快樂,馬到功成!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.