
作者 | 高允毅
編輯 | 趙鈺瑩
中國模型出海提速之時,騰訊混元 3D 已經率先把世界拉進了它的三維宇宙。
11 月 26 日,混元 3D 創作引擎發布國際版,API 上線騰訊云國際站;與此同時,開源版混元 3D 的全球下載量也突破 300 萬。產品出海與模型開源兩條路徑同時推進,混元 3D 正加速進入全球開發者視野,一條屬于騰訊的 AI 戰略路線也隨之顯形。
為什么是騰訊?為什么是今年?為什么是 3D?
騰訊的獨特之處在于,它既不是英偉達式的算力公司,也不是 Adobe 那樣的工具公司,而是同時擁有需求端(互動游戲、地圖導航、AR、VR 及云端業務的海量 3D 需求)、技術端(混元大模型的多模態能力成熟遇到了 3D 生成技術快速增長期)、生態端(微信、QQ、騰訊云構成的覆蓋 C 端和 B 端的分發網絡)的復合型科技公司 。
這種“業務—技術—生態”三位一體的能力,使其在 3D 生成的商業化落地中具備更強的場景穿透力與網絡效應。
1 從“工廠車間”開始——混元 3D 在騰訊游戲內部的落地
傳統 3D 行業,“貴、慢、難”幾乎是所有團隊的共識,這個問題在游戲領域尤其尖銳。
網上數據顯示,美術成本在游戲研發中通常占 50%–80%,而 3D 制作又是其中最重的一塊:一個 3D 角色模型成本往往在幾萬元到近百萬元,制作周期從幾天到數周甚至數月不等,復雜場景的資產制作周期更是長得驚人,一款頂尖 3D 游戲在 3D 研發上的投入可以高達數億美元。大制作游戲更是對細節是精益求精、容不得差,如果生成模型在某個小細節上偏了一點,玩家發現了就可能影響游戲口碑,高精度幾何與紋理因此成為整個行業最昂貴、人力最密集的環節。
這種困局直接導致行業兩極分化:大廠靠海量人力堆出高精度資產,中小團隊和獨立開發者只能在“低成本、低質量”中打轉,無數好創意因“做不起 3D 資產”夭折。
因此,3D 生成已經逐漸成為游戲行業的一個剛需。
“游戲的工業化生產管線遠比大眾想象的復雜”,騰訊混元 3D 負責人郭春超指出。傳統 3D 建模流程環環相扣:原畫定稿后,建模師先建高模雕刻,再拓撲成低模,接著展開 UV、烘焙紋理、綁定骨骼,每一步都依賴人工經驗。但這些都可以用 3D 大模型去提效、提質。
騰訊沒有試圖用“一鍵生成”的噱頭顛覆生產方式,而是拆成兩條技術主線:
一條面向 3D 資產本身,提升批量產出效率;
一條面向世界模型,解決場景級搭建問題。
先說前者。
目前騰訊內部數十個游戲項目已接入該系統試驗落地。《元夢之星》是其中的代表性案例之一,其 UGC 編輯器接入了混元 3D。玩家只需輸入一句描述,例如“一個海盜主題的木桶道具”,幾秒鐘后,一件可直接編輯的 3D 資產就跳到了屏幕上,極大地幫助玩家減輕了建模負擔、提升 UGC 創作者的地圖創作效率。
更具代表性的是另一款零代碼編輯器《輕游夢工坊》。傳統游戲美術制作需原畫、建模、動畫等多崗位協作,而接入混元 3D 后,“做的人不再需要懂建模”,郭春超這樣描述。一個新手可以借助《輕游夢工坊》成熟的預制模板與功能組件以及混元 3D 強大的美術資產生成能力,一周左右完成一款游戲。
在 2025 年輕游夢工坊全國游戲創作大賽中,約有四成參賽者沒有任何游戲開發經驗,卻憑借編輯器及其內置的混元 3D 功能完成了可玩性與創意十足的優秀作品。不少創作者反饋稱,編輯器內置的混元 3D 功能讓他們能夠在幾分鐘內完成建模,做到了“開箱即用”,生成的模型已自動綁定骨骼并制作好基礎動畫,可以直接在編輯器中使用,大大縮短了開發周期。
![]()
用混元 3D 制作的“帶有齒輪的機械海豚,蒸汽朋克風”
混元 3D 的定位不是替代,而是分工重塑:讓 AI 生成大部分可用的基礎資產和原型,人類聚焦風格統一、細節打磨和最終決策。郭春超給過一個驚人的數據對比:“原本做一個輕量游戲道具,需要兩天;現在用混元 3D 只需要 0.2 天,一天能做五個。”
![]()
在混元 3D 上傳多張圖片,生成精準三維游戲角色
盡管如此,要完全進入 3D 游戲的高精度生產線,混元 3D 還要攻克組件化生成、低多邊形拓撲平衡等難題。
如何理解組件化生成?比如把一把槍拆成槍托、槍管、彈匣,把一輛車拆成車門、燈組、底盤。拆得不對,美術無法編輯;拆得不穩,動畫無法綁定;拆得不一致,生產線就斷流。“真正的游戲資產不是一體成型,而是分組件生成便于復用,還要在細節精度和運行流暢度之間找平衡”。郭春超解釋道。
低多邊形拓撲平衡,則關系到一個 3D 模型“看起來夠細致,同時在引擎里跑得動”。這一塊傳統算法靠人工反復調整,成本極高;而 AI 模型要想自動完成這一點,則必須在“還原細節”與“保持結構簡潔”之間找到動態平衡。這一問題正是整個游戲工業化管線能否真正吃下 AI 產出的關鍵節點。
圍繞不同用戶,騰訊搭了兩層平臺:
(1)面向大眾創作的「混元 3D AI 創作引擎平臺」,目標是把門檻壓到最低,讓普通用戶、大學生、策劃都能快速產出可用模型;
(2)面向專業團隊的「混元 3D Studio」,服務設計師、開發者和建模師,覆蓋概念、幾何、拓撲、紋理到骨骼動畫的全流程,更強調結構正確、流程可控和資產可落地。
![]()
草圖生 3D 功能:混元 3D 一張簡筆畫就能完成 3D 內容創作
再說后者。
如果說前一條路線解決的是“做東西”的問題,混元 3D 的另一條主線則指向“生成世界”——通過世界模型,用一句文字或一張圖片,在幾分鐘內生成一個可漫游的三維場景。
在騰訊的構想里,當輸入一句并不起眼的提示詞,比如“雨后黃昏的賽博城街巷”,幾分鐘后,一個可以自由移動視角、走進街角、看到燈牌厚度和地面反光的 3D 世界就會出現。它不再是 360°全景圖或靜態美術,而是一個“能走、能看、能互動”的空間。
世界模型競爭正進入白熱化階段。Google DeepMind、Meta、OpenAI、NVIDIA、特斯拉、World Labs 等團隊都在加速推進:從視頻生成到可漫游三維場景,再到物理一致性的環境模擬,試圖讓模型從“看見世界”邁向“理解并預測世界”——這是行業普遍認為通往通用智能(AGI)的關鍵路徑。
在這一賽道上,各家巨頭都有不同的切入口:
DeepMind 用長時序預測推動強化學習;
Meta 用 V-JEPA 2 探索物理理解與沉浸式交互;
OpenAI 以視頻生成試探物體關系及物理變化的建模能力;
NVIDIA 聚焦物理 AI,將世界模型視為下一代仿真引擎;
Tesla 則把世界模型納入自動駕駛體系,讓系統從簡單預測走向更完整的世界理解。
騰訊的路線并不相同。它不是從技術前沿反推應用,而是從自身龐大的三維業務需求反推技術路線——因此天然更接近大規模落地的一側。
在 World 1.1 發布后,騰訊先解決的是最基礎的問題:生成的世界能否穩定地“跑起來”。下一步,則集中攻克行業公認最難的一環——讓世界在時間維度上保持一致,并具備基本的物理與因果邏輯。
這意味著:繞場景一圈,街燈亮度是否一致?推開的門是否仍然打開?從高臺跳下,落點是否合理?這些在真實制作流程中需要大量人工復查的小細節,正是決定一個世界是否“能互動、能持續”的核心難點。
騰訊給出的解法是World Play:一套把 2D 的穩定性與 3D 的空間多樣性連接起來的交互模型,讓 AI 不只是“看到世界”,而是能在其中執行任務。再往后,是面向更真實場景的世界模型 2.0,更準確的幾何、更真實的材質,用于線上展會等對逼真度要求更高的場景。
與此同時,混元 3D 在海外也掀起了另一場浪潮——自 2024 年 11 月首代模型開源,2025 年 7 月世界模型 1.0 全面開放以來,累計下載量超過 300 萬次
對騰訊來說,開源更像是一個生態選擇。
“開源的核心是‘生態’,是與社區的雙向奔赴”,郭春超說。一方面,通過開源促進整個 3D 領域的繁榮發展,讓方法、工具更快迭代;另一方面,社區也會帶來技術改進和產品需求反饋,指導下一階段研發方向。
這一戰略已收獲顯著成效,有人提交了紋理生成的改進建議,有人提出分組件、幾何編輯等需求,促使騰訊在基礎模型中兼容這些能力。
很多海外團隊不等騰訊工具鏈更新,直接把模型部署在自己服務器上,用于快速搭建游戲地圖、做玩法驗證、生成 NPC、甚至搭建 VR 空間原型。
2 走出游戲工廠——混元 3D 的行業實驗
混元 3D 的價值,已經明顯超出了游戲行業。在越來越多的 B 端場景里,它開始被當作一種提升生產效率的基礎能力使用,這些場景對 3D 生成的需求更直接,也更具規模。
目前,已有超過 150 家企業經由騰訊云接入混元 3D 模型,應用范圍橫跨游戲制作、電商展示、影視特效、廣告營銷、社交內容生成及 3D 打印等行業。其中既有 Unity 中國這樣的實時 3D 引擎廠商,也有拓竹科技等消費級 3D 打印公司,以及 Liblib 等內容創作平臺。
作為騰訊對外能力輸出的主通道,騰訊云長期服務各行各業,這些客戶都在向更高質量、更自動化的 3D 內容靠攏。“3D 大模型是我們最具競爭力、需求也最旺盛的能力之一。”郭春超說,“從商業化角度,我們認為 3D 是一個規模巨大且持續增長的市場。”
最先跑通商業閉環的,是 3D 打印。
靜態模型可用度高,用戶付費意愿明確,是最容易形成結果的場景。過去,想做一個可打印的個性化模型,要么依賴素材庫,要么具備專業建模技能,門檻很高。接入混元 3D 后,用戶一句自然語言或一張參考圖,就能生成符合打印標準的三維模型,由廠商完成自動校驗和支撐結構生成。對用戶而言,相當于在 3D 打印機背后接入了一位“云端建模師”,建模門檻從專業技能降到了大眾可用。
在這一帶動下,消費級 3D 打印第一次出現了明確的“供給側擴張”跡象。拓竹、創想三維等頭部廠商接入后,用戶開始從被動下載模型,轉向主動創造模型。拓竹方面透露,MakerWorld 平臺月調用量預計突破 10 萬次;創想三維的 MakeNow 平臺接入混元后,可以做到“給一張照片,五分鐘生成 Q 版手辦”。AI 生成正在把 3D 打印從工具,變成一種面向普通用戶的創意載體。
廣告和內容行業也在沿著同一方向移動。
游戲類廣告需要大量 3D 素材,混元 3D 已能直接供給。未來隨著 3D 世界模型成熟,它還可以服務旅游、文博、家居品牌等領域,讓廣告從“展示”變成“體驗”。目前,基于衛星地圖的 3D 生成已經有落地案例,一些海外電商平臺也開始申請商用開源模型。
在設計領域,變化更直觀。
全球首個 AI 設計助手 Lovart 選擇混元 3D 作為核心 3D 引擎,使其從平面設計跨到高清 3D 內容。3D 不再是專業部門的技能,而是整個設計流程可直接調用的能力。
在電商場景中,商家上傳一張商品實拍圖即可生成可旋轉、可縮放的 3D 模型,已有家居商家接入后實現了約 35% 的點擊率提升。在教育與文博領域,文物和教具能夠被快速轉化為三維內容,整體制作成本約為傳統流程的十分之一,為機構大規模開展數字化展示提供了可行路徑。在珠寶等對細節要求較高的行業中,設計師通過自然語言或參考圖即可在數分鐘內生成可 360°查看、可用于設計評審的模型,顯著縮短了前期建模周期。
在自動駕駛和具身智能領域,混元 3D 則承擔著補齊“仿真場景短缺”的重要角色。
AI 訓練需要大量三維物體與場景,以縮短迭代周期、提高測試密度。自動駕駛對仿真環境依賴更強,開源 3D 模型已經被多家廠商使用,用于補充真實道路采集。
騰訊內部的具身智能實驗室 Robotics Lab 是一個典型試驗場:3D 生成 API 輸送到實驗室,實驗室再將智能領域的需求反饋給研發團隊,反向推動模型迭代。在對外合作中,做機械臂和人形機器人的公司幾乎都對 3D 資產和世界模型有需求;自動駕駛側,由于仿真平臺相對通用,基本每家廠商都有類似訴求。
當然,世界級、場景級生成仍在前半程。距離自動駕駛仿真或 3A 游戲制作所需的嚴格品質,還有不小差距。目前真正達到要求的內容比例仍不足 10%。但方向已經明確:3D 正在成為一個跨行業、跨場景的基礎能力,進入更多實際生產流程。
3 騰訊 AI 深層戰略:不卷規模,卷生態壁壘
10 月初,國際大模型競技場 LMArena 公布最新榜單,混元圖像 3.0 在全球 26 個模型的盲測中登頂,拿下最佳綜合文生圖模型與最佳開源模型兩項第一。面對全球用戶的無提示投票,混元圖像 3.0 超過了 Seedream 4 以及 Gemini 2.5 Flash Image Preview 等頂級選手,被認可為當前效果最好的開源生圖模型。這意味著,騰訊已經在關鍵的多模態方向上達到全球領先。
騰訊把路線押在了更能形成壁壘的方向——場景與生態,而不只是規模競速。
“我們的首要任務很明確:先把技術做到業界領先。質量、效果、可控性、速度、成本這些基礎能力是一切的根基,當技術指標做到位,商業化往往是‘水到渠成’的事”,郭春超的表述,精準詮釋了騰訊的 AI 戰略。
混元 3D 是最能代表這套邏輯的產品。相較于其他大廠,騰訊的特點在于:
內部有游戲、內容、社交等多元場景,可以“以戰養技”;
外部有云服務和開源體系,可以規模化輸出;
技術上在幾何、拓撲和渲染管線等 3D 關鍵環節已經積累多年。
財報中也能看到這一策略的影子。騰訊第三季度營收同比增長 15%,管理層把AI 定義為“貫穿內部業務的基礎能力”:從微信生態里的“元寶”,到嵌入會議、QQ、廣告和游戲的智能功能,再到云服務的垂直解決方案,AI 正在從研發投入轉向業務驅動力。
與此同時,騰訊保持著克制的資本開支。管理層反復強調,AI 投入的重點不是“堆規模”,而是“提效率”。混元 3D 的迭代路徑也是如此:先滿足內部需求,經真實業務驗證后開源,再進入 3D 打印、廣告、設計、自動駕駛等行業,從而以較低成本跑出較大價值。
盡管成績斐然,但混元 3D 離“大規模可用”還有距離。而這些局限,恰恰揭示了 3D 創作行業的終極挑戰,也讓騰訊的領跑之路充滿變數。
從技術維度看,質量、可控性和速度是三座大山,這也是 3D 生成與世界模型兩條主線上共同的核心挑戰。
生成質量方面,如何保證視覺效果高,避免畸形和紋理模糊;可控性方面如何保證生成結果符合用戶需求;速度方面如何提高生成速度,進一步降低 GPU 算力消耗和成本?
郭春超的排序是:“先攻質量和可控,再攻加速和降本”。
可控性可以說其中最核心的痛點,復雜機械道具的拆件靈活性不足,AI 生成的往往是整體,單獨編輯某個零件仍需手動調整;在對 3A 水準要求較高的項目中,模型進入正式生產前仍需較多人工調整。
對此,混元 3D 正從三個層面突破:
數據層面:擴充高質量多模態數據,并優化渲染管線;
模型架構層面:注入更豐富的條件信息,設計“分析—雕刻”式模型;
交互面:支持三視圖、多模態輸入,研發 3D Omni 模型,讓用戶可以通過拖動直接修改形態。
更深層的瓶頸則來自數據本身。“3D 數據已經成了行業瓶頸。”郭春超總結。
一方面是數量和質量受限,3D 資產多為人工建模生成,全球可用數據僅千萬量級,遠不及文本的百億級規模。另一方面是處理門檻高,3D 模型不能直接喂給大模型,需經過預處理、格式轉換等復雜工程步驟”,郭春超解釋道。數據稀缺直接限制模型的泛化能力,導致 3D 生成效果不穩定,進一步影響落地場景的擴張——一個典型的“越用越缺”的循環。
而騰訊的解法是,一通過采買或收集開源 3D 資產擴充數據數量和質量。二探索更多模態的信息嵌入,減少對純 3D 資產數量的依賴。
目前,3D 生成行業整體上仍處于早期階段,郭春超用文生圖類比:“3D AIGC 革命目前剛跨過第一階段的門檻,真正的大規模革命還沒開始——現在類似 Midjourney 時代,能滿足部分場景,但距離‘高度復雜場景 + 極高可控性 + 任意組合’的第二階段還有很大空間”。
商業化的考驗同樣存在。但騰訊并不急于求成:“在現在這個大模型 AI 的時代,Model as a Service 本身就是核心競爭力”,當技術領先性持續鞏固,商業化的平衡點自然會出現。
這場暗戰,騰訊已經領跑一步。而終局的勝負,取決于誰能更深刻地理解行業痛點,誰能更持續地構建生態壁壘——畢竟,技術會過時,場景會變遷,但生態的力量,才是最持久的競爭力。
InfoQ 2025年終榜單以“洞察 AI 變革,見證智能未來”為主題,我們誠邀各企業和團隊分享自己在 AI 領域的最新成果和杰出項目。無論是在AI基礎設施的搭建,工程與部署的創新,還是智能體生產力的提升與行業應用的拓展,我們期待與您共同展現AI技術與產業結合的無限可能。如有興趣,歡迎掃描下方二維碼積極提報!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.