星星 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
過去一年,AI的主戰(zhàn)場幾乎被大模型、生圖和生視頻占滿。2026年伊始,市場終于開始把目光投向一個更難、也更關(guān)鍵的領(lǐng)域:3D生成
1月23日,Google收購3D生成公司Common Sense Machines的消息傳出,后者整個團(tuán)隊并入DeepMind;1月26日,Google又迅速宣布與Epic Games的合作。市場普遍猜測:3D版本的“Nano Banana”,是不是已經(jīng)不遠(yuǎn)了?
![]()
但率先將這一能力產(chǎn)品化的,是中國團(tuán)隊。
本周末,全球領(lǐng)先的3D生成平臺Hyper3D發(fā)布了Rodin Gen-2 Edit,推出基于自然語言的3D模型局部編輯功能,率先實現(xiàn)3D版Nano Banana——這是業(yè)內(nèi)首個將“3D生成”與“3D編輯”整合為完整工作流的商用產(chǎn)品,3D生成正式進(jìn)入可編輯時代。
與以往只能“抽卡”的邏輯不同,Rodin Gen-2 Edit支持兩種核心路徑:
- 在Hyper3D內(nèi)文/圖生3D后,直接對結(jié)果進(jìn)行局部修改
- 導(dǎo)入任意現(xiàn)有模型(包括第三方AI生成模型或歷史資產(chǎn)),在原模型基礎(chǔ)上進(jìn)行編輯
操作邏輯簡單直接:框選需要修改的區(qū)域,輸入文字指令,即可完成局部調(diào)整。
例如,只需框選機(jī)甲的雙臂區(qū)域,輸入提示詞“雙手改成大炮”:


即可生成一臺紅色裝甲的大炮機(jī)器人:

修改區(qū)域與原模型銜接自然,結(jié)構(gòu)邏輯完整,其余部分則被完整保留。

這一功能不僅支持Hyper3D平臺生成的模型,任何第三方3D資產(chǎn)(包括歷史存量模型或其它AI工具生成的模型)都可以導(dǎo)入平臺進(jìn)行編輯:


這意味著Rodin的編輯能力已成為平臺級基礎(chǔ)設(shè)施,而非單點功能。

一番體驗下來,Hyper3D Rodin所帶來的最新玩法無疑是行業(yè)最前沿技術(shù)的體現(xiàn),僅通過自然語言就可以修改、增加、減少模型部件,還不會影響其他模型結(jié)構(gòu),確實給3D修模帶來一點小小的震撼。
在基礎(chǔ)3D生成能力上,Hyper3D Rodin本就處在當(dāng)前行業(yè)的第一梯隊:不僅能精準(zhǔn)還原參考圖的結(jié)構(gòu)、比例與關(guān)鍵細(xì)節(jié);尤其是表面平滑、邊緣銳利,對生產(chǎn)級資產(chǎn)尤為友好。
結(jié)合實測經(jīng)驗,給大家兩個核心使用小提示:
- 編輯時的框選區(qū)域不宜過小或過度聚焦細(xì)節(jié),不適用模型的細(xì)節(jié)精修;
- 需保證框選位置與修改Prompt精準(zhǔn)對應(yīng),易出理想效果。
從“生成”到“編輯”:補(bǔ)上AI工作流的關(guān)鍵一環(huán)
Edit的意義在于,第一次把3D從“結(jié)果展示”推進(jìn)到了“可迭代工作流”。
過去幾年,生成式AI的進(jìn)化路徑非常清晰:先生成→再可控→最終可編輯。不論是圖像、視頻,還是3D,多模態(tài)生成在發(fā)展早期,往往難以逃避“抽卡”,即每次生成都是通過更換隨機(jī)種子,得到更多不一樣的結(jié)果,匹配用戶需求。
隨著ControlNet等技術(shù)的發(fā)展,用戶逐漸可以在生成前,通過多種信號的引導(dǎo)補(bǔ)充,來更好地讓生成結(jié)果滿足用戶需求,減少抽卡次數(shù)。

2024年3月,Hyper3D上線業(yè)內(nèi)首個控制生成技術(shù)(3D ControlNet)。
但因為生成式AI輸入信息的有限和特性,即永遠(yuǎn)是從少量信息去生成更多信息,決定了哪怕生成能力再強(qiáng),二次調(diào)整都會成為高頻需求。
圖像領(lǐng)域已經(jīng)歷完整周期:從Stable Diffusion的一鍵出圖,到ControlNet的控制,再到2025年上半年Gemini 2.5 Flash首次引入圖片編輯,GPT-4o的圖像生成,再到強(qiáng)大的Nano Banana,生成式AI編輯技術(shù)已經(jīng)得到了很大的發(fā)展。視頻領(lǐng)域也正在加速復(fù)刻這一路徑,Luma AI的Video Modify、Runway的Aleph也已實現(xiàn)相關(guān)能力。
但在3D生成由于產(chǎn)品化起步更晚、生態(tài)更分散、工具鏈更長,行業(yè)整體在“可控生成”積累得不夠久,多數(shù)團(tuán)隊還停留在這一階段:用戶可以生成一個模型,但只要有局部不滿意,往往只能換提示詞、換隨機(jī)種子、重新來一遍,“隨機(jī)抽卡”。
Hyper3D將這一需求轉(zhuǎn)化為產(chǎn)品能力:通過“選中局部+文本指令”的方式,讓修改變成明確的路徑,而非一次次推倒重來。
在實測中我們發(fā)現(xiàn),Hyper3D Rodin的“編輯”并非單一功能,而是與其強(qiáng)大的“可控性”體系相輔相成。
對于專業(yè)用戶而言,Hyper3D提供了一套完整的工作流:其將圖像/文本生成、3D ControlNet精準(zhǔn)控模、局部定向修改、資產(chǎn)二次創(chuàng)作與多格式導(dǎo)出、DCC插件等多個平臺能力打通,顛覆了傳統(tǒng)AI 3D創(chuàng)作低效不可控的模式。
- 3D ControlNet控制:通過邊界框、點云、體素等模式,在生成階段精準(zhǔn)控制幾何結(jié)構(gòu)
- BANG分件:遞歸拆解復(fù)雜模型,為局部編輯提供語義基礎(chǔ)
- Smart Low-poly:智能低模優(yōu)化,提升生產(chǎn)效率
- Text-to-Edit:基于自然語言的定向修改,降低專業(yè)門檻

△Rodin Gen-2 Edit同步上線Smart Low-poly智能低模
在商業(yè)化落地層面,Rodin已經(jīng)打通Blender、Maya、Unity等主流工作流;與國內(nèi)頭部大型UGC游戲的合作驗證了其在移動端大規(guī)模用戶場景下的穩(wěn)定性;與拓竹的合作則讓生成模型可直接進(jìn)入3D打印流程。
在3D編輯能力普遍缺席的當(dāng)下,Hyper3D能率先交付產(chǎn)品,源于團(tuán)隊在“3D可控性”上的長期技術(shù)積累。
幾年前,當(dāng)行業(yè)普遍采用“2D升維3D”的算法路徑時,Hyper3D團(tuán)隊選擇了更艱難的原生3D路線。這意味著需要直面3D數(shù)據(jù)瓶頸,在算法和框架層面進(jìn)行底層創(chuàng)新——但也只有這條路,才能從根本上解決薄面、拓?fù)浠靵y等產(chǎn)業(yè)應(yīng)用的致命問題。
2024年,團(tuán)隊發(fā)布原生3D大模型框架CLAY(提名SIGGRAPH最佳論文),并基于此推出全球首個原生3D大模型產(chǎn)品Hyper3D.AI Rodin,將3D生成效果首次從“不可用”拉到“可用線”。
如今,原生3D已成行業(yè)共識。Hyper3D團(tuán)隊定義了3D生成的“可用性拐點”,也讓3D生成成為中國團(tuán)隊在全球AI競爭中少數(shù)真正領(lǐng)先的方向之一。
從Rodin的第一個版本起,該團(tuán)隊就引入了3D ControlNet,此后每個版本都在更新相關(guān)能力。去年,隨著Rodin Gen-2上線,Hyper3D交出了業(yè)內(nèi)唯一的遞歸分件技術(shù)BANG,一步步驗證了這一路線的可行性。3D生成也一步步從“抽卡游戲”進(jìn)化為了“可控設(shè)計”。

△藝術(shù)家@汽水PPao使用Hyper3D.AI Rodin創(chuàng)作的作品
但該團(tuán)隊的視野不止于單物體編輯。其獲得SIGGRAPH 2025最佳論文的CAST技術(shù),已指向下一階段方向:從單圖生成包含物體、關(guān)系和物理約束的完整3D場景——這為參與構(gòu)建未來“世界模型”與具身智能基礎(chǔ)設(shè)施埋下伏筆。
這一系列成果也獲得資本認(rèn)可。僅2025年,Hyper3D團(tuán)隊就連續(xù)完成由頂級美元VC和戰(zhàn)略產(chǎn)業(yè)方投資的兩輪融資
雖然現(xiàn)階段的Rodin Gen-2 Edit作為3D生成編輯的全新起點,尚未達(dá)到完美狀態(tài)。但不可否認(rèn),作為當(dāng)前市場上唯一能產(chǎn)品化這項功能的團(tuán)隊,其已經(jīng)走出了3D編輯的關(guān)鍵一步。
當(dāng)3D生成從“能不能做出來”邁向“能不能真正用起來”的階段,Hyper3D Rodin Gen-2 Edit的上線,無疑為行業(yè)提供了一個極具參考價值的范本。
目前,新功能已在Hyper3D平臺上線,支持用戶免費(fèi)體驗。
官網(wǎng)鏈接:https://hyper3d.ai/rodin
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.