![]()
機(jī)器之心編輯部
近日,一款名為StoryWorld的 iOS 產(chǎn)品 Demo 在海外開(kāi)發(fā)者與 3D 創(chuàng)作者社區(qū)引發(fā)關(guān)注:用戶只需用手機(jī)攝像頭對(duì)準(zhǔn)真實(shí)空間,通過(guò)語(yǔ)音輸入描述,即可生成 3D 角色與物體,通過(guò)移動(dòng)手機(jī)完成取景與運(yùn)鏡,像導(dǎo)演一樣調(diào)度站位與鏡頭。
![]()
該項(xiàng)目獲得了 OpenAI Codex Hackathon 冠軍,OpenAI 官方 OpenAI Developers 也在 X 平臺(tái)轉(zhuǎn)發(fā)推薦了這款創(chuàng)建 3D 場(chǎng)景的應(yīng)用。據(jù)開(kāi)發(fā)者 Varick Lim 介紹,他在 24 小時(shí)的開(kāi)發(fā)時(shí)間內(nèi)完成了這款應(yīng)用,其中核心的 3D 資產(chǎn)生成環(huán)節(jié)使用了DeemosTech(影眸科技)的 Hyper3D Rodin
![]()
一、3D 生成從演示工具到生產(chǎn)工具
與常見(jiàn)的 AR 疊加效果不同,StoryWorld 中的 3D 對(duì)象是完整的三維資產(chǎn),可以在空間中定位、縮放和多角度觀察。這些資產(chǎn)被放置進(jìn)場(chǎng)景后,用戶只需移動(dòng) iPhone 攝像頭,就能完成取景與運(yùn)鏡,實(shí)現(xiàn)類似電影攝影機(jī)的 “走位拍攝”,包括角色站位、拍攝角度與景別(近景 / 遠(yuǎn)景)控制。
![]()
視頻鏈接:https://mp.weixin.qq.com/s/C-vIHqb4RQyRlVP7BdMqzg
在 AI 應(yīng)用開(kāi)發(fā)社區(qū),工具的選擇通常以結(jié)果和效率為導(dǎo)向:能否在極短時(shí)間內(nèi)穩(wěn)定產(chǎn)出可用資產(chǎn)、并撐起完整體驗(yàn),是比 “表面參數(shù)” 更直接的標(biāo)準(zhǔn)。Hyper3D Rodin 在實(shí)時(shí)文 / 圖生 3D 中呈現(xiàn)出的穩(wěn)定性與可控性,使其成為 StoryWorld 在黑客松環(huán)境下的關(guān)鍵技術(shù)選項(xiàng)之一。
Varick Lim 在 X 上興奮地表示:(StoryWorld)沒(méi)有 Rodin 就無(wú)法實(shí)現(xiàn)!他的這個(gè)項(xiàng)目也啟發(fā)了更多頂級(jí) AI builder 跟隨。3D 生成技術(shù)正在從單純的內(nèi)容展示工具,轉(zhuǎn)變?yōu)殚_(kāi)發(fā)者構(gòu)建產(chǎn)品時(shí)的底層技術(shù)組件。
![]()
![]()
過(guò)去的生成式內(nèi)容更多聚焦于 “生成一個(gè)畫面 / 一個(gè)結(jié)果”,而 StoryWorld 這種形態(tài)把創(chuàng)作重心轉(zhuǎn)向 “場(chǎng)景構(gòu)建與鏡頭語(yǔ)言”。這種轉(zhuǎn)變讓 3D 生成從 “演示型技術(shù)” 走向 “生產(chǎn)型組件”,從而對(duì) 3D 生成提出更高要求,高穩(wěn)定性和可控性的 3D 生成產(chǎn)品也更容易被整合進(jìn)開(kāi)發(fā)者的長(zhǎng)期工作流。
美國(guó) AI 公司 Unlikely Labs 創(chuàng)始人、高級(jí)人工智能總監(jiān) Eric Gradman 評(píng)論道:“我看過(guò)上千個(gè) ARKit 演示,無(wú)一例外都是‘嘿,看,我可以繞著這個(gè)靜態(tài) 3D 物體移動(dòng)’。我從來(lái)沒(méi)見(jiàn)過(guò)這樣的。太棒了!”
![]()
二、從黑客松到工程化生產(chǎn)管線
隨著 AI 原生創(chuàng)作、AR 場(chǎng)景表達(dá)和新一代內(nèi)容工具的發(fā)展,越來(lái)越多頂尖 builder 在真實(shí)創(chuàng)造場(chǎng)景中把 Hyper3D 納入工作流。
除 OpenAI 黑客松項(xiàng)目外,Hyper3D Rodin 也出現(xiàn)在另一個(gè)更 “工程化” 的高規(guī)格場(chǎng)景里:在今年 CES 大會(huì)上,英偉達(dá)創(chuàng)始人黃仁勛主題演講的 keynote 制作工作流被公開(kāi)討論,其中提到了包含Hyper3D Rodin在內(nèi)的工具鏈路線索。
![]()
![]()
根據(jù)英偉達(dá)公開(kāi)的演講制作流程,團(tuán)隊(duì)需要實(shí)現(xiàn) 12K 超清畫面、多個(gè)主體同框的細(xì)節(jié)保持,以及一條能夠快速迭代、無(wú)需反復(fù)重建場(chǎng)景的靈活 workflow。在這個(gè)流程中,Hyper3D Rodin 承擔(dān)了 3D 模型生成任務(wù),并需要在多個(gè)制作階段保持角度與光照一致性,同時(shí)維持細(xì)節(jié)還原度。
最終,NVIDIA 團(tuán)隊(duì)制作出了專為巨型演講屏幕設(shè)計(jì)的 12K 高精度環(huán)境畫面。英偉達(dá)作為全球 AI 基礎(chǔ)設(shè)施的重要制定者,其公開(kāi)的內(nèi)部工作流在某種程度上代表了行業(yè)標(biāo)準(zhǔn)。能夠被納入這類工程化管線的產(chǎn)品,意味著在精度、穩(wěn)定性、工程適配能力上通過(guò)了更嚴(yán)格的驗(yàn)證。
從 OpenAI 黑客松的 “極限速度” 到 英偉達(dá)的 “工程標(biāo)準(zhǔn)”,這兩類場(chǎng)景共同指向同一個(gè)判斷:當(dāng) 3D 生成被當(dāng)作生產(chǎn)組件使用時(shí),穩(wěn)定性、可控性與可復(fù)用性會(huì)成為第一優(yōu)先級(jí)
三、從 “生成” 到 “編輯”:
3D 可控成為生產(chǎn)級(jí)流程基礎(chǔ)范式
Hyper3D 是一支平均年齡 24 歲的國(guó)人團(tuán)隊(duì),已獲得奇績(jī)創(chuàng)壇、紅杉中國(guó)、字節(jié)跳動(dòng)、美團(tuán)龍珠、藍(lán)馳創(chuàng)投的多輪投資。
從技術(shù)積累看,團(tuán)隊(duì)在 2024 年發(fā)布了原生 3D 大模型框架 CLAY(提名 SIGGRAPH 最佳論文),并基于此推出全球第一個(gè)原生 3D 大模型產(chǎn)品 Hyper3D.AI 。2025 年,團(tuán)隊(duì)的單張圖生成場(chǎng)景研究 CAST 獲得 SIGGRAPH 2025 最佳論文,向 “世界模型” 的關(guān)鍵一步推進(jìn)。
![]()
今年 1 月,Hyper3D 發(fā)布了 Rodin Gen-2 Edit,推出基于自然語(yǔ)言的 3D 模型局部編輯功能,率先實(shí)現(xiàn) 3D Nano Banana—— 這是業(yè)內(nèi)首個(gè)將 “3D 生成” 與 “3D 編輯” 整合為完整工作流的商用產(chǎn)品,3D 生成正式進(jìn)入可編輯時(shí)代。
與傳統(tǒng) “抽卡” 邏輯不同,Rodin Gen-2 Edit 支持兩種核心路徑:
- 在 Hyper3D 內(nèi)文 / 圖生 3D 后,直接對(duì)結(jié)果進(jìn)行局部修改
- 導(dǎo)入任意現(xiàn)有模型(包括第三方 AI 生成模型或歷史資產(chǎn)),在原模型基礎(chǔ)上進(jìn)行編輯
操作邏輯簡(jiǎn)單直接:框選需要修改的區(qū)域,輸入文字指令,即可完成局部調(diào)整。
![]()
這一功能的適用范圍不限于 Hyper3D 平臺(tái)生成的模型 —— 任何第三方 3D 資產(chǎn)(包括歷史存量模型或其他 AI 工具生成的模型)都可以導(dǎo)入平臺(tái)進(jìn)行編輯。這使得 Rodin 的編輯能力定位為平臺(tái)級(jí)基礎(chǔ)設(shè)施,而非單點(diǎn)功能。
Edit 的 API 集成也被 Varick Lim 在線催更。這正是 Hyper3D 被頂級(jí)開(kāi)發(fā)者選擇的原因之一:當(dāng) 3D 工具不僅能在關(guān)鍵環(huán)節(jié)快速產(chǎn)出高質(zhì)量資產(chǎn),還能在后續(xù)迭代中支持局部修改與資產(chǎn)復(fù)用時(shí),它才更接近 “生產(chǎn)組件” 的形態(tài),也更容易長(zhǎng)期留在一流開(kāi)發(fā)者與生產(chǎn)級(jí)管線的工作流里。
![]()
四、多模態(tài)技術(shù)演進(jìn)路徑:
從生成到可控
觀察生成式 AI 的發(fā)展路徑,可以看到一條清晰的演進(jìn)邏輯:先生成 → 再增強(qiáng)可控性 → 最終支持編輯。不論是圖像、視頻,還是 3D,多模態(tài)生成在發(fā)展早期,往往難以逃避 “抽卡”:通過(guò)更換隨機(jī)種子得到不同結(jié)果,再去碰運(yùn)氣匹配需求。
隨著 ControlNet 等技術(shù)的發(fā)展,用戶逐漸可以在生成前,通過(guò)多種信號(hào)的引導(dǎo)補(bǔ)充,來(lái)更好地讓生成結(jié)果滿足用戶需求,減少抽卡次數(shù)。
![]()
Hyper3D 從初代 Rodin 開(kāi)始,就率先引入了 3D ControlNet,把可控性作為模型底層能力來(lái)設(shè)計(jì) —— 用戶可以自由設(shè)定模型的長(zhǎng)寬高、內(nèi)部結(jié)構(gòu)和表面輪廓,精準(zhǔn)控形。
但因?yàn)樯墒?AI 輸入信息的有限和特性,即永遠(yuǎn)是從少量信息去生成更多信息,決定了哪怕生成能力再?gòu)?qiáng),二次調(diào)整都會(huì)成為高頻需求。
在圖像領(lǐng)域,Nano Banana 等工具的發(fā)布推動(dòng)了 AI 編輯和可控性的發(fā)展。但在 3D 生成由于產(chǎn)品化起步更晚、生態(tài)更分散、工具鏈更長(zhǎng),行業(yè)整體在 “可控生成” 積累得不夠久,多數(shù)團(tuán)隊(duì)還停留在這一階段。
Hyper3D 團(tuán)隊(duì)從 Rodin 的第一個(gè)版本起,就引入了 3D ControlNet,此后每個(gè)版本都在更新相關(guān)能力。去年,隨著 Rodin Gen-2 上線,Hyper3D 交出了業(yè)內(nèi)唯一的遞歸分件技術(shù) ——BANG,一步步驗(yàn)證了這一路線的可行性。3D 生成也一步步從 “抽卡游戲” 進(jìn)化為了 “可控設(shè)計(jì)”。
![]()
藝術(shù)家 @豆芽 AI 筆記本 使用 Hyper3D 的分件架構(gòu) BANG,一鍵讓 3D 模型 "爆炸式拆解" 成多個(gè)部件,還能反復(fù)拆分重組。
Edit 功能將這一需求進(jìn)一步轉(zhuǎn)化為產(chǎn)品能力:通過(guò) “選中局部 + 文本指令” 的方式,讓修改變成明確的路徑,而非一次次推倒重來(lái)。
這使得 AI 建模的工作流得以閉環(huán):無(wú)論是剛出爐的新模型還是壓箱底的舊資產(chǎn),都能隨便改、反復(fù)調(diào)、持續(xù)迭代。
![]()
「創(chuàng)作者 @建筑學(xué)長(zhǎng),利用 Hyper3D 快速補(bǔ)齊了建筑周邊的空白場(chǎng)地,表示明顯大大提升了建模效率:就算是手繪草圖,也能精準(zhǔn)識(shí)別并還原,生成立體模型,無(wú)縫融入包含綠化,圍欄的場(chǎng)地中,實(shí)現(xiàn)建筑場(chǎng)地的完美融合。」
![]()
「創(chuàng)作者 @大琢磨使用 Hyper3D.AI Rodin 省去了前期建模的專業(yè)難度以及繁瑣過(guò)程,順利做出了小巧精致的車頭吉祥物。」
![]()
AI 創(chuàng)作者 @數(shù)字生命卡茲克 通過(guò) Hyper3D 把金毛跟《怪奇物語(yǔ)》融合,創(chuàng)作了獨(dú)特的 “怪奇生物”
五、行業(yè)焦點(diǎn)的轉(zhuǎn)移:
下一代 3D 生產(chǎn)基礎(chǔ)設(shè)施
AI 3D 的焦點(diǎn)正在從 “能不能生成” 轉(zhuǎn)向 “可編輯、可復(fù)用”,并逐步沉淀為創(chuàng)作與生產(chǎn)鏈路中的工作流組件。
對(duì)開(kāi)發(fā)者而言,這意味著 3D 不再只是最終交付的結(jié)果文件,而是能被反復(fù)調(diào)用、持續(xù)迭代的生產(chǎn)要素。對(duì) 3D 大模型公司而言,能否在關(guān)鍵環(huán)節(jié)穩(wěn)定產(chǎn)出、并在編輯與復(fù)用環(huán)節(jié)補(bǔ)齊能力缺口,將越來(lái)越影響其在全球創(chuàng)作鏈路中的定位。
從 OpenAI 黑客松到 NVIDIA CES 演講,從獨(dú)立開(kāi)發(fā)者到企業(yè)級(jí)制作管線,Hyper3D Rodin 被頂級(jí)開(kāi)發(fā)者持續(xù)選擇,展示了國(guó)際領(lǐng)先的 3D 生成技術(shù)從實(shí)驗(yàn)室走向工程化與生產(chǎn)化應(yīng)用的路徑。
技術(shù)的價(jià)值最終體現(xiàn)在具體應(yīng)用場(chǎng)景中。當(dāng) 3D 生成技術(shù)能夠滿足黑客松的快速開(kāi)發(fā)需求、企業(yè)級(jí)演講的制作標(biāo)準(zhǔn),以及日常創(chuàng)作者的迭代修改需求時(shí),一款 AI 產(chǎn)品才真正完成了從技術(shù)演示到生產(chǎn)工具的轉(zhuǎn)變。
StoryWorld:https://x.com/OpenAIDevs/status/2028588630206472337?s=20
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.