![]()
機器之心編輯部
近日,一款名為StoryWorld的 iOS 產品 Demo 在海外開發者與 3D 創作者社區引發關注:用戶只需用手機攝像頭對準真實空間,通過語音輸入描述,即可生成 3D 角色與物體,通過移動手機完成取景與運鏡,像導演一樣調度站位與鏡頭。

該項目獲得了 OpenAI Codex Hackathon 冠軍,OpenAI 官方 OpenAI Developers 也在 X 平臺轉發推薦了這款創建 3D 場景的應用。據開發者 Varick Lim 介紹,他在 24 小時的開發時間內完成了這款應用,其中核心的 3D 資產生成環節使用了DeemosTech(影眸科技)的 Hyper3D Rodin
![]()
一、3D 生成從演示工具到生產工具
與常見的 AR 疊加效果不同,StoryWorld 中的 3D 對象是完整的三維資產,可以在空間中定位、縮放和多角度觀察。這些資產被放置進場景后,用戶只需移動 iPhone 攝像頭,就能完成取景與運鏡,實現類似電影攝影機的 “走位拍攝”,包括角色站位、拍攝角度與景別(近景 / 遠景)控制。
![]()
視頻鏈接:https://mp.weixin.qq.com/s/C-vIHqb4RQyRlVP7BdMqzg
在 AI 應用開發社區,工具的選擇通常以結果和效率為導向:能否在極短時間內穩定產出可用資產、并撐起完整體驗,是比 “表面參數” 更直接的標準。Hyper3D Rodin 在實時文 / 圖生 3D 中呈現出的穩定性與可控性,使其成為 StoryWorld 在黑客松環境下的關鍵技術選項之一。
Varick Lim 在 X 上興奮地表示:(StoryWorld)沒有 Rodin 就無法實現!他的這個項目也啟發了更多頂級 AI builder 跟隨。3D 生成技術正在從單純的內容展示工具,轉變為開發者構建產品時的底層技術組件。
![]()
![]()
過去的生成式內容更多聚焦于 “生成一個畫面 / 一個結果”,而 StoryWorld 這種形態把創作重心轉向 “場景構建與鏡頭語言”。這種轉變讓 3D 生成從 “演示型技術” 走向 “生產型組件”,從而對 3D 生成提出更高要求,高穩定性和可控性的 3D 生成產品也更容易被整合進開發者的長期工作流。
美國 AI 公司 Unlikely Labs 創始人、高級人工智能總監 Eric Gradman 評論道:“我看過上千個 ARKit 演示,無一例外都是‘嘿,看,我可以繞著這個靜態 3D 物體移動’。我從來沒見過這樣的。太棒了!”
![]()
二、從黑客松到工程化生產管線
隨著 AI 原生創作、AR 場景表達和新一代內容工具的發展,越來越多頂尖 builder 在真實創造場景中把 Hyper3D 納入工作流。
除 OpenAI 黑客松項目外,Hyper3D Rodin 也出現在另一個更 “工程化” 的高規格場景里:在今年 CES 大會上,英偉達創始人黃仁勛主題演講的 keynote 制作工作流被公開討論,其中提到了包含Hyper3D Rodin在內的工具鏈路線索。
![]()
![]()
根據英偉達公開的演講制作流程,團隊需要實現 12K 超清畫面、多個主體同框的細節保持,以及一條能夠快速迭代、無需反復重建場景的靈活 workflow。在這個流程中,Hyper3D Rodin 承擔了 3D 模型生成任務,并需要在多個制作階段保持角度與光照一致性,同時維持細節還原度。
最終,NVIDIA 團隊制作出了專為巨型演講屏幕設計的 12K 高精度環境畫面。英偉達作為全球 AI 基礎設施的重要制定者,其公開的內部工作流在某種程度上代表了行業標準。能夠被納入這類工程化管線的產品,意味著在精度、穩定性、工程適配能力上通過了更嚴格的驗證。
從 OpenAI 黑客松的 “極限速度” 到 英偉達的 “工程標準”,這兩類場景共同指向同一個判斷:當 3D 生成被當作生產組件使用時,穩定性、可控性與可復用性會成為第一優先級
三、從 “生成” 到 “編輯”:
3D 可控成為生產級流程基礎范式
Hyper3D 是一支平均年齡 24 歲的國人團隊,已獲得奇績創壇、紅杉中國、字節跳動、美團龍珠、藍馳創投的多輪投資。
從技術積累看,團隊在 2024 年發布了原生 3D 大模型框架 CLAY(提名 SIGGRAPH 最佳論文),并基于此推出全球第一個原生 3D 大模型產品 Hyper3D.AI 。2025 年,團隊的單張圖生成場景研究 CAST 獲得 SIGGRAPH 2025 最佳論文,向 “世界模型” 的關鍵一步推進。
![]()
今年 1 月,Hyper3D 發布了 Rodin Gen-2 Edit,推出基于自然語言的 3D 模型局部編輯功能,率先實現 3D Nano Banana—— 這是業內首個將 “3D 生成” 與 “3D 編輯” 整合為完整工作流的商用產品,3D 生成正式進入可編輯時代。
與傳統 “抽卡” 邏輯不同,Rodin Gen-2 Edit 支持兩種核心路徑:
- 在 Hyper3D 內文 / 圖生 3D 后,直接對結果進行局部修改
- 導入任意現有模型(包括第三方 AI 生成模型或歷史資產),在原模型基礎上進行編輯
操作邏輯簡單直接:框選需要修改的區域,輸入文字指令,即可完成局部調整。

這一功能的適用范圍不限于 Hyper3D 平臺生成的模型 —— 任何第三方 3D 資產(包括歷史存量模型或其他 AI 工具生成的模型)都可以導入平臺進行編輯。這使得 Rodin 的編輯能力定位為平臺級基礎設施,而非單點功能。
Edit 的 API 集成也被 Varick Lim 在線催更。這正是 Hyper3D 被頂級開發者選擇的原因之一:當 3D 工具不僅能在關鍵環節快速產出高質量資產,還能在后續迭代中支持局部修改與資產復用時,它才更接近 “生產組件” 的形態,也更容易長期留在一流開發者與生產級管線的工作流里。
![]()
四、多模態技術演進路徑:
從生成到可控
觀察生成式 AI 的發展路徑,可以看到一條清晰的演進邏輯:先生成 → 再增強可控性 → 最終支持編輯。不論是圖像、視頻,還是 3D,多模態生成在發展早期,往往難以逃避 “抽卡”:通過更換隨機種子得到不同結果,再去碰運氣匹配需求。
隨著 ControlNet 等技術的發展,用戶逐漸可以在生成前,通過多種信號的引導補充,來更好地讓生成結果滿足用戶需求,減少抽卡次數。

Hyper3D 從初代 Rodin 開始,就率先引入了 3D ControlNet,把可控性作為模型底層能力來設計 —— 用戶可以自由設定模型的長寬高、內部結構和表面輪廓,精準控形。
但因為生成式 AI 輸入信息的有限和特性,即永遠是從少量信息去生成更多信息,決定了哪怕生成能力再強,二次調整都會成為高頻需求。
在圖像領域,Nano Banana 等工具的發布推動了 AI 編輯和可控性的發展。但在 3D 生成由于產品化起步更晚、生態更分散、工具鏈更長,行業整體在 “可控生成” 積累得不夠久,多數團隊還停留在這一階段。
Hyper3D 團隊從 Rodin 的第一個版本起,就引入了 3D ControlNet,此后每個版本都在更新相關能力。去年,隨著 Rodin Gen-2 上線,Hyper3D 交出了業內唯一的遞歸分件技術 ——BANG,一步步驗證了這一路線的可行性。3D 生成也一步步從 “抽卡游戲” 進化為了 “可控設計”。

藝術家 @豆芽 AI 筆記本 使用 Hyper3D 的分件架構 BANG,一鍵讓 3D 模型 "爆炸式拆解" 成多個部件,還能反復拆分重組。
Edit 功能將這一需求進一步轉化為產品能力:通過 “選中局部 + 文本指令” 的方式,讓修改變成明確的路徑,而非一次次推倒重來。
這使得 AI 建模的工作流得以閉環:無論是剛出爐的新模型還是壓箱底的舊資產,都能隨便改、反復調、持續迭代。

「創作者 @建筑學長,利用 Hyper3D 快速補齊了建筑周邊的空白場地,表示明顯大大提升了建模效率:就算是手繪草圖,也能精準識別并還原,生成立體模型,無縫融入包含綠化,圍欄的場地中,實現建筑場地的完美融合。」

「創作者 @大琢磨使用 Hyper3D.AI Rodin 省去了前期建模的專業難度以及繁瑣過程,順利做出了小巧精致的車頭吉祥物。」
![]()
AI 創作者 @數字生命卡茲克 通過 Hyper3D 把金毛跟《怪奇物語》融合,創作了獨特的 “怪奇生物”
五、行業焦點的轉移:
下一代 3D 生產基礎設施
AI 3D 的焦點正在從 “能不能生成” 轉向 “可編輯、可復用”,并逐步沉淀為創作與生產鏈路中的工作流組件。
對開發者而言,這意味著 3D 不再只是最終交付的結果文件,而是能被反復調用、持續迭代的生產要素。對 3D 大模型公司而言,能否在關鍵環節穩定產出、并在編輯與復用環節補齊能力缺口,將越來越影響其在全球創作鏈路中的定位。
從 OpenAI 黑客松到 NVIDIA CES 演講,從獨立開發者到企業級制作管線,Hyper3D Rodin 被頂級開發者持續選擇,展示了國際領先的 3D 生成技術從實驗室走向工程化與生產化應用的路徑。
技術的價值最終體現在具體應用場景中。當 3D 生成技術能夠滿足黑客松的快速開發需求、企業級演講的制作標準,以及日常創作者的迭代修改需求時,一款 AI 產品才真正完成了從技術演示到生產工具的轉變。
StoryWorld:https://x.com/OpenAIDevs/status/2028588630206472337?s=20
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.