網易首頁 > 網易號 > 正文申請入駐

OpenAI點贊轉發的冠軍項目，背后藏著一個國人3D生成團隊

2026-03-06 11:36:05　來源: 機器之心Pro

北京舉報

分享至

機器之心編輯部

近日，一款名為StoryWorld的 iOS 產品 Demo 在海外開發者與 3D 創作者社區引發關注：用戶只需用手機攝像頭對準真實空間，通過語音輸入描述，即可生成 3D 角色與物體，通過移動手機完成取景與運鏡，像導演一樣調度站位與鏡頭。

該項目獲得了 OpenAI Codex Hackathon 冠軍，OpenAI 官方 OpenAI Developers 也在 X 平臺轉發推薦了這款創建 3D 場景的應用。據開發者 Varick Lim 介紹，他在 24 小時的開發時間內完成了這款應用，其中核心的 3D 資產生成環節使用了DeemosTech（影眸科技）的 Hyper3D Rodin

一、3D 生成從演示工具到生產工具

與常見的 AR 疊加效果不同，StoryWorld 中的 3D 對象是完整的三維資產，可以在空間中定位、縮放和多角度觀察。這些資產被放置進場景后，用戶只需移動 iPhone 攝像頭，就能完成取景與運鏡，實現類似電影攝影機的 “走位拍攝”，包括角色站位、拍攝角度與景別（近景 / 遠景）控制。

視頻鏈接：https://mp.weixin.qq.com/s/C-vIHqb4RQyRlVP7BdMqzg

在 AI 應用開發社區，工具的選擇通常以結果和效率為導向：能否在極短時間內穩定產出可用資產、并撐起完整體驗，是比 “表面參數” 更直接的標準。Hyper3D Rodin 在實時文 / 圖生 3D 中呈現出的穩定性與可控性，使其成為 StoryWorld 在黑客松環境下的關鍵技術選項之一。

Varick Lim 在 X 上興奮地表示：（StoryWorld）沒有 Rodin 就無法實現！他的這個項目也啟發了更多頂級 AI builder 跟隨。3D 生成技術正在從單純的內容展示工具，轉變為開發者構建產品時的底層技術組件。

過去的生成式內容更多聚焦于 “生成一個畫面 / 一個結果”，而 StoryWorld 這種形態把創作重心轉向 “場景構建與鏡頭語言”。這種轉變讓 3D 生成從 “演示型技術” 走向 “生產型組件”，從而對 3D 生成提出更高要求，高穩定性和可控性的 3D 生成產品也更容易被整合進開發者的長期工作流。

美國 AI 公司 Unlikely Labs 創始人、高級人工智能總監 Eric Gradman 評論道：“我看過上千個 ARKit 演示，無一例外都是‘嘿，看，我可以繞著這個靜態 3D 物體移動’。我從來沒見過這樣的。太棒了！”

二、從黑客松到工程化生產管線

隨著 AI 原生創作、AR 場景表達和新一代內容工具的發展，越來越多頂尖 builder 在真實創造場景中把 Hyper3D 納入工作流。

除 OpenAI 黑客松項目外，Hyper3D Rodin 也出現在另一個更 “工程化” 的高規格場景里：在今年 CES 大會上，英偉達創始人黃仁勛主題演講的 keynote 制作工作流被公開討論，其中提到了包含Hyper3D Rodin在內的工具鏈路線索。

根據英偉達公開的演講制作流程，團隊需要實現 12K 超清畫面、多個主體同框的細節保持，以及一條能夠快速迭代、無需反復重建場景的靈活 workflow。在這個流程中，Hyper3D Rodin 承擔了 3D 模型生成任務，并需要在多個制作階段保持角度與光照一致性，同時維持細節還原度。

最終，NVIDIA 團隊制作出了專為巨型演講屏幕設計的 12K 高精度環境畫面。英偉達作為全球 AI 基礎設施的重要制定者，其公開的內部工作流在某種程度上代表了行業標準。能夠被納入這類工程化管線的產品，意味著在精度、穩定性、工程適配能力上通過了更嚴格的驗證。

從 OpenAI 黑客松的 “極限速度” 到英偉達的 “工程標準”，這兩類場景共同指向同一個判斷：當 3D 生成被當作生產組件使用時，穩定性、可控性與可復用性會成為第一優先級

三、從 “生成” 到 “編輯”：

3D 可控成為生產級流程基礎范式

Hyper3D 是一支平均年齡 24 歲的國人團隊，已獲得奇績創壇、紅杉中國、字節跳動、美團龍珠、藍馳創投的多輪投資。

從技術積累看，團隊在 2024 年發布了原生 3D 大模型框架 CLAY（提名 SIGGRAPH 最佳論文），并基于此推出全球第一個原生 3D 大模型產品 Hyper3D.AI 。2025 年，團隊的單張圖生成場景研究 CAST 獲得 SIGGRAPH 2025 最佳論文，向 “世界模型” 的關鍵一步推進。

今年 1 月，Hyper3D 發布了 Rodin Gen-2 Edit，推出基于自然語言的 3D 模型局部編輯功能，率先實現 3D Nano Banana—— 這是業內首個將 “3D 生成” 與 “3D 編輯” 整合為完整工作流的商用產品，3D 生成正式進入可編輯時代。

與傳統 “抽卡” 邏輯不同，Rodin Gen-2 Edit 支持兩種核心路徑：

在 Hyper3D 內文 / 圖生 3D 后，直接對結果進行局部修改
導入任意現有模型（包括第三方 AI 生成模型或歷史資產），在原模型基礎上進行編輯

操作邏輯簡單直接：框選需要修改的區域，輸入文字指令，即可完成局部調整。

這一功能的適用范圍不限于 Hyper3D 平臺生成的模型 —— 任何第三方 3D 資產（包括歷史存量模型或其他 AI 工具生成的模型）都可以導入平臺進行編輯。這使得 Rodin 的編輯能力定位為平臺級基礎設施，而非單點功能。

Edit 的 API 集成也被 Varick Lim 在線催更。這正是 Hyper3D 被頂級開發者選擇的原因之一：當 3D 工具不僅能在關鍵環節快速產出高質量資產，還能在后續迭代中支持局部修改與資產復用時，它才更接近 “生產組件” 的形態，也更容易長期留在一流開發者與生產級管線的工作流里。

四、多模態技術演進路徑：

從生成到可控

觀察生成式 AI 的發展路徑，可以看到一條清晰的演進邏輯：先生成 → 再增強可控性 → 最終支持編輯。不論是圖像、視頻，還是 3D，多模態生成在發展早期，往往難以逃避 “抽卡”：通過更換隨機種子得到不同結果，再去碰運氣匹配需求。

隨著 ControlNet 等技術的發展，用戶逐漸可以在生成前，通過多種信號的引導補充，來更好地讓生成結果滿足用戶需求，減少抽卡次數。

Hyper3D 從初代 Rodin 開始，就率先引入了 3D ControlNet，把可控性作為模型底層能力來設計 —— 用戶可以自由設定模型的長寬高、內部結構和表面輪廓，精準控形。

但因為生成式 AI 輸入信息的有限和特性，即永遠是從少量信息去生成更多信息，決定了哪怕生成能力再強，二次調整都會成為高頻需求。

在圖像領域，Nano Banana 等工具的發布推動了 AI 編輯和可控性的發展。但在 3D 生成由于產品化起步更晚、生態更分散、工具鏈更長，行業整體在 “可控生成” 積累得不夠久，多數團隊還停留在這一階段。

Hyper3D 團隊從 Rodin 的第一個版本起，就引入了 3D ControlNet，此后每個版本都在更新相關能力。去年，隨著 Rodin Gen-2 上線，Hyper3D 交出了業內唯一的遞歸分件技術 ——BANG，一步步驗證了這一路線的可行性。3D 生成也一步步從 “抽卡游戲” 進化為了 “可控設計”。

藝術家 @豆芽 AI 筆記本使用 Hyper3D 的分件架構 BANG，一鍵讓 3D 模型 "爆炸式拆解" 成多個部件，還能反復拆分重組。

Edit 功能將這一需求進一步轉化為產品能力：通過 “選中局部 + 文本指令” 的方式，讓修改變成明確的路徑，而非一次次推倒重來。

這使得 AI 建模的工作流得以閉環：無論是剛出爐的新模型還是壓箱底的舊資產，都能隨便改、反復調、持續迭代。

「創作者 @建筑學長，利用 Hyper3D 快速補齊了建筑周邊的空白場地，表示明顯大大提升了建模效率：就算是手繪草圖，也能精準識別并還原，生成立體模型，無縫融入包含綠化，圍欄的場地中，實現建筑場地的完美融合。」

「創作者 @大琢磨使用 Hyper3D.AI Rodin 省去了前期建模的專業難度以及繁瑣過程，順利做出了小巧精致的車頭吉祥物。」

AI 創作者 @數字生命卡茲克通過 Hyper3D 把金毛跟《怪奇物語》融合，創作了獨特的 “怪奇生物”

五、行業焦點的轉移：

下一代 3D 生產基礎設施

AI 3D 的焦點正在從 “能不能生成” 轉向 “可編輯、可復用”，并逐步沉淀為創作與生產鏈路中的工作流組件。

對開發者而言，這意味著 3D 不再只是最終交付的結果文件，而是能被反復調用、持續迭代的生產要素。對 3D 大模型公司而言，能否在關鍵環節穩定產出、并在編輯與復用環節補齊能力缺口，將越來越影響其在全球創作鏈路中的定位。

從 OpenAI 黑客松到 NVIDIA CES 演講，從獨立開發者到企業級制作管線，Hyper3D Rodin 被頂級開發者持續選擇，展示了國際領先的 3D 生成技術從實驗室走向工程化與生產化應用的路徑。

技術的價值最終體現在具體應用場景中。當 3D 生成技術能夠滿足黑客松的快速開發需求、企業級演講的制作標準，以及日常創作者的迭代修改需求時，一款 AI 產品才真正完成了從技術演示到生產工具的轉變。

StoryWorld：https://x.com/OpenAIDevs/status/2028588630206472337?s=20

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.