剛剛,李飛飛的創業公司 World Labs 正式宣布,他們的世界模型 Marble 正式向所有人開放使用。
兩天前,李飛飛發布了,闡釋自己對世界模型和空間智能的看法。果然,她的正式"作品"緊接著就公開上線了。
*Marble介紹視頻
一句話總結,Marble 是 World Labs 的第一款產品,基于多模態世界模型打造。
這個模型現在允許任何人通過圖片/文字/視頻/3D素材,創建高保真、持久的3D世界,讓每個人腦海中的個性化場景精準地呈現在現實中。
![]()
世界模型被期待為下一個 AI 重大突破的機遇,也是近期全球科技圈的焦點。李飛飛發布 Marble 自然引起各路大佬圍觀,YC、a16z 的合伙人都第一時間轉發or體驗。
![]()
*YC的Garry Tan稱李飛飛的這次發布非常重要
![]()
*a16z 的 Justine Moore 試用完稱非常有趣
與 Marble 模型開放使用的消息一起公開的,還有 World Labs 的一篇產品解讀長文。這篇文章里,團隊不僅介紹了 Marble 的特點,還花式展示了不少效果案例和使用Tips。
我們第一時間對它進行評測(附在文末),并根據官方介紹整理出 Marble 的功能亮點:
全面多模態化
這是 Marble 最本質的特點。它已實現大規模多模態融合,可以根據文本、圖像、視頻或粗略的 3D 素材生成三維世界。
*圖片提示案例
*文本提示案例
多圖像提示
在使用中,用戶輸入多個圖像的提示,往往能以更高的精度創建 3D 世界。
原因在于,僅僅輸入文本或單圖像作為提示詞時,Marble 必須自行創造提示詞中未提供的世界部分。而如果使用多圖像,模型就可以根據這些圖像生成"世界"從不同角度看起來的樣子。
官方認為,這個功能事實上帶來了一個全新的世界生成工作流:用戶可以使用自己喜歡的圖像生成工具,生成并輸入參考圖,而 Marble 會將這些圖生成為完整的 3D 世界,同時還能在各個輸入圖之間無縫過渡。
多圖像提示還可以用來創建受現實世界空間啟發的"世界"。
Marble 可以輸入幾張從不同角度拍攝的現實場景照片,或一段短視頻,并將它們組合生成一個基于現實空間的世界。
編輯功能,讓生成更符合心意
對許多人而言,創作是一個需要迭代的過程,所以 Marble 還內置了原生 AI 世界編輯工具,方便用戶調整。
用戶可以通過它做微調,例如刪除一個物體,或修飾某個區域;也能用它做更大幅度的改動,例如替換物體、改變視覺風格,或重新構建世界中的大片區域。

*編輯案例

*編輯案例

*編輯案例
Marble 的多模態輸入與編輯功能,為生成的三維世界提供了高度控制能力。
但有時若要讓世界完全符合用戶腦海中的構想,還需對場景布局、物體尺寸與位置等方面進行更精細的控制。針對這種需求,他們推出了 Chisel ——一款能夠在 3D 空間中直接編輯 Marble 世界的原生 AI 工具。

*Chisel 編輯效果

*Chisel 編輯效果

*Chisel 編輯效果

*3D 編輯效果
構建更大世界
World Labs認為,有時候更大的確意味著更好。因為更廣闊的"世界"帶來更多可能性、更多空間,也更能展示用戶的創造力。
所以他們提供了兩種方式,讓用戶構建比之前更宏大的 3D 世界。
第一種,在"世界"生成完成后,Marble 支持一鍵擴展,讓世界變得更大。
在這個過程中,用戶擁有完全的控制權:
可以選擇對"世界"中的某個區域進行擴展,Marble 會自動生成更多內容來填充所選區域。而且,擴展功能不僅可以讓"世界"變得更大,還可以修復或優化原本存在瑕疵的部分——那些在初始生成時出現偽影或細節模糊的區域,在擴展后可以變得更加清晰干凈。

另外,擴展還可用于針對性地增強局部細節。比如有時,一張桌子的背面或房間的遠角可能不像房間中心那樣清晰,此時對該區域進行擴展,就能顯著改善畫面效果。


豐富的導出模式
在使用 Marble 創建"世界"之后,用戶可以通過多種方式將其導出,整合到接下來的操作中。
Gaussian splats(高斯點云)是 Marble 中最高保真度的表示形式。它將 3D 場景表示為一組半透明粒子的集合。用戶可以使用 Spark —— World Lab 基于 THREE.js 的開源跨平臺渲染器 ——在瀏覽器中直接渲染這些高斯點云。
另外 Marble 還可以導出為三角網格(triangle meshes),以便與眾多業界標準的三維工具兼容與互操作。
它現在支持生成兩種類型的網格:
碰撞網格(collider meshes):低保真度網格,用于粗略的物理模擬;
高質量網格(high-quality meshes):盡可能貼近高斯點云的視覺效果。
將世界導出為網格格式,能夠讓它與眾多業界標準的三維工具進行兼容與互操作。

用戶還可以 Marble 將生成的"世界"渲染為視頻,采用像素級精度的相機控制,能夠精準構圖每一個鏡頭。
Marble 還可以對導出的視頻進行增強。增強后的視頻能夠:
添加更多細節;
去除偽影與瑕疵;
為場景增添動態元素,同時仍保持像素級的相機控制精度,并嚴格遵循已生成三維世界的結構。

在 Marble 正式開放后,我第一時間進行了體驗。
地址:marble.worldlabs.ai
目前,Marble 分為免費版和會員賬號,區別在于生成數量、編輯功能豐富度、商用授權等。
該說不說,這個產品的操作非常容易上手——用戶只用點擊頂部對話框,就能選擇需要上傳的素材,目前可以上傳 2D 圖片或者 3D 模型,也可以通過文字生成。
![]()
我測試了四個案例,整體效果在交互性和邏輯性上都還不錯,但是細節精細程度有時還需提升。
先看免費賬號的效果。我讓 Marble 通過一張霍格沃茲圣誕節時的圖片,生成一個中世紀城堡內部樣子的世界。
![]()
*提示圖片
耗時約10分鐘后,我的第一個 Marble 世界出現了。這個"世界"的交互性和物理一致性都挺好,空間感也不錯,但或許由于圖片清晰度不夠,生成的效果有點粗糙——不是很清晰,細節也不夠精致。
接下來,看看我氪金后用Pro賬號多圖生成的效果。
讓模型生成火星表面的世界
![]()
*采用多圖提示
通過倫敦的街景圖,生成的世界
![]()
*采用多圖提示
整體感覺畫面比較細膩,效果比免費賬號更清晰。
BTW,官方這次還一起推出了 Marble Labs。
在Marble Labs里,官方希望藝術家、工程師與設計師們共同探索世界模型,展示創意和真實工作流程,以及游戲、視覺特效(VFX)、設計、機器人等領域中的可能性。
這里也是 Marble 的案例研究、教程與文檔的集合地,感興趣的朋友可以嘗試訪問 marble.worldlabs.ai。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.