“AI 教母”李飛飛開年再融資 10 億美元。2 月 18 日,李飛飛參與創(chuàng)辦的 World Labs 宣布完成這筆融資。這家初創(chuàng)公司在一年多前剛走出隱身模式時融資 2.3 億美元,短短時間內(nèi)資本再度加碼,投資者名單包含芯片巨頭英偉達、AMD、A16Z、軟件公司歐克特等。
![]()
圖 | 李飛飛(來源:斯坦福)
在 AI 賽道,能夠進入 10 億美元融資俱樂部的并不多。而 World Labs 到底憑什么?答案藏在李飛飛反復(fù)強調(diào)的空間智能一詞里。
![]()
圖 | 李飛飛和團隊(來源:World Labs)
2012 年讓計算機學會看圖說話的 ImageNet 大賽,是李飛飛的出圈之作。當年,她使用 1,500 萬張標注圖片教會了機器看見物理,現(xiàn)在她想讓機器看懂物理在三維空間里的位置、關(guān)系和可能性,也就是所謂的世界模型。
幾個月前,李飛飛已經(jīng)攜手 World Labs 推出了 Marble 這一商業(yè)產(chǎn)品。之所以起名為 Marble,因為代表它是一種供創(chuàng)作者使用的原始材料。
![]()
(來源:World Labs)
使用時你只需給它一段照片、一段視頻、一段文字描述甚至是一個粗糙的 3D 草圖,它就能生成一個完整的、可編輯的、可導(dǎo)出的三維虛擬世界。
不同于傳統(tǒng)的二維視頻生成,Marble 模型可以理解三維空間,支持精準的攝像機控制比如精確移動 20 英尺,并允許用戶查看物體的背面歐哲下方。Marble 還搭載了高斯?jié)姙R技術(shù),讓模型在保持高視覺保真度的同時,還能擁有幾何信息。
假如你使用一張客廳照片作為輸入,Marble 能夠生成一個可以從各個角度觀察的三維場景。沙發(fā)的位置、窗戶的光線、地板的紋理還原得相當真實。雖然場景邊緣有些模糊和變形,但是整體效果已經(jīng)讓人十分驚訝。
和其他世界模型相比,Marble 走了一條不同的路。其他模型生成的世界是實時渲染的,在里面探索的時候場景會跟著變,也就是缺乏一致性。Marble 生成的則是持久的三維環(huán)境,你還可以把它導(dǎo)出為標準文件格式,放進游戲引擎里繼續(xù)編輯,或者使用 VR 頭顯直接走進去看。
這意味著它不是一個只能看不能用的玩具,它是一個可以嵌入現(xiàn)有工作流程的工具。Marble 的其中一個功能叫做 Chisel,這是一個三維編輯器,允許用戶像雕刻一樣引導(dǎo)幾何形狀的形成。使用的時候,你可以先在編輯器里搭出幾個方塊,以此來代表墻壁、地板、家具的位置,然后輸入一段文字描述比如“奶酪做的房間,椅子是葡萄形狀”,模型就會自動填充視覺細節(jié)。這種把結(jié)構(gòu)和風格分離的做法,其實有點像網(wǎng)頁開發(fā)里 HTML 負責結(jié)構(gòu)、CSS 負責樣式的思路。
另一個功能是場景擴展。假如生成的世界不夠大,還可以讓它向外生長。當你走到場景邊緣快要穿幫的地方,點擊一下模型就會生成更多環(huán)境補上去。如果你想要極其龐大的空間,還可以使用作曲家模式把多個獨立生成的世界拼接在一起。
李飛飛之所以給這套技術(shù)命名為空間智能,是因為在她看來大模型教會了機器讀和寫,而空間智能則要教會機器觀察和建造。如果機器能夠理解物體在三維空間中如何存在、如何互動,最終不僅可以改變游戲和電影,還能滲透到科學和醫(yī)學的深處。
![]()
圖 | Marble 的工作原理(來源:World Labs)
圖靈獎得主楊立昆也創(chuàng)辦了一家世界模型公司,他和李飛飛都在推動世界模型成為超越大模型的下一代 AI 架構(gòu)。但是兩者的技術(shù)特點和側(cè)重點截然不同。
李飛飛強調(diào)生成式和空間智能的世界模型,核心是可感知、可生成、可交互的三維世界。她的 Marble 模型可以從文本、圖像和視頻輸入里生成高保真、幾何物理一致、持久可導(dǎo)航的三維環(huán)境,支持自由漫游、編輯和創(chuàng)作。目標是賦予 AI 以空間大腦,服務(wù)于虛擬現(xiàn)實、游戲、影視和機器人等場景。
楊立昆主張非生成式、預(yù)測式的世界模型,倡導(dǎo)在抽象潛在空間里預(yù)測世界變化,而非重構(gòu)圖像。其重點在于高效學習物理常識、因果關(guān)系和長期預(yù)測,更適合機器人控制、大腦式推理和規(guī)劃,相當于把訓(xùn)練機器人的后端預(yù)測大腦,側(cè)重點不是視覺輸出,重在進行本質(zhì)理解。
簡單來說,李飛飛要做的是看得見摸得著的三維世界工廠,楊立昆做的是看不見但是可以精準預(yù)判的內(nèi)部世界模擬器。前者更重視視覺化和創(chuàng)作導(dǎo)向,后者側(cè)重于認知科學和機器人導(dǎo)向。
幾周前,李飛飛在接受美國科技博主與數(shù)字藝術(shù)家 Don Allen III 的采訪時分享了她對于世界的見解,或許能夠幫助我們理解為何她將自己公司命名為 World Labs。她說,在物理層面,世界是一個包含幾何空間、物體和物理規(guī)則的系統(tǒng);在哲學層面,即便是一個念頭只要有其內(nèi)在的邏輯和流動,都可以被稱為一個世界。
李飛飛認為,無論工具多么強大,人類尊嚴必須處于對話的核心。她希望 AI 是為了賦能創(chuàng)作者、醫(yī)生和老師們,而不是剝奪他們的尊嚴或者取代他們。
參考資料:
https://www.reuters.com/business/ai-pioneer-fei-fei-lis-world-labs-raises-1-billion-funding-2026-02-18/
https://www.youtube.com/watch?v=61VpIEpdZGg
https://www.worldlabs.ai/
https://www.bloomberg.com/news/articles/2026-02-18/ai-pioneer-fei-fei-li-s-startup-world-labs-raises-1-billion
排版:胡巍巍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.