![]()
AI 時代,獨角獸已經不稀奇了,但世界模型這塊還是有所空缺的。
從估值的變化上來看,李飛飛的World Labs,最有可能成為全球首個世界模型獨角獸公司。
根據報道,World Labs的估值已經突破了50億美元,并且擬融資5億美元。
而2024年9月的時候,這家公司才以10億美元估值完成2.3億美元融資,正式在公眾面前亮相。
從結果上來看,從登場到50億美元估值,李飛飛僅用了16個月的時間。
這個速度有多快?
OpenAI從2015年成立,到 2019年微軟首次投資,此時他們的估值也只有10億美元。
最接近World Labs速度的可能是Anthropic,但也花了25個月。
如果說李飛飛是世界模型教母,那么楊立昆可以說是世界模型教父。
2025年12月,楊立昆在LinkedIn上確認離開Meta,結束了他在這家公司長達12年的職業(yè)生涯。
楊立昆創(chuàng)立的新公司名為Advanced Machine Intelligence Labs,總部設在巴黎。AMI Labs正在尋求以30至35億歐元估值融資5億歐元。
不過,這兩家企業(yè)高估值背后,并非對世界模型這一技術的吹捧,而是實打實的技術落地和商業(yè)化。
01
何為World Labs?
World Labs的投資方陣容包括Andreessen Horowitz、NEA、Radical Ventures(李飛飛本人是Radical Ventures的科學合伙人)、英偉達風投部門、沙特Sanabil Investments和新加坡淡馬錫。
天使投資人包括谷歌DeepMind首席科學家杰夫·迪恩(Jeff Dean),以及圖靈獎得主杰弗里·辛頓(Geoffrey Hinton)。
World Labs的核心技術理念叫做空間智能,這是一種“升維”的概念。
目前的頂尖AI雖然看起來很聰明,但它們本質上是“二維”的。它們只是處理文字序列或者像素排列,它們并不理解體積、有重量、受重力影響的實體。
World Labs的空間智能技術,就是要賦予AI“對三維世界的認知能力”。
![]()
以生成視頻為例,空間智能是直接生成一個具有三維結構、且符合物理規(guī)律的虛擬環(huán)境,然后再在這個環(huán)境里去模擬要生成的實體。實體不僅有長寬高,還有材質和物理反饋。
在傳統的AI訓練中,模型學習的是像素之間的概率關聯,比如藍天下面通常是綠地,綠地旁邊通常是小溪。
但World Labs的世界模型則是基于三維幾何與物理模擬的原理進行訓練的。
它在學習數據的過程中,得到的不僅僅是圖像的紋理,還有圖像背后的空間幾何信息(比如深度、遮擋關系、透視角度)以及物理動力學規(guī)則(比如剛體如何碰撞、流體如何流動、光線如何反射)。
2025年11月,World Labs推出首款商業(yè)產品Marble,這是一個能夠從文本、圖像、視頻或粗略3D布局生成持久化3D世界的模型。
Marble的技術底層采用神經輻射場(NeRF)和高斯點云(3D Gaussian Splatting)技術,而非傳統的多邊形網格。
神經輻射場是一種利用神經網絡表示三維場景的技術,它將場景表示為連續(xù)的體積函數,輸入三維空間坐標和觀察方向,輸出該點的顏色和體積密度。這種方法通過多層感知機學習場景的幾何和光照信息,然后通過體積渲染生成逼真的新視角圖像。
相當于在相同場景內,從每一個角度對實體進行拍攝,這樣生成實體以后,用戶從哪個角度看都符合物理規(guī)律。
高斯點云則是另一種三維表示方法,它用數百萬個帶有位置、大小、形狀、顏色和透明度屬性的高斯橢球體來表示場景,渲染速度比神經輻射場快得多,同時保持了高質量的視覺效果。
類似于樂高,通過小積木塊最終搭建成完整的實體。
這使其能夠生成連續(xù)的輻射場,包含空間理解、光照和深度信息的完整環(huán)境,而不是簡單地組裝多邊形。
在2026年CES大會上,李飛飛在AMD CEO蘇姿豐的主題演講中展示了Marble的能力。
李飛飛說:“將少數圖片變成連貫、實時的世界,不再是對遙遠未來的一瞥,而是下一章的開始。AI 正在給人們的生活帶來一些改變,將少數圖片或照片轉化為一個實時可探索的世界。空間智能需要極致算力支持,才能實現可交互級幀率和無限持久的世界交互。”
World Labs采用免費增值模式,免費版提供4次生成,20 美元每月可獲得更多生成次數,最高95美元每月提供75次生成和商業(yè)使用權。
目標客戶包括游戲開發(fā)者、影視特效制作、虛擬現實應用。而且Marble還支持蘋果Vision Pro和Quest 3 VR頭顯,每個生成的世界都可以在VR中查看。
更重要的是,Marble可以導出與Unreal Engine和Unity兼容的格式,這意味著它可以無縫集成到現有的游戲開發(fā)流程中。
李飛飛曾在訪談中表示,這項技術可能顛覆Unity和Epic Games的Unreal Engine等傳統游戲引擎。
除了AIGC產業(yè),World Labs還瞄準機器人訓練市場,通過模擬環(huán)境訓練機器人的自主導航軟件。世界模型可以為機器人提供一個安全的虛擬訓練場,讓它們在數字空間中學習物理交互、因果關系和長期規(guī)劃,然后再應用到真實世界。
02
AMI Labs的技術優(yōu)勢是什么?
但AMI Labs不像李飛飛的World Labs那樣擁有實際的產品,目前還只停留在技術概念階段。
潛在投資方包括Cathay Innovation、Greycroft、Hiro Capital(楊立昆是Hiro Capital的顧問)、20VC、法國公共投資銀行Bpifrance、Daphni和HV Capital。
要注意,楊立昆在AMI Labs里擔任的是執(zhí)行主席而非CEO。
![]()
該公司CEO職位由亞歷克斯·勒布朗(Alex LeBrun)擔任,他是醫(yī)療AI初創(chuàng)公司Nabla的聯合創(chuàng)始人兼前CEO。LeBrun的前一家公司Wit.ai被Meta收購后,他曾在FAIR直接向楊立昆匯報。
團隊還包括Meta歐洲副總裁勞倫特·索利(Laurent Solly),他于2025年12月離職加入AMI。
不僅如此,AMI Labs有法國總統親自背書。法國總統馬克龍對楊立昆選擇巴黎表示自豪,承諾將盡一切努力確保他從法國取得成功。
AMI Labs的核心技術是楊立昆多年倡導的聯合嵌入預測架構(JEPA,Joint Embedding Predictive Architecture)。
以往的AI,都是逐token生成輸出的,然而聯合嵌入預測架構能一口氣直接以抽象表示的形式來創(chuàng)建世界,能夠更好地預測未來狀態(tài)。
聯合嵌入預測架構的工作原理是,它不預測原始像素或token,而是預測高層次的嵌入表示。
系統有兩個編碼器,一個處理上下文信息,另一個處理目標信息,還有一個預測器在嵌入空間中進行預測。這種方法避免了生成模型的一個關鍵問題,生成模型必須預測每一個像素或token,包括那些不可預測的隨機細節(jié),而聯合嵌入預測架構只關注可預測的高層次特征,忽略無關緊要的細節(jié)。
楊立昆在哈佛演講中解釋,這類系統通過在嵌入空間中進行優(yōu)化來實現規(guī)劃和推理。
AMI Labs公司將推進AI研究并開發(fā)可靠性、可控性和安全性真正重要的應用,特別是工業(yè)過程控制、自動化、可穿戴設備、機器人、醫(yī)療保健等領域。
AMI Labs的第一個應用將是醫(yī)療保健。
具體來講,AMI Labs通過與Nabla合作,開發(fā)臨床護理AI助手。截止發(fā)稿,這個AI助手已獲得了1.2億美元融資,預計兩年內達到1億美元年度訂閱收入。
作為交易的一部分,Nabla獲得AMI世界模型的特權訪問權,而亞歷克斯從CEO轉為首席AI科學家兼董事長。
亞歷克斯表示,他加入AMI的一個重要原因是將世界模型應用于醫(yī)療保健的前景,因為醫(yī)療保健的復雜性和高風險性使其成為測試世界模型的理想場景。
FDA認證要求確定性、可解釋的推理,這正是LLM無法提供而世界模型承諾實現的。大語言模型存在幻覺問題,在醫(yī)療場景中可能導致嚴重后果,而世界模型通過建立對患者生理狀態(tài)的內部模擬,可以預測疾病進展,提供更可靠的決策支持。
2026年1月,楊立昆還加入了另一家初創(chuàng)公司Logical Intelligence,擔任技術研究委員會創(chuàng)始主席。這家公司推出了名為Kona 1.0的能量基礎推理模型,通過對約束條件評分來驗證和優(yōu)化解決方案,尋找最低能量也就是最一致的結果。
這種非自回歸模型也和AMI Labs的聯合嵌入預測架構相似,能夠一口氣生成完整的推理軌跡。
能量基礎模型是一類通過能量函數來定義概率分布的模型。在這個框架中,每個可能的輸出都被賦予一個能量值,能量越低表示該輸出越符合約束條件。
模型通過優(yōu)化過程尋找能量最小的解決方案。這種方法的優(yōu)勢在于可以同時考慮多個約束條件,并且可以進行全局優(yōu)化,而不是像自回歸模型那樣只能做局部決策。
楊立昆表示,AGI的最終狀態(tài)不會來自單一模型類別,而需要能量基礎模型、LLM、世界模型等組成的相互依存的生態(tài)系統。
03
都是世界模型,兩家又有什么不同?
雖然李飛飛和楊立昆都在構建世界模型,但技術路線存在根本差異。
由于技術還處于早期,World Labs的Marble本質上還是傳統的生成式AI方法。它確實能生成3D世界,但這些世界本身還不具備物理知識。
World Labs聯合創(chuàng)始人在采訪中表示,Marble生成的羅馬拱門并不知道如果移除一塊磚,其他磚可能會掉落。它只是學會了羅馬拱門在視覺上應該是什么樣子,而不是理解支撐它的物理原理。
這種方法在創(chuàng)意內容生成方面表現出色,可以快速產出視覺上令人信服的場景,但缺乏對因果關系的深層理解。
相比之下,因為楊立昆的聯合嵌入預測架構能夠直接生成完整的結果,它就能夠表示出來這里面的因果關系。
但是在市場方面,World Labs已經獲得了早期客戶。World Labs透露已有多家組織采用了Marble API。這種先發(fā)優(yōu)勢使其在融資談判中占據有利位置。
World Labs明確瞄準創(chuàng)意產業(yè),這些市場已經存在,客戶有明確的痛點,3D 內容制作成本高、周期長,Marble提供了立竿見影的價值。
游戲開發(fā)者可以用Marble快速生成背景環(huán)境,然后在Unity或Unreal Engine中添加交互邏輯。影視制作團隊可以用它進行虛擬場景預覽,大幅縮短前期制作時間。
從商業(yè)角度看,World Labs的策略更加務實。它選擇了一個已經存在的市場,提供了一個可以立即使用的產品,并且建立了清晰的商業(yè)模式。
AMI Labs有點超前,它押注于一個尚未成熟的市場,追求技術突破,給這片全新的市場帶來需求。這種方法風險更高,但如果成功,回報也會更大。
李飛飛的World Labs扎根硅谷,投資方以美國VC為主,雖然也包括沙特和新加坡主權基金。這使其能夠充分利用硅谷的人才、資本和客戶網絡。
反觀楊立昆,他選擇巴黎作為總部,這不僅是個人偏好,更是戰(zhàn)略選擇。
歐盟正在建立AI主權,減少對美國科技巨頭的依賴。AMI Labs獲得法國政府的高調支持,可能在歐洲監(jiān)管環(huán)境中獲得優(yōu)勢,特別是在醫(yī)療保健等高度監(jiān)管的領域。
兩家公司的人才策略也有所不同。
World Labs主要招募的是大量計算機視覺和圖形學背景的研究者,這些人擅長處理視覺數據和渲染問題。AMI Labs方面則更傾向于招募有機器學習理論和物理建模背景的研究者,這些人更關注模型的數學基礎和泛化能力。
李飛飛相信通過大規(guī)模數據和計算,可以讓模型學會對空間的隱式理解,即使它不明確建模物理規(guī)律。這種方法在計算機視覺領域已經被證明有效,ImageNet項目就是最好的例證。
楊立昆則堅持認為,真正的智能需要顯式的世界模型,需要理解因果關系而不僅僅是相關性。他多年來一直批評純粹的生成式方法,認為它們無法達到人類水平的推理能力。
所以看下來,雖然兩個人的技術完全不同,然而實際上,這兩條路之間好像也沒有那么水火不相容。
![]()
事實上,它們可能最終會融合。World Labs的生成能力可以為楊立昆的因果模型提供豐富的訓練數據,而聯合嵌入預測架構的推理能力可以增強Marble的物理一致性。
AI的未來可能不是選擇其中一條路,而是找到兩者的最佳結合點。
無論哪條路徑最終勝出,世界模型都代表了AI從理解語言到理解物理世界的重要轉變。
它意味著我們不再滿足于讓AI模仿人類的語言能力,而是要讓它理解什么才叫客觀規(guī)律。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.