![]()
文章轉(zhuǎn)載于字母AI
AI 時(shí)代,獨(dú)角獸已經(jīng)不稀奇了,但世界模型這塊還是有所空缺的。
從估值的變化上來(lái)看,李飛飛的World Labs,最有可能成為全球首個(gè)世界模型獨(dú)角獸公司。
根據(jù)報(bào)道,World Labs的估值已經(jīng)突破了50億美元,并且擬融資5億美元。
而2024年9月的時(shí)候,這家公司才以10億美元估值完成2.3億美元融資,正式在公眾面前亮相。
從結(jié)果上來(lái)看,從登場(chǎng)到50億美元估值,李飛飛僅用了16個(gè)月的時(shí)間。
這個(gè)速度有多快?
OpenAI從2015年成立,到 2019年微軟首次投資,此時(shí)他們的估值也只有10億美元。
最接近World Labs速度的可能是Anthropic, 但也花了25個(gè)月。
如果說(shuō)李飛飛是世界模型教母,那么楊立昆可以說(shuō)是世界模型教父。
2025年12月,楊立昆在LinkedIn上確認(rèn)離開(kāi)Meta,結(jié)束了他在這家公司長(zhǎng)達(dá)12年的職業(yè)生涯。
楊立昆創(chuàng)立的新公司名為Advanced Machine Intelligence Labs,總部設(shè)在巴黎。AMI Labs正在尋求以30至35億歐元估值融資5億歐元。
不過(guò),這兩家企業(yè)高估值背后,并非對(duì)世界模型這一技術(shù)的吹捧,而是實(shí)打?qū)嵉募夹g(shù)落地和商業(yè)化。
1
何為World Labs?
World Labs的投資方陣容包括Andreessen Horowitz、NEA、Radical Ventures(李飛飛本人是Radical Ventures的科學(xué)合伙人)、英偉達(dá)風(fēng)投部門(mén)、沙特Sanabil Investments和新加坡淡馬錫。
天使投資人包括谷歌DeepMind首席科學(xué)家杰夫·迪恩(Jeff Dean),以及圖靈獎(jiǎng)得主杰弗里·辛頓(Geoffrey Hinton)。
World Labs的核心技術(shù)理念叫做空間智能,這是一種“升維”的概念。
目前的頂尖AI雖然看起來(lái)很聰明,但它們本質(zhì)上是“二維”的。它們只是處理文字序列或者像素排列,它們并不理解體積、有重量、受重力影響的實(shí)體。
World Labs的空間智能技術(shù),就是要賦予AI“對(duì)三維世界的認(rèn)知能力”。
![]()
以生成視頻為例,空間智能是直接生成一個(gè)具有三維結(jié)構(gòu)、且符合物理規(guī)律的虛擬環(huán)境,然后再在這個(gè)環(huán)境里去模擬要生成的實(shí)體。實(shí)體不僅有長(zhǎng)寬高,還有材質(zhì)和物理反饋。
在傳統(tǒng)的AI訓(xùn)練中,模型學(xué)習(xí)的是像素之間的概率關(guān)聯(lián),比如藍(lán)天下面通常是綠地,綠地旁邊通常是小溪。
但World Labs的世界模型則是基于三維幾何與物理模擬的原理進(jìn)行訓(xùn)練的。
它在學(xué)習(xí)數(shù)據(jù)的過(guò)程中,得到的不僅僅是圖像的紋理,還有圖像背后的空間幾何信息(比如深度、遮擋關(guān)系、透視角度)以及物理動(dòng)力學(xué)規(guī)則(比如剛體如何碰撞、流體如何流動(dòng)、光線(xiàn)如何反射)。
2025年11月,World Labs推出首款商業(yè)產(chǎn)品Marble,這是一個(gè)能夠從文本、圖像、視頻或粗略3D布局生成持久化3D世界的模型。
Marble的技術(shù)底層采用神經(jīng)輻射場(chǎng)(NeRF)和高斯點(diǎn)云(3D Gaussian Splatting)技術(shù),而非傳統(tǒng)的多邊形網(wǎng)格。
神經(jīng)輻射場(chǎng)是一種利用神經(jīng)網(wǎng)絡(luò)表示三維場(chǎng)景的技術(shù),它將場(chǎng)景表示為連續(xù)的體積函數(shù),輸入三維空間坐標(biāo)和觀察方向,輸出該點(diǎn)的顏色和體積密度。這種方法通過(guò)多層感知機(jī)學(xué)習(xí)場(chǎng)景的幾何和光照信息,然后通過(guò)體積渲染生成逼真的新視角圖像。
相當(dāng)于在相同場(chǎng)景內(nèi),從每一個(gè)角度對(duì)實(shí)體進(jìn)行拍攝,這樣生成實(shí)體以后,用戶(hù)從哪個(gè)角度看都符合物理規(guī)律。
高斯點(diǎn)云則是另一種三維表示方法,它用數(shù)百萬(wàn)個(gè)帶有位置、大小、形狀、顏色和透明度屬性的高斯橢球體來(lái)表示場(chǎng)景,渲染速度比神經(jīng)輻射場(chǎng)快得多,同時(shí)保持了高質(zhì)量的視覺(jué)效果。
類(lèi)似于樂(lè)高,通過(guò)小積木塊最終搭建成完整的實(shí)體。
這使其能夠生成連續(xù)的輻射場(chǎng),包含空間理解、光照和深度信息的完整環(huán)境,而不是簡(jiǎn)單地組裝多邊形。
在2026年CES大會(huì)上,李飛飛在AMD CEO蘇姿豐的主題演講中展示了Marble的能力。
李飛飛說(shuō):“將少數(shù)圖片變成連貫、實(shí)時(shí)的世界,不再是對(duì)遙遠(yuǎn)未來(lái)的一瞥,而是下一章的開(kāi)始。AI 正在給人們的生活帶來(lái)一些改變,將少數(shù)圖片或照片轉(zhuǎn)化為一個(gè)實(shí)時(shí)可探索的世界。空間智能需要極致算力支持,才能實(shí)現(xiàn)可交互級(jí)幀率和無(wú)限持久的世界交互。”
World Labs采用免費(fèi)增值模式,免費(fèi)版提供4次生成,20 美元每月可獲得更多生成次數(shù),最高95美元每月提供75次生成和商業(yè)使用權(quán)。
目標(biāo)客戶(hù)包括游戲開(kāi)發(fā)者、影視特效制作、虛擬現(xiàn)實(shí)應(yīng)用。而且Marble還支持蘋(píng)果Vision Pro和Quest 3 VR頭顯,每個(gè)生成的世界都可以在VR中查看。
更重要的是,Marble可以導(dǎo)出與Unreal Engine和Unity兼容的格式,這意味著它可以無(wú)縫集成到現(xiàn)有的游戲開(kāi)發(fā)流程中。
李飛飛曾在訪(fǎng)談中表示,這項(xiàng)技術(shù)可能顛覆Unity和Epic Games的Unreal Engine等傳統(tǒng)游戲引擎。
除了AIGC產(chǎn)業(yè),World Labs還瞄準(zhǔn)機(jī)器人訓(xùn)練市場(chǎng),通過(guò)模擬環(huán)境訓(xùn)練機(jī)器人的自主導(dǎo)航軟件。世界模型可以為機(jī)器人提供一個(gè)安全的虛擬訓(xùn)練場(chǎng),讓它們?cè)跀?shù)字空間中學(xué)習(xí)物理交互、因果關(guān)系和長(zhǎng)期規(guī)劃,然后再應(yīng)用到真實(shí)世界。
1
AMI Labs的技術(shù)優(yōu)勢(shì)是什么?
但AMI Labs不像李飛飛的World Labs那樣擁有實(shí)際的產(chǎn)品,目前還只停留在技術(shù)概念階段。
潛在投資方包括Cathay Innovation、Greycroft、Hiro Capital(楊立昆是Hiro Capital的顧問(wèn))、20VC、法國(guó)公共投資銀行Bpifrance、Daphni和HV Capital。
要注意,楊立昆在AMI Labs里擔(dān)任的是執(zhí)行主席而非CEO。
![]()
該公司CEO職位由亞歷克斯·勒布朗(Alex LeBrun)擔(dān)任,他是醫(yī)療AI初創(chuàng)公司Nabla的聯(lián)合創(chuàng)始人兼前CEO。LeBrun的前一家公司W(wǎng)it.ai被Meta收購(gòu)后,他曾在FAIR直接向楊立昆匯報(bào)。
團(tuán)隊(duì)還包括Meta歐洲副總裁勞倫特·索利(Laurent Solly),他于2025年12月離職加入AMI。
不僅如此,AMI Labs有法國(guó)總統(tǒng)親自背書(shū)。法國(guó)總統(tǒng)馬克龍對(duì)楊立昆選擇巴黎表示自豪,承諾將盡一切努力確保他從法國(guó)取得成功。
AMI Labs的核心技術(shù)是楊立昆多年倡導(dǎo)的聯(lián)合嵌入預(yù)測(cè)架構(gòu)(JEPA,Joint Embedding Predictive Architecture)。
以往的AI,都是逐token生成輸出的,然而聯(lián)合嵌入預(yù)測(cè)架構(gòu)能一口氣直接以抽象表示的形式來(lái)創(chuàng)建世界,能夠更好地預(yù)測(cè)未來(lái)狀態(tài)。
聯(lián)合嵌入預(yù)測(cè)架構(gòu)的工作原理是,它不預(yù)測(cè)原始像素或token,而是預(yù)測(cè)高層次的嵌入表示。
系統(tǒng)有兩個(gè)編碼器,一個(gè)處理上下文信息,另一個(gè)處理目標(biāo)信息,還有一個(gè)預(yù)測(cè)器在嵌入空間中進(jìn)行預(yù)測(cè)。這種方法避免了生成模型的一個(gè)關(guān)鍵問(wèn)題,生成模型必須預(yù)測(cè)每一個(gè)像素或token,包括那些不可預(yù)測(cè)的隨機(jī)細(xì)節(jié),而聯(lián)合嵌入預(yù)測(cè)架構(gòu)只關(guān)注可預(yù)測(cè)的高層次特征,忽略無(wú)關(guān)緊要的細(xì)節(jié)。
楊立昆在哈佛演講中解釋?zhuān)@類(lèi)系統(tǒng)通過(guò)在嵌入空間中進(jìn)行優(yōu)化來(lái)實(shí)現(xiàn)規(guī)劃和推理。
AMI Labs公司將推進(jìn)AI研究并開(kāi)發(fā)可靠性、可控性和安全性真正重要的應(yīng)用,特別是工業(yè)過(guò)程控制、自動(dòng)化、可穿戴設(shè)備、機(jī)器人、醫(yī)療保健等領(lǐng)域。
AMI Labs的第一個(gè)應(yīng)用將是醫(yī)療保健。
具體來(lái)講,AMI Labs通過(guò)與Nabla合作,開(kāi)發(fā)臨床護(hù)理AI助手。截止發(fā)稿,這個(gè)AI助手已獲得了1.2億美元融資,預(yù)計(jì)兩年內(nèi)達(dá)到1億美元年度訂閱收入。
作為交易的一部分,Nabla獲得AMI世界模型的特權(quán)訪(fǎng)問(wèn)權(quán),而亞歷克斯從CEO轉(zhuǎn)為首席AI科學(xué)家兼董事長(zhǎng)。
亞歷克斯表示,他加入AMI的一個(gè)重要原因是將世界模型應(yīng)用于醫(yī)療保健的前景,因?yàn)?strong>醫(yī)療保健的復(fù)雜性和高風(fēng)險(xiǎn)性使其成為測(cè)試世界模型的理想場(chǎng)景。
FDA認(rèn)證要求確定性、可解釋的推理,這正是LLM無(wú)法提供而世界模型承諾實(shí)現(xiàn)的。大語(yǔ)言模型存在幻覺(jué)問(wèn)題,在醫(yī)療場(chǎng)景中可能導(dǎo)致嚴(yán)重后果,而世界模型通過(guò)建立對(duì)患者生理狀態(tài)的內(nèi)部模擬,可以預(yù)測(cè)疾病進(jìn)展,提供更可靠的決策支持。
2026年1月,楊立昆還加入了另一家初創(chuàng)公司Logical Intelligence,擔(dān)任技術(shù)研究委員會(huì)創(chuàng)始主席。這家公司推出了名為Kona 1.0的能量基礎(chǔ)推理模型,通過(guò)對(duì)約束條件評(píng)分來(lái)驗(yàn)證和優(yōu)化解決方案,尋找最低能量也就是最一致的結(jié)果。
這種非自回歸模型也和AMI Labs的聯(lián)合嵌入預(yù)測(cè)架構(gòu)相似,能夠一口氣生成完整的推理軌跡。
能量基礎(chǔ)模型是一類(lèi)通過(guò)能量函數(shù)來(lái)定義概率分布的模型。在這個(gè)框架中,每個(gè)可能的輸出都被賦予一個(gè)能量值,能量越低表示該輸出越符合約束條件。
模型通過(guò)優(yōu)化過(guò)程尋找能量最小的解決方案。這種方法的優(yōu)勢(shì)在于可以同時(shí)考慮多個(gè)約束條件,并且可以進(jìn)行全局優(yōu)化,而不是像自回歸模型那樣只能做局部決策。
楊立昆表示,AGI的最終狀態(tài)不會(huì)來(lái)自單一模型類(lèi)別,而需要能量基礎(chǔ)模型、LLM、世界模型等組成的相互依存的生態(tài)系統(tǒng)。
1
都是世界模型,兩家又有什么不同?
雖然李飛飛和楊立昆都在構(gòu)建世界模型,但技術(shù)路線(xiàn)存在根本差異。
由于技術(shù)還處于早期,World Labs的Marble本質(zhì)上還是傳統(tǒng)的生成式AI方法。它確實(shí)能生成3D世界,但這些世界本身還不具備物理知識(shí)。
World Labs聯(lián)合創(chuàng)始人在采訪(fǎng)中表示,Marble生成的羅馬拱門(mén)并不知道如果移除一塊磚,其他磚可能會(huì)掉落。它只是學(xué)會(huì)了羅馬拱門(mén)在視覺(jué)上應(yīng)該是什么樣子,而不是理解支撐它的物理原理。
這種方法在創(chuàng)意內(nèi)容生成方面表現(xiàn)出色,可以快速產(chǎn)出視覺(jué)上令人信服的場(chǎng)景,但缺乏對(duì)因果關(guān)系的深層理解。
相比之下,因?yàn)闂盍⒗サ穆?lián)合嵌入預(yù)測(cè)架構(gòu)能夠直接生成完整的結(jié)果,它就能夠表示出來(lái)這里面的因果關(guān)系。
但是在市場(chǎng)方面,World Labs已經(jīng)獲得了早期客戶(hù)。World Labs透露已有多家組織采用了Marble API。這種先發(fā)優(yōu)勢(shì)使其在融資談判中占據(jù)有利位置。
World Labs明確瞄準(zhǔn)創(chuàng)意產(chǎn)業(yè),這些市場(chǎng)已經(jīng)存在,客戶(hù)有明確的痛點(diǎn),3D 內(nèi)容制作成本高、周期長(zhǎng),Marble提供了立竿見(jiàn)影的價(jià)值。
游戲開(kāi)發(fā)者可以用Marble快速生成背景環(huán)境,然后在Unity或Unreal Engine中添加交互邏輯。影視制作團(tuán)隊(duì)可以用它進(jìn)行虛擬場(chǎng)景預(yù)覽,大幅縮短前期制作時(shí)間。
從商業(yè)角度看,World Labs的策略更加務(wù)實(shí)。它選擇了一個(gè)已經(jīng)存在的市場(chǎng),提供了一個(gè)可以立即使用的產(chǎn)品,并且建立了清晰的商業(yè)模式。
AMI Labs有點(diǎn)超前,它押注于一個(gè)尚未成熟的市場(chǎng),追求技術(shù)突破,給這片全新的市場(chǎng)帶來(lái)需求。這種方法風(fēng)險(xiǎn)更高,但如果成功,回報(bào)也會(huì)更大。
李飛飛的World Labs扎根硅谷,投資方以美國(guó)VC為主,雖然也包括沙特和新加坡主權(quán)基金。這使其能夠充分利用硅谷的人才、資本和客戶(hù)網(wǎng)絡(luò)。
反觀楊立昆,他選擇巴黎作為總部,這不僅是個(gè)人偏好,更是戰(zhàn)略選擇。
歐盟正在建立AI主權(quán),減少對(duì)美國(guó)科技巨頭的依賴(lài)。AMI Labs獲得法國(guó)政府的高調(diào)支持,可能在歐洲監(jiān)管環(huán)境中獲得優(yōu)勢(shì),特別是在醫(yī)療保健等高度監(jiān)管的領(lǐng)域。
兩家公司的人才策略也有所不同。
World Labs主要招募的是大量計(jì)算機(jī)視覺(jué)和圖形學(xué)背景的研究者,這些人擅長(zhǎng)處理視覺(jué)數(shù)據(jù)和渲染問(wèn)題。AMI Labs方面則更傾向于招募有機(jī)器學(xué)習(xí)理論和物理建模背景的研究者,這些人更關(guān)注模型的數(shù)學(xué)基礎(chǔ)和泛化能力。
李飛飛相信通過(guò)大規(guī)模數(shù)據(jù)和計(jì)算,可以讓模型學(xué)會(huì)對(duì)空間的隱式理解,即使它不明確建模物理規(guī)律。這種方法在計(jì)算機(jī)視覺(jué)領(lǐng)域已經(jīng)被證明有效,ImageNet項(xiàng)目就是最好的例證。
楊立昆則堅(jiān)持認(rèn)為,真正的智能需要顯式的世界模型,需要理解因果關(guān)系而不僅僅是相關(guān)性。他多年來(lái)一直批評(píng)純粹的生成式方法,認(rèn)為它們無(wú)法達(dá)到人類(lèi)水平的推理能力。
所以看下來(lái),雖然兩個(gè)人的技術(shù)完全不同,然而實(shí)際上,這兩條路之間好像也沒(méi)有那么水火不相容。
![]()
事實(shí)上,它們可能最終會(huì)融合。World Labs的生成能力可以為楊立昆的因果模型提供豐富的訓(xùn)練數(shù)據(jù),而聯(lián)合嵌入預(yù)測(cè)架構(gòu)的推理能力可以增強(qiáng)Marble的物理一致性。
AI的未來(lái)可能不是選擇其中一條路,而是找到兩者的最佳結(jié)合點(diǎn)。
無(wú)論哪條路徑最終勝出,世界模型都代表了AI從理解語(yǔ)言到理解物理世界的重要轉(zhuǎn)變。
它意味著我們不再滿(mǎn)足于讓AI模仿人類(lèi)的語(yǔ)言能力,而是要讓它理解什么才叫客觀規(guī)律。
點(diǎn)個(gè)“愛(ài)心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.