![]()
對(duì)李飛飛來(lái)說(shuō),至關(guān)重要的空間智能“北極星”源自何處,又是如何演變的?
文|《中國(guó)企業(yè)家》記者 王怡潔
見(jiàn)習(xí)記者 孫欣
編輯|何伊凡見(jiàn)習(xí)編輯|李原
頭圖來(lái)源|視覺(jué)中國(guó)
作為“AI教母”,李飛飛每次對(duì)AI的判斷都會(huì)成為全球科技的重要風(fēng)向標(biāo),2025年年底,李飛飛發(fā)出萬(wàn)字長(zhǎng)文,引發(fā)的討論又一次引爆了硅谷。
她篤定AI的下一個(gè)十年是“空間智能”——若AI無(wú)法理解物體的深度、距離、遮擋與重力,就永遠(yuǎn)無(wú)法真正“具身”。她表示,語(yǔ)言是用來(lái)描述世界的工具,但不是世界本身。
1月6日,李飛飛應(yīng)邀站在CES 2026的演講臺(tái)上,她也再度強(qiáng)調(diào)了“大語(yǔ)言模型終究受制于語(yǔ)言本身”的局限性。
“一只蒼蠅沒(méi)有萬(wàn)億級(jí)參數(shù),卻能在雜亂空間中極速避障、精準(zhǔn)著陸。”關(guān)于空間智能,網(wǎng)絡(luò)上流傳著這樣一句熱梗。在李飛飛發(fā)布的萬(wàn)字長(zhǎng)文末尾,便提到:“若沒(méi)有空間智能,我們關(guān)于真正智能機(jī)器的夢(mèng)想將永遠(yuǎn)不完整。這場(chǎng)探索,是我的北極星。”
這顆恒星對(duì)李飛飛來(lái)說(shuō),意義非凡。它是李飛飛十幾歲時(shí),在一次野外徒步中對(duì)自然世界的感悟。她在加州理工學(xué)院讀博期間,受認(rèn)知神經(jīng)科學(xué)啟發(fā),開(kāi)始研發(fā)“如何教計(jì)算機(jī)識(shí)別物體”。后來(lái)她一手締造ImageNet數(shù)據(jù)集,推動(dòng)計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)崿F(xiàn)跨越式發(fā)展,也是她從寒武紀(jì)大爆發(fā)與生物視覺(jué)起源中攫取到的靈感。
2025年末,李飛飛創(chuàng)立的World Labs發(fā)布首款商用“世界模型”Marble。該實(shí)驗(yàn)室于2024年年初成立,9月正式亮相,融資超過(guò)2.3億美元,估值超過(guò)10億美元。
![]()
來(lái)源:視覺(jué)中國(guó)
如今,50歲的李飛飛已在人工智能領(lǐng)域內(nèi)研究了二十余年,探索空間智能成了她最新的“北極星”。但回顧她的成長(zhǎng)史,從計(jì)算機(jī)圖像、ImageNet數(shù)據(jù)集到具身智能,可以梳理出李飛飛為何對(duì)空間智能如此篤定的脈絡(luò)。
2024年4月,李飛飛首部自傳《我看見(jiàn)的世界》在中國(guó)出版發(fā)行。這本書(shū)是她親自參與創(chuàng)作、迄今為止最完整的個(gè)人思想與歷程記錄。該書(shū)詳盡敘述了李飛飛青少年時(shí)期在美國(guó)做洗碗工的困頓艱辛,也描繪了她第一次走進(jìn)科學(xué)殿堂的欣喜若狂。
更重要的是,李飛飛的職業(yè)生涯貫穿了AI從實(shí)驗(yàn)室走向產(chǎn)業(yè)爆發(fā)的全過(guò)程,因此這本書(shū)可以算得上是一部人工智能發(fā)展史。我們拆解了《我看見(jiàn)的世界》一書(shū),全書(shū)共12個(gè)章節(jié),讀完這篇文章,站在李飛飛的視角,你將看到:
1.這位殿堂級(jí)女科學(xué)家的成長(zhǎng)環(huán)境是怎么樣的?支撐她在困頓中破局的是什么?
2.李飛飛在計(jì)算機(jī)視覺(jué)科學(xué)內(nèi)如何發(fā)現(xiàn)行業(yè)的盲點(diǎn),又是如何解決的?
3.ImageNet是如何建立起來(lái)的?又是如何撬動(dòng)人工智能的?
4.從學(xué)界到產(chǎn)業(yè),李飛飛經(jīng)歷了什么,又是如何解決“水土不服”的?
5.對(duì)李飛飛來(lái)說(shuō),至關(guān)重要的空間智能“北極星”源自何處,又是如何演變的?
6.李飛飛為何將AI的下一個(gè)時(shí)代定義為“空間智能”,這個(gè)判斷最早源于什么時(shí)候?
困頓的家境,建立最純粹的信仰
李飛飛出生于北京,成長(zhǎng)于成都,她自小熱愛(ài)物理學(xué)科,課余時(shí)間幾乎都在探索和學(xué)習(xí)相關(guān)知識(shí),但這份熱愛(ài)在16歲時(shí)被迫短暫中斷。
1992年,李飛飛隨著父母來(lái)到美國(guó)謀生。飛機(jī)落地時(shí),母親口袋里的20美元是全部的家產(chǎn)。那時(shí),F(xiàn)acebook的人工智能首席科學(xué)家楊立昆在新澤西州霍姆德?tīng)柕难芯可膭倓偲鸩剑吧窠?jīng)網(wǎng)絡(luò)”算法的應(yīng)用研究正裹于襁褓之中。但這些都與李飛飛無(wú)關(guān),她和父母每天要解決的問(wèn)題是與人交流和獲取食物。
一家三口擠在一個(gè)狹小的一居室,李飛飛的臥室是廚房過(guò)道。父親找了份修相機(jī)的工作,母親是超市收銀員,李飛飛每日放學(xué)后需去一家中餐館打工。2美元的時(shí)薪,洗碗、拖地、擦玻璃、傳菜等,都是她的工作內(nèi)容。那時(shí),李飛飛一天中說(shuō)得最多的話是Sorry,白天為聽(tīng)不懂老師、同學(xué)們的英文而道歉,晚間因聽(tīng)不懂客人點(diǎn)餐而低頭。
距離申請(qǐng)大學(xué)僅剩兩年的時(shí)間,李飛飛不得不擠壓睡覺(jué)時(shí)間來(lái)學(xué)習(xí)。在她的回憶里,那段日子她幾乎每天只睡4個(gè)小時(shí)。最后,李飛飛以SAT1250、數(shù)學(xué)滿分的成績(jī)被普林斯頓大學(xué)物理學(xué)專業(yè)錄取,并獲得了全額獎(jiǎng)學(xué)金。
《American dream come true!(“美國(guó)夢(mèng)”成真了)》是錄取結(jié)果出來(lái)時(shí),李飛飛所在區(qū)的一家當(dāng)?shù)貓?bào)紙的封面頭條,一張短發(fā)的照片被排版在報(bào)道最顯眼的位置。
普林斯頓的大學(xué)生活,李飛飛活得十分“割裂”:這里是她一直以來(lái)所追逐的“智力天堂”,她每天能汲取關(guān)于物理世界的真理,但也不得不時(shí)刻面臨現(xiàn)實(shí)生活里岌岌可危的家庭財(cái)務(wù)狀況,母親罹患嚴(yán)重心臟病更是她多年來(lái)心頭的沉重大石。
這種來(lái)自財(cái)務(wù)狀況的困頓,一直延續(xù)到很多年之后。甚至當(dāng)李飛飛成為斯坦福知名教授之后,她還不得不想辦法解決母親的高昂手術(shù)費(fèi)用。
那時(shí),很多人勸說(shuō)李飛飛“清醒點(diǎn)”,甚至她自己都曾動(dòng)搖,自己是否應(yīng)該把學(xué)業(yè)作為獲得經(jīng)濟(jì)來(lái)源的敲門(mén)磚。比如學(xué)有所成后,是否該選擇醫(yī)學(xué)、金融或工程等報(bào)酬豐厚的領(lǐng)域,以此來(lái)擺脫困難的生活。
但李飛飛的心里始終有個(gè)聲音在唱反調(diào),她不甘心失去這唯一一個(gè)能進(jìn)入科學(xué)領(lǐng)域的機(jī)會(huì)。父母的開(kāi)明給了她一個(gè)“強(qiáng)心丸”,父母都支持她進(jìn)入熱愛(ài)的物理學(xué)科。普林斯頓畢業(yè)后,她并未選擇來(lái)自華爾街的眾多橄欖枝,而是進(jìn)入了另一個(gè)“智力天堂”——加州理工學(xué)院。
李飛飛的博士研究方向是視覺(jué)研究領(lǐng)域,簡(jiǎn)單來(lái)說(shuō)就是讓機(jī)器學(xué)會(huì)“看”東西。那時(shí)該領(lǐng)域的大多數(shù)學(xué)生會(huì)在神經(jīng)科學(xué)、計(jì)算科學(xué)選擇其一,而李飛飛則是同時(shí)研究?jī)蓚€(gè)領(lǐng)域,這是當(dāng)時(shí)碩士項(xiàng)目的首個(gè)案例。
ImageNet:打開(kāi)人工智能黃金時(shí)代
“我們決定做一件史無(wú)前例的事情,我們研究的(計(jì)算機(jī)視覺(jué)識(shí)別)對(duì)象是全世界的物體。”這句話在當(dāng)時(shí)看來(lái),還是天方夜譚。
2005年,李飛飛在伊利諾伊大學(xué)厄巴納香檳分校電氣與計(jì)算機(jī)工程系擔(dān)任助理教授,后又來(lái)到普林斯頓大學(xué)計(jì)算機(jī)科學(xué)系任職助理教授。《我看見(jiàn)的世界》一書(shū)中,李飛飛曾先后稱自己經(jīng)歷了“至暗”和“黑暗”,前者是剛到達(dá)美國(guó)的窘迫生活,后者便是2005~2009年期間,她將其稱為“人工智能寒冬”。
彼時(shí),人工智能遇冷,研究“計(jì)算機(jī)視覺(jué)識(shí)別”幾乎沒(méi)人看好。李飛飛每天在不停回答周遭人的勸誡:“飛飛,換個(gè)方向吧,這條路走不通的。”
當(dāng)下,數(shù)據(jù)已經(jīng)是各大模型公司瘋搶的關(guān)鍵信息。但在千禧年前后,學(xué)術(shù)界與AI領(lǐng)域都在狂熱地打磨算法,卻唯獨(dú)忽視了“數(shù)據(jù)”的價(jià)值。在李飛飛看來(lái),大家對(duì)AI領(lǐng)域趨之若鶩,卻從未有人真正研究“數(shù)據(jù)”。
21世紀(jì)初,李飛飛堅(jiān)定認(rèn)為,讓AI產(chǎn)生質(zhì)的飛躍關(guān)鍵就在于,能否建立起一個(gè)囊括“全世界所有物體”的龐大數(shù)據(jù)庫(kù)。這與如今的境況何其相似,現(xiàn)在她篤定,讓生成式AI產(chǎn)生質(zhì)的飛躍關(guān)鍵在于:大語(yǔ)言模型能否突破模態(tài)的限制,真正識(shí)別物理世界。
當(dāng)時(shí)主流的計(jì)算機(jī)視覺(jué)研究,大多依賴于精心設(shè)計(jì)的手工特征和有限的小規(guī)模數(shù)據(jù)集,機(jī)器能識(shí)別的物體種類不過(guò)寥寥數(shù)十種。李飛飛卻想構(gòu)建一個(gè)百萬(wàn)級(jí)、標(biāo)注完備、覆蓋整個(gè)世界物體的圖像宇宙——這便是ImageNet的雛形。
![]()
來(lái)源:AI生成
在李飛飛的暢想中,ImageNet就是一個(gè)圖像識(shí)別數(shù)據(jù)庫(kù),只要將它運(yùn)用在計(jì)算機(jī)上,可以直接辨認(rèn)出物品和人。但現(xiàn)實(shí)給她澆了一盆冷水,李飛飛找本科生來(lái)手動(dòng)輸入識(shí)別圖片數(shù)據(jù),甚至?xí)r薪開(kāi)到了10美元。但按這個(gè)速度算下去,ImageNet建成需要90年。而后李飛飛又嘗試以算法來(lái)進(jìn)行數(shù)據(jù)處理,但更多問(wèn)題開(kāi)始顯現(xiàn):資金鏈斷裂、模型陷入瓶頸等。
亞馬遜的眾包服務(wù),最終成為項(xiàng)目能完成的關(guān)鍵支撐。這項(xiàng)服務(wù)通過(guò)在平臺(tái)發(fā)布標(biāo)注任務(wù),以低成本召集全球網(wǎng)民參與協(xié)作——正是這一模式破解了海量圖像標(biāo)注的效率難題。“我看到網(wǎng)站的那一刻,我知道ImageNet成了。”
2009年,歷時(shí)兩年半,涵蓋5247個(gè)類別、12個(gè)子樹(shù)的320萬(wàn)張標(biāo)記圖片的論文亮相CVPR(國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議),當(dāng)時(shí)團(tuán)隊(duì)在展會(huì)的一個(gè)小角落。隨后,李飛飛與當(dāng)時(shí)最權(quán)威的圖像識(shí)別大賽PASCAL VOC合作,這次合作既是轉(zhuǎn)折,也是起點(diǎn)。
2012年,亞歷克斯·克里熱夫斯基等人提出深度卷積神經(jīng)網(wǎng)絡(luò)模型AlexNet,在當(dāng)年的ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽(ILSVRC)中,以領(lǐng)先第二名41%的壓倒性優(yōu)勢(shì)奪冠。AlexNet將Top-5錯(cuò)誤率從上一年的26%大幅降至15%,這也讓人們不得不相信,優(yōu)質(zhì)的AI必須經(jīng)過(guò)ImageNet預(yù)訓(xùn)練。
作為ImageNet的創(chuàng)始人,李飛飛開(kāi)放數(shù)據(jù)庫(kù),免費(fèi)提供給全世界的科研團(tuán)隊(duì)用于計(jì)算機(jī)圖片識(shí)別訓(xùn)練。這一刻也被許多行業(yè)人士稱為AI發(fā)展史上的“奇點(diǎn)”之一。被譽(yù)為結(jié)束了人工智能寒冬,也拉開(kāi)了人工智能黃金時(shí)代的序幕。
此后十年間,從科研到產(chǎn)業(yè)界,李飛飛在AI、具身智能上繼續(xù)鉆研。2013年,李飛飛正式出任斯坦福人工智能實(shí)驗(yàn)室(SAIL)主任;2015年,她與合作者聯(lián)合創(chuàng)立了AI4ALL;2017年,她從斯坦福暫時(shí)離開(kāi),在Google Cloud擔(dān)任AI/ML首席科學(xué)家兼副總裁,參與制定谷歌云在人工智能與機(jī)器學(xué)習(xí)上的戰(zhàn)略方向。
空間智能:支撐人類認(rèn)知的腳手架
“李飛飛是第一位真正理解大數(shù)據(jù)力量的計(jì)算機(jī)視覺(jué)研究人員,她的工作打開(kāi)了深度學(xué)習(xí)的閘門(mén),推動(dòng)了人工智能技術(shù)的問(wèn)世。”2024年諾貝爾物理學(xué)獎(jiǎng)獲得者的杰弗里·辛頓,對(duì)李飛飛的成就做了最好的總結(jié)。
2022年底,ChatGPT大語(yǔ)言模型燃爆AI圈,也讓“語(yǔ)言即世界”成為“行業(yè)共識(shí)”。但2024年,48歲的李飛飛又踏上了尋找“北極星”的旅程。
李飛飛最擅長(zhǎng)的,便是找到行業(yè)盲點(diǎn)。她認(rèn)為,包括視覺(jué)模型、空間智能、機(jī)器人模型都會(huì)數(shù)字化,但把“數(shù)字”等同于“語(yǔ)言”,便是“偷換概念”。在她看來(lái),信息不光是語(yǔ)言的,還有空間信息。
“算法語(yǔ)言表達(dá)的高級(jí)程度,已經(jīng)逼近人類水平。”雖然《我看見(jiàn)的世界》一書(shū)成型于2023年,但當(dāng)時(shí)她就表示:以ChatGPT等為代表的大語(yǔ)言模型能力已無(wú)需贅述,而機(jī)器人正在逐漸學(xué)會(huì)應(yīng)對(duì)真實(shí)的環(huán)境。
篤定的視覺(jué)模型不僅可以通過(guò)照片進(jìn)行訓(xùn)練,還可以在全三維世界中進(jìn)行沉浸式訓(xùn)練。當(dāng)世界模型形成后,人工智能能夠像識(shí)別內(nèi)容一樣流暢地生成內(nèi)容。簡(jiǎn)而言之,她要再做一個(gè)全新時(shí)代的“ImageNet”產(chǎn)品。
《我看見(jiàn)的世界》在中國(guó)出版的同時(shí),李飛飛創(chuàng)立了她的最新項(xiàng)目——World Labs,開(kāi)始研發(fā)空間智能。李飛飛認(rèn)為,時(shí)間到了。
“生成三維空間”并非易事,“我自己試著用Blender、Unity,我頭都大了。”李飛飛坦承,“奇點(diǎn)”還未到來(lái),技術(shù)也尚未攻克。但I(xiàn)mageNet帶給李飛飛的除了對(duì)行業(yè)的敏感嗅覺(jué),還有坐冷板凳的“耐心”。她坦言,從技術(shù)上來(lái)看,空間智能還處于早期,但她也篤定未來(lái)一到兩年內(nèi),空間智能會(huì)爆發(fā)。
“我現(xiàn)在可以肯定,等待探索的事物還有太多太多,一個(gè)人窮盡職業(yè)生涯,甚至一生,都無(wú)法抵達(dá)終點(diǎn)。”而在李飛飛看來(lái),AGI更像是一個(gè)有很多鎖的門(mén),需要不同的鑰匙打開(kāi),空間智能是其中一把。這個(gè)門(mén)并非“開(kāi)與不開(kāi)”,而是將會(huì)被一點(diǎn)點(diǎn)打開(kāi)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.