全球AI界有兩位大神,一男一女,剛好都是華人。男生就是黃仁勛,家喻戶曉了;女生李飛飛,人稱AI教母,如果沒有她,AI的發(fā)展進(jìn)程,可能還會晚個一二十年。
她創(chuàng)辦的ImageNet,是全球第一個大型AI數(shù)據(jù)庫,是AI視覺研究的基石。
她33歲成為斯坦福終身教授,45歲成為美國三大權(quán)威科學(xué)院的院士,在AI界更是桃李滿天下,英偉達(dá)、谷歌、OpenAI,都有她的高徒。她還擔(dān)任過谷歌副總裁,推動成立了谷歌AI中國中心。
今天,一口氣帶你認(rèn)識李飛飛。
先說家世。
1976年,李飛飛出生在北京的一個知識分子家庭。
爸爸是工程師,媽媽是人民教師。這樣的家庭,按說應(yīng)該拼命雞娃。
而李飛飛的童年卻沒有這些,而且她爸爸在世俗眼里還有點(diǎn)“不著調(diào)”。
比如李飛飛這個名字的由來,就很有戲劇性。李飛飛出生當(dāng)天,爸爸因?yàn)樵诠珗@看鳥忘了時間,錯過了孩子的出生時刻。回家后要給孩子起名,他還滿腦袋都是鳥,孩子就叫“飛飛”吧。
成為新手爸爸后,他也沒有為人父的壓力和焦慮,什么奧數(shù)班英語班,都靠一邊,他只想著帶孩子瘋玩。
比如帶飛飛去公園看鳥,去田里捉昆蟲,還會找來各種零件,DIY自行車,載著飛飛到處逛。
李飛飛后來回憶說,爸爸就是個迷失在成年人身份中的大孩子。
爸爸的“不著調(diào)”,本質(zhì)上是純粹的好奇心,這反而成為李飛飛的科學(xué)啟蒙。以至于上完物理課,她騎自行車轉(zhuǎn)彎時,都要思考加速度和角動量的變化。
如果說爸爸培養(yǎng)起了飛飛的好奇心,那媽媽就是拼盡了全力保護(hù)她的求知欲。
上初中時,有次飛飛被叫了家長,班主任說:別人家孩子都看奧數(shù)、背單詞,再不濟(jì)的也翻翻《意林》《讀者文摘》,記點(diǎn)作文素材,你家孩子看的都是什么?《不能承受的生命之輕》,海洋生物之謎、UFO……這些又不能提高分?jǐn)?shù),你作為家長的怎么不管管?
老師倒是一片苦心,可飛飛媽媽不干了,她直接回懟:我家孩子就愛看這些書,有問題嗎?老師被噎得說不出話來。
飛飛不只是愛看閑書,上學(xué)時她還把頭發(fā)剪得跟男生一樣短,天天跟一群男生聊戰(zhàn)斗機(jī)和UFO。
過了倆月,老師又找上門了,說飛飛天天打扮得跟個男生似的,沒有一點(diǎn)女孩子的樣子,不能仗著腦瓜聰明就不守紀(jì)律。
這次媽媽也沒慫,她說:飛飛首先是一個獨(dú)立的個體,然后才是女孩。
這件事也讓她開始思考,這樣的教育環(huán)境,是飛飛想要的嗎?這是我對她的期望嗎?也許飛飛和我一樣,都不屬于這里。
沒過多久,夫妻倆就辭去工作,全家到美國新澤西州定居,飛飛的人生從此發(fā)生巨變。
![]()
李飛飛
除了父母,李飛飛家還有位特殊的成員,那就是她在異國他鄉(xiāng)的避風(fēng)港,薩貝拉老師。
1992年,15歲的李飛飛來到美國。黃皮膚、亞洲人、語言不通,這幾個因素一疊加,幾乎預(yù)告了李飛飛艱難的求學(xué)路。好在她遇到了數(shù)學(xué)老師薩貝拉。
有次數(shù)學(xué)考試,李飛飛得了89.4分,90分才能拿A,就差0.6。從小就是尖子生的李飛飛很難受,她去辦公室找薩貝拉老師通融,結(jié)果被直接拒絕。薩貝拉說:想要A,只能靠你自己努力,其他免談。
看著是吃了閉門羹,但李飛飛一點(diǎn)沒往心里去,反而激發(fā)了她的好勝心。她天天往辦公室跑,一邊練口語、一邊學(xué)數(shù)學(xué)。一次她讓薩貝拉推薦幾本書,老師推薦了自己喜歡的科幻小說,結(jié)果李飛飛剛好讀過,從此倆人靠著這個共同愛好打開了話匣子,越聊越投機(jī)。從分享書籍聊到家長里短,李飛飛還時不時跑到老師家里蹭飯,相處的跟自家人一樣,薩貝拉老師也把飛飛當(dāng)干女兒。
飛飛考上大學(xué),他幫著研究入學(xué)文件;飛飛母親生病,他幫著聯(lián)系醫(yī)院;飛飛一家想開干洗店,他更是大手一揮,借出去好幾萬美元。
在爸爸媽媽和老師的幫助下,李飛飛考上著名的藤校普林斯頓。與其說李飛飛改變了世界,不如說這三個她最感謝的人,共同托舉起了一個天選科學(xué)家。
那李飛飛是怎么成長為科學(xué)家的呢?她又為什么在AI界有這么高的地位呢?
先做個輕科普,新一代AI技術(shù)有三大基石,GPU、神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)集。GPU提供算力,神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)算法,數(shù)據(jù)圖集則是訓(xùn)練的資源。
AI史上第一個數(shù)據(jù)圖集ImageNet,正是李飛飛20年前帶隊(duì)完成的。
下面我來帶你復(fù)盤一下ImageNet的誕生記。
回到2000年,24歲的李飛飛面臨人生的一個分水嶺,是成為拿著高薪的華爾街精英,還是繼續(xù)完成心中的科研夢想。李飛飛選擇了后者。
從普林斯頓畢業(yè)之后,她來到加州理工繼續(xù)求學(xué),成為錢學(xué)森和錢偉長的學(xué)妹,主攻的正是AI和視覺識別。
當(dāng)時AI研究已經(jīng)停滯了很多年,科學(xué)家們前赴后繼地努力提升模型和算法,卻一無所獲。
但李飛飛意識到,只關(guān)注模型和算法沒有用,還得把數(shù)據(jù)重視起來。這跟學(xué)數(shù)學(xué)一樣,光訓(xùn)練邏輯思維沒用,你要讓他做足夠多的題。
比如你想讓機(jī)器識別出更多圖片,就得先讓機(jī)器學(xué)習(xí)海量標(biāo)注好的圖片。
但問題是,這些素材圖片從哪來?當(dāng)時可沒有現(xiàn)在的技術(shù)發(fā)達(dá),敲個代碼就能搞定。沒有別的辦法,只能一個個手動收集。
于是在加州理工,她帶著幾個本科生,手敲出來一個有101個分類、9000多張圖片的數(shù)據(jù)集,叫Caltech101,在科研圈引發(fā)了不小的關(guān)注。
有了成績之后,李飛飛想要繼續(xù)完善這個數(shù)據(jù)庫,好推動進(jìn)一步的研究。
但這個想法立馬被同行們潑了一盆冷水。因?yàn)楫?dāng)時在AI圈,算法才是絕對C位,數(shù)據(jù)集基本沒人關(guān)注。
一連串的質(zhì)疑也讓她無力反駁:怎么做?你有計(jì)劃嗎?能做成嗎?靠譜嗎?
他們倒不是打擊飛飛,而是視覺識別這個科研方向太冷門了,不但拉不到經(jīng)費(fèi),還可能因此一輩子評不上教授。
而且要想實(shí)現(xiàn)李飛飛的設(shè)想,需要的圖像分類可就不是101個了,而是3萬個。
光是上百個分類,他們就加班加點(diǎn)干了好幾個月,如果沒有資金支持,按這個進(jìn)度,三萬個至少要干上百年!這是李飛飛遇到的第一個坎兒。
不過在一片質(zhì)疑聲之外,李飛飛也遇到了一位支持者,李凱。他和李飛飛是普林斯頓計(jì)算機(jī)科學(xué)系教師中唯二的中國移民。
之所以他會站出來支持,不僅僅是因?yàn)橥侨A人,而是李凱本來就是這方面的專家,還是一位成功的創(chuàng)業(yè)者,不差錢。
商人加學(xué)者的雙重身份,讓他篤信大規(guī)模數(shù)據(jù)集的未來。李教授不僅捐了一套工作站(一種計(jì)算機(jī))給李飛飛團(tuán)隊(duì),還把自己的學(xué)生鄧嘉推薦給了她。
2007年,在李教授和鄧嘉的支持下,李飛飛的數(shù)據(jù)集終于正式啟動,這就是ImageNet。
她規(guī)劃了22000個類別,每個類別配1000張圖,一共2200萬張。這還只是成品,為了選出這2200萬張,需要先找到至少10億張。
這工作量絕對是天文數(shù)字,好在找圖、標(biāo)注沒啥技術(shù)含量,他們雇了一群本科生,每小時10美元,做一個無情的標(biāo)注機(jī)器。
但即便如此,ImageNet完工也得整整19年。
為了提高效率,李飛飛和鄧嘉想了不少辦法,比如優(yōu)化圖片下載流程,原本需要點(diǎn)三下鼠標(biāo),給它壓縮到一下搞定;再比如自動在谷歌輸入圖片類別,提高下載速度。
一頓操作猛如虎,到頭來,預(yù)計(jì)只能把19年的開發(fā)周期壓縮到18年,還因?yàn)橄螺d太多,被谷歌封了賬號。
其實(shí)要提速也簡單,撒錢招人就行了,但每小時10美元是個天文數(shù)字,而且他們也沒有多大的辦公場地可用。ImageNet再次陷入了僵局,這是李飛飛遇到的第二個坎兒。
在絕望之下,李飛飛茶不思飯不想,甚至想過開幾家干洗店,一邊賺錢一邊養(yǎng)開發(fā)。不過好在幸運(yùn)女神再次眷顧了她。
一個叫孫民的研究生有一天突然找到她,說有種工作模式叫眾包,就是可以遠(yuǎn)程分配工作,全世界的人都可以同時參與,而且價(jià)格絕對比線下找本科生便宜,亞馬遜就有這種服務(wù),正好可以解決李飛飛的問題。
聽到這個消息,她立馬轉(zhuǎn)向眾包模式,團(tuán)隊(duì)的標(biāo)注員開始指數(shù)級增長。最多時有來自167個國家的4.8萬人參與,開發(fā)時間也從十幾年縮短到5年、2年和不到1年,勝利就在眼前,但很快,李飛飛發(fā)現(xiàn)口袋里又沒錢了,研究資金再次告急。這是李飛飛遇到的第三個坎兒。
她到處洽談投資合作,最后斯坦福拋來了橄欖枝,而代價(jià)則是讓他們整個團(tuán)隊(duì)搬到斯坦福所在的加州。
本來已經(jīng)安居樂業(yè)的李飛飛,要離開工作生活了十幾年的地方,再次陷入兩難。有母校,有親人朋友,有熟悉的工作環(huán)境,但當(dāng)李飛飛看到跟著自己奮斗好幾年的同事們,李飛飛最終決定冒險(xiǎn)一把。
2009年初,李飛飛帶團(tuán)隊(duì)跳槽到斯坦福,當(dāng)年6月,ImageNet的初始版本問世,收錄了1500萬張圖片,涵蓋22000個類別,而且每張圖片都經(jīng)過了手工標(biāo)注,并在層次結(jié)構(gòu)中進(jìn)行了組織,經(jīng)過了三重驗(yàn)證,建立起人工智能史上最大的人工編輯數(shù)據(jù)集。
![]()
回首看,ImageNet的完成,除了李飛飛團(tuán)隊(duì)的日夜辛苦,還要?dú)w功于當(dāng)時互聯(lián)網(wǎng)、數(shù)碼相機(jī)、搜索引擎等等更多技術(shù)的融合,所有這些大時代里的趨勢匯集到一起,相互成就,才促成了最后的成功。
但是回到2009年,ImageNet的誕生跟“科研碩果”、“改寫歷史”這些詞一點(diǎn)都沾不上邊,李飛飛帶著ImageNet去參加計(jì)算機(jī)視覺與模式識別大會,結(jié)果被忽視,只在會場邊上的海報(bào)上展示一下,幾乎無人問津。
后來她想到辦比賽,號召全球的AI算法從業(yè)者,用ImageNet訓(xùn)練他們的模型,最后比一比誰的效果最厲害。
這樣既能提高知名度,還能在各類算法模型的測試中優(yōu)化自己,一箭雙雕。
但2010年5月首屆比賽的結(jié)果公布后,她的心又涼了半截,獲勝的算法團(tuán)隊(duì),還是當(dāng)時公認(rèn)的行業(yè)標(biāo)準(zhǔn),成績也沒比在其他數(shù)據(jù)集訓(xùn)練的好多少。
到第二屆,報(bào)名人數(shù)差點(diǎn)腰斬,比賽結(jié)果跟第一年也差不多。
李飛飛一度懷疑自己是不是錯了。
直到2012年8月,第三屆比賽的結(jié)果出爐,獲勝的是一個神經(jīng)網(wǎng)絡(luò)算法團(tuán)隊(duì),而且準(zhǔn)確率比上屆冠軍高10%。
所有人都震驚了,因?yàn)樯窠?jīng)網(wǎng)絡(luò)并不是當(dāng)時正統(tǒng)的算法,甚至有點(diǎn)“老古董”的感覺。
這就好比一個名不見經(jīng)傳的老頭,一下?lián)魯×烁鞔箝T派,拿下了武林盟主。
李飛飛當(dāng)即決定,必須要親自見見這個團(tuán)隊(duì),看看到底是何方神圣。
而這個團(tuán)隊(duì)的老大我們都很熟了,就是拿下2024年諾貝爾物理學(xué)獎的辛頓教授。
辛頓教授團(tuán)隊(duì)開發(fā)的算法模型AlexNet,在這次比賽中的識別準(zhǔn)確率達(dá)到85%,創(chuàng)下世界紀(jì)錄。更奇怪的是,AlexNet屬于卷積神經(jīng)網(wǎng)絡(luò),這是一個20多年都沒什么進(jìn)展的算法方向,這次究竟是出現(xiàn)了神跡,還是辛頓撞了大運(yùn)?都不是,這其實(shí)是科學(xué)界的一次風(fēng)云際會。
簡單說,神經(jīng)網(wǎng)絡(luò)的思路相當(dāng)于模擬人腦,模擬生物進(jìn)化。比如視覺識別,別的算法都是預(yù)先決定先找圖片的哪些特征,而AlexNet沒有預(yù)設(shè),完全靠訓(xùn)練數(shù)據(jù)學(xué)習(xí),來培養(yǎng)自己的敏感度,逐漸形成對世界的認(rèn)知,跟嬰兒認(rèn)知世界的方式一樣。
辛頓教授之所以坐20年冷板凳,不是因?yàn)樯窠?jīng)網(wǎng)絡(luò)的思路有問題,而是它缺少資源,其中最核心的是算力和數(shù)據(jù)。
而ImageNet,恰好提供了足夠多的數(shù)據(jù),內(nèi)置了CUDA的英偉達(dá)GPU,又恰好提供超強(qiáng)算力。這次科學(xué)界的風(fēng)云際會,成就了李飛飛,正名了辛頓,造富了黃仁勛。
AlexNet的成功讓神經(jīng)網(wǎng)絡(luò)正式成為AI主流,2年后,機(jī)器的人臉識別準(zhǔn)確率正式超越人類。
李飛飛用大數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的想法也被業(yè)內(nèi)瘋狂追捧,從圖像擴(kuò)展到語音、文字、視頻等其他領(lǐng)域,AI革命被徹底點(diǎn)燃。
即便已經(jīng)功成名就,李飛飛也沒有躺平,而是繼續(xù)推動AI進(jìn)化。2024年1月,她創(chuàng)立了World Labs,要把AI模型從2D像素提升到3D世界,賦予和人類世界一樣豐富的空間智能。今年她又親自下場,基于通義千問,只用了50美元,就訓(xùn)練出一個媲美DeepSeek R1的新模型S1。
李飛飛“AI教母”稱號的含金量,還在不斷地提高。
作者 | 吳婷
![]()
嘉賓商學(xué)吳婷
參考資料:
[1]李飛飛.我看見的世界.中信出版集團(tuán).2024
[2]50美元復(fù)現(xiàn)DeepSeek R1,李飛飛團(tuán)隊(duì)也選了阿里Qwen.硬ai.2025
[3]阿里云回應(yīng)李飛飛團(tuán)隊(duì)50美元訓(xùn)練出AI模型.觀點(diǎn)網(wǎng).2025
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.