曾航/文
![]()
最近讀了華人人工智能科學(xué)家李飛飛的自傳《我看見(jiàn)的世界》,非常有意思。
然后我借助我的好朋友快刀青衣團(tuán)隊(duì)開(kāi)發(fā)的一個(gè)AI工具,模仿我的寫(xiě)作風(fēng)格,寫(xiě)成了這篇講李飛飛的文章。
以下,enjoy:
1、
1992年,經(jīng)過(guò)了14個(gè)小時(shí)的漫長(zhǎng)跨洋飛行,一對(duì)中國(guó)母女從波音747飛機(jī)艙門(mén)里一臉倦怠地走出來(lái),出現(xiàn)在紐約肯尼迪機(jī)場(chǎng)。
母親的口袋里只有20美元,這是他們的全部積蓄。她們沒(méi)有返程機(jī)票,一旦被拒絕入境,她們連怎么回國(guó)都不知道。而且她們很快發(fā)現(xiàn),在中國(guó)學(xué)的那種應(yīng)試型基礎(chǔ)英語(yǔ),在美國(guó)機(jī)場(chǎng)的實(shí)際生活中一點(diǎn)用也沒(méi)有。
她們?cè)跈C(jī)場(chǎng)焦急的等待,等待父親如約來(lái)接她們,但是一直等了好幾個(gè)小時(shí),一直到夕陽(yáng)西下,父親才滿(mǎn)懷歉意的趕來(lái)接她們。
原來(lái)是父親的那輛破舊的二手車(chē)在半路拋錨了,修理了好幾個(gè)小時(shí)才趕過(guò)來(lái),那時(shí)候又沒(méi)有手機(jī),母女就只能在機(jī)場(chǎng)等啊等。
一家三口精疲力竭,毫無(wú)歡聚的喜悅而言。汽車(chē)行駛在美國(guó)的高速公路上,閃過(guò)一個(gè)一個(gè)陌生的路標(biāo),一直來(lái)到新澤西州一個(gè)叫做帕西帕尼的移民聚集的小鎮(zhèn)上。
他們?cè)谶@個(gè)陌生的國(guó)度,無(wú)親無(wú)故,父親的英語(yǔ)水平近乎為0,母親的身體一直不太好,全家人開(kāi)始陷入貧困。
全家人唯一的指望,是教育好這個(gè)女兒。她叫李飛飛,喜歡留著一頭男孩一樣的短發(fā),聰明伶俐。
30年后,她將成為全世界人工智能領(lǐng)域最炙手可熱的科學(xué)家和創(chuàng)業(yè)者之一,一個(gè)新的時(shí)代,即將開(kāi)啟了。
2、
李飛飛這個(gè)名字,來(lái)自父親的一次"不靠譜"。她出生那天,父親去觀(guān)鳥(niǎo)而遲到了。等他匆匆趕到醫(yī)院,看著襁褓中的女兒,脫口而出:"就叫飛飛吧。"——這個(gè)名字倒是很巧妙,和他剛看的鳥(niǎo)有關(guān)系,而且男女都能用。
1976年,李飛飛出生在北京,剛好是文革結(jié)束的那一年,不久后全家就搬到了成都。
她父親是個(gè)電氣工程師,在化工廠(chǎng)的計(jì)算機(jī)部門(mén)工作。他戴著角質(zhì)框架眼鏡,外表英俊得像個(gè)年輕演員或垮掉派詩(shī)人。但他的性格更像個(gè)沒(méi)長(zhǎng)大的孩子,對(duì)嚴(yán)肅正經(jīng)的事情"嚴(yán)重過(guò)敏"。他喜歡突發(fā)奇想,曾經(jīng)自制過(guò)一輛帶挎斗的自行車(chē),載著小飛飛滿(mǎn)城跑。他熱愛(ài)大自然,經(jīng)常帶女兒去捉蝴蝶、觀(guān)察動(dòng)物、觀(guān)鳥(niǎo)。
她父親是典型的工程師思維。父親看世界的方式,天生就是物理學(xué)的。他看到蝴蝶,會(huì)講空氣動(dòng)力學(xué);他看到自行車(chē),會(huì)講力矩和平衡。物理學(xué)對(duì)他來(lái)說(shuō),不是需要"學(xué)習(xí)"的東西,而是觀(guān)察世界的本能。
母親是高中老師,后來(lái)成為辦公室職員。她天生頭腦敏銳,李飛飛的外祖母是晚清第一批女大學(xué)生。因?yàn)?文化大革命"期間的政治身份問(wèn)題,母親的求學(xué)之路被阻斷。這讓她性格叛逆,對(duì)約束和規(guī)范嗤之以鼻。她博學(xué)好讀,熱愛(ài)文學(xué),家里堆滿(mǎn)了各種書(shū)籍——從《魯迅作品》到《老人與海》,從中國(guó)古典文學(xué)到西方現(xiàn)代小說(shuō)。
這對(duì)父母給女兒的教育,和那個(gè)時(shí)代的主流完全不同。
他們不追求讓孩子成為"模范學(xué)生",不要求她取悅老師或迎合任何規(guī)則。母親反復(fù)強(qiáng)調(diào)的一句話(huà)是:"要為自己而努力,不是為了取悅他人。"父親則用行動(dòng)告訴女兒:這個(gè)世界充滿(mǎn)了值得探索的奧秘,物理學(xué)不是教科書(shū)上的公式,而是蝴蝶飛行的軌跡,是鳥(niǎo)兒滑翔的力學(xué)原理。
3、
1989年,他們?nèi)易龀鲆泼衩绹?guó)的決定,她父親先前往美國(guó),3年后又把母女兩人接過(guò)去。
1992年冬天,15歲的李飛飛和母親終于拿到了簽證。她們從成都出發(fā),經(jīng)上海轉(zhuǎn)機(jī),飛越太平洋,最終降落在紐約肯尼迪機(jī)場(chǎng)。
父親開(kāi)車(chē)帶母女前往新澤西州帕西帕尼小鎮(zhèn),一個(gè)典型的美國(guó)郊區(qū)小鎮(zhèn)。父親租了一套狹小的一居室公寓,在一棟紅磚公寓樓里。這就是一家三口在美國(guó)的最初居所了,李飛飛的床被安排在廚房和用餐區(qū)之間。
家里的家具,大部分是從路邊撿來(lái)的。每到周末,父親會(huì)開(kāi)著那輛經(jīng)常拋錨的舊車(chē),去富人區(qū)轉(zhuǎn)悠,看看有沒(méi)有人扔掉的家具。沙發(fā)、桌子、椅子,只要還能用,就搬回家。生活用品則從車(chē)庫(kù)二手市場(chǎng)淘來(lái),李飛飛用的計(jì)算器就是從那里買(mǎi)的——2美元,但經(jīng)常壞,導(dǎo)致她的數(shù)學(xué)作業(yè)出現(xiàn)錯(cuò)誤。
父親在一個(gè)臺(tái)灣商人的店里修理相機(jī),母親在臺(tái)灣人妻子經(jīng)營(yíng)的紐瓦克禮品店當(dāng)收銀員,每天站8小時(shí),非常辛苦。
不過(guò),1992年正是美國(guó)打贏了冷戰(zhàn),又打贏了海灣戰(zhàn)爭(zhēng),正值國(guó)力巔峰。相比之下,那時(shí)的中國(guó)還處在90年代初期的經(jīng)濟(jì)困難時(shí)期,對(duì)外開(kāi)放還沒(méi)有完全打開(kāi)局面,國(guó)企改制苦難重重。
1992年美國(guó)聯(lián)邦最低工資標(biāo)準(zhǔn)是每小時(shí)4.25美元,在美國(guó)一天工作8小時(shí),拿最低工資,也基本上相當(dāng)于普通成都人一個(gè)月工資了。所以那時(shí)候許多中國(guó)的精英知識(shí)分子,到美國(guó)去端盤(pán)子,也比國(guó)內(nèi)干工程師賺得多。
靠打工賺來(lái)的基礎(chǔ)的收入可以支持父母供李飛飛進(jìn)高中繼續(xù)學(xué)習(xí)。
李飛飛進(jìn)入帕西帕尼高中,被分到ESL(英語(yǔ)為第二語(yǔ)言)班級(jí)。也就是移民為主的班級(jí)。美國(guó)高中的一切都讓她震驚:更鮮艷、更快速、更喧鬧。學(xué)生們的行為方式、師生關(guān)系,都和中國(guó)完全不同。她感覺(jué)自己像個(gè)異類(lèi),特別是在圖書(shū)館和其他ESL學(xué)生一起學(xué)習(xí)時(shí),那種被隔離的感覺(jué)格外強(qiáng)烈。
語(yǔ)言是最大的障礙。即使最簡(jiǎn)單的家庭作業(yè),她也要花幾個(gè)小時(shí)才能完成。她需要兩本詞典——中英、英中,反復(fù)查閱。對(duì)ESL學(xué)生來(lái)說(shuō),"每節(jié)課都是英語(yǔ)課"。物理、數(shù)學(xué)、歷史、文學(xué),所有的學(xué)習(xí)都要先跨越語(yǔ)言這道坎。
更可怕的是,她目睹了種族歧視的暴力。一次,一個(gè)中國(guó)同學(xué)因?yàn)檩p微的身體接觸,被美國(guó)學(xué)生暴力毆打。李飛飛站在一旁,恐懼、無(wú)助、憤怒,卻什么也做不了。父母因?yàn)檎Z(yǔ)言限制,也無(wú)法為孩子提供有效的保護(hù)。
為了維持生計(jì),李飛飛開(kāi)始打工。
她找到的第一份工作,就是那家中餐館的服務(wù)生。餐館狹小昏暗,油煙味混合著醬油和味精的氣味,廚房里鐵鍋與爐灶碰撞的哐當(dāng)聲,炒菜的呲啦聲。她還做過(guò)家務(wù)清潔工,給人遛狗,做各種零工。每一份工作都伴隨著掙扎、沮喪、恐懼和憋屈。但這些錢(qián)很重要——它們讓母親在給外祖父母打電話(huà)時(shí),可以多說(shuō)幾句話(huà),不用那么匆忙地掛斷。
一家人總算在美國(guó)過(guò)上了不算富足但是初步穩(wěn)定的生活。
就在這時(shí),更大的危機(jī)來(lái)了。
母親的心臟出了問(wèn)題。她需要做手術(shù),但手術(shù)費(fèi)用對(duì)這個(gè)家庭來(lái)說(shuō)是天文數(shù)字。母親不得不辭去禮品店的工作,在家休養(yǎng)。家庭收入驟減,生活陷入了更深的困境。
父母想到一個(gè)辦法:盤(pán)下一家干洗店。干洗店位于連接帕西帕尼和曼哈頓下城的公交車(chē)站對(duì)面,地理位置不錯(cuò)。如果能經(jīng)營(yíng)起來(lái),既能有穩(wěn)定收入,又能讓母親不用太勞累。
但他們湊不齊轉(zhuǎn)讓費(fèi)。盤(pán)下這個(gè)干洗店,需要近10萬(wàn)美元,這對(duì)于她們這樣一個(gè)家庭來(lái)說(shuō)無(wú)異于天文數(shù)字。
就在這個(gè)最絕望的時(shí)刻,一個(gè)人出現(xiàn)了。
她叫薩貝拉,是李飛飛的高中數(shù)學(xué)老師。這位老師從李飛飛入學(xué)第一天就注意到了她——一個(gè)安靜、努力、眼神中充滿(mǎn)求知欲的中國(guó)女孩。薩貝拉不僅在課堂上給她額外的輔導(dǎo),還經(jīng)常在課后和她聊天,了解她的家庭情況,鼓勵(lì)她不要放棄。
當(dāng)薩貝拉聽(tīng)說(shuō)李飛飛家的困境后,他馬上決定借給他們好幾萬(wàn)美元。
這筆錢(qián),對(duì)薩貝拉一家來(lái)說(shuō)也不是小數(shù)目。但他們相信這個(gè)女孩,相信這個(gè)家庭。他們看到了李飛飛身上的潛力,也看到了這個(gè)家庭的堅(jiān)韌。
李飛飛一家用這筆錢(qián)盤(pán)下了干洗店。從此,全家人的生活就圍繞著這家店展開(kāi)。早上6點(diǎn)開(kāi)門(mén),晚上10點(diǎn)關(guān)門(mén),一周7天,幾乎沒(méi)有休息。李飛飛放學(xué)后就去店里幫忙,周末更是全天泡在那里。收衣服、洗衣服、熨燙、打包、收錢(qián),她什么都做。
但干洗店帶來(lái)的,不僅是經(jīng)濟(jì)上的緩解,更是一種心理上的穩(wěn)定。他們終于有了一個(gè)屬于自己的"生意",不再完全依賴(lài)別人給的工作機(jī)會(huì)。母親的手術(shù)也順利完成了。
一切開(kāi)始好起來(lái)了。
4、
1995年,李飛飛快要高中畢業(yè)了。
這時(shí)候經(jīng)過(guò)努力她的學(xué)習(xí)成績(jī)?cè)谕g人中已經(jīng)算不錯(cuò),但是跟那些受過(guò)精英教育且英語(yǔ)是母語(yǔ)的美國(guó)富家子弟或者中產(chǎn)子弟相比,依然是有差距的。
一開(kāi)始,李飛飛的目標(biāo)學(xué)校主要是州立大學(xué)和社區(qū)大學(xué),而不是常春藤盟校。但李飛飛心里的夢(mèng)中情校是愛(ài)因斯坦曾經(jīng)任教過(guò)的普林斯頓大學(xué)——那里距離李飛飛家只有一個(gè)小時(shí)車(chē)程,她曾經(jīng)到校園去游覽過(guò),立馬愛(ài)上了這里。
李飛飛象征性的給普林斯頓發(fā)送了申請(qǐng)材料,但并沒(méi)有報(bào)太大希望。
在12月一個(gè)異常寒冷的下午,放學(xué)后李飛飛去信箱取信,臟臟的積雪幾乎把郵筒全部掩埋。她撥開(kāi)雪,打開(kāi)郵箱,深深地吸了一口氣。立刻認(rèn)出了最上面那個(gè)信封上的徽章。一個(gè)橙黑相間的盾牌——普林斯頓大學(xué)。
她已經(jīng)大概猜到結(jié)果了:如果是大學(xué)的錄取通知書(shū),包裹會(huì)非常厚實(shí),因?yàn)槔锩鏁?huì)裝滿(mǎn)新生的入學(xué)材料和后續(xù)說(shuō)明。很明顯,信箱里的信并不屬于這種情況。
她打開(kāi)信封第一個(gè)映入眼簾的詞竟是“YES !”,還加粗了。往下多讀了幾段,才明白了信的大意,她的申請(qǐng)是進(jìn)入了提前錄取周期,在此期間,所有回復(fù)都是用薄信封寄出的。她大概率是被錄取了。
驚喜還不止于此。信里還附有一份名為“經(jīng)濟(jì)援助”的文件,上面寫(xiě)了很多法律細(xì)節(jié)。第二天,李飛飛把信帶到學(xué)校,拿給薩貝拉先生看,他似乎也不明白,又把信拿給了校長(zhǎng),校長(zhǎng)確信李飛飛被普林斯頓大學(xué)錄取了,而且給了全額獎(jiǎng)學(xué)金。
要知道,1995年前后,普林斯頓大學(xué)一年的學(xué)費(fèi)大約在2萬(wàn)到2.5萬(wàn)美元之間。四年下來(lái),這筆獎(jiǎng)學(xué)金價(jià)值近10萬(wàn)美元。對(duì)于一個(gè)經(jīng)濟(jì)拮據(jù)的移民家庭來(lái)說(shuō),這簡(jiǎn)直是天文數(shù)字。
更重要的是,這意味著李飛飛不用再在餐館端盤(pán)子了,她可以全身心地投入學(xué)習(xí),追求她真正熱愛(ài)的科學(xué)。
如今許多中國(guó)家長(zhǎng)投入巨資,送孩子上國(guó)際學(xué)校,到國(guó)外上高中,削尖了腦袋也很難申請(qǐng)上普林斯頓這樣的常青藤名校,那么為什么李飛飛在移民美國(guó)短短幾年,還沒(méi)有完全適應(yīng)美國(guó)生活的情況下就拿到了普林斯頓的全額獎(jiǎng)學(xué)金?
這跟當(dāng)時(shí)美國(guó)特殊的社會(huì)環(huán)境有很大關(guān)系,在90年代克林頓政府當(dāng)政時(shí)期,打贏了冷戰(zhàn)的美國(guó)開(kāi)始猛推全球化,以一種相對(duì)開(kāi)放、自信的姿態(tài)吸引來(lái)自全世界的移民和優(yōu)秀學(xué)生。尤其是讀書(shū)相對(duì)艱苦的理工科專(zhuān)業(yè),許多美國(guó)本土的學(xué)生不愿意去讀,就給了外來(lái)移民更多的機(jī)會(huì)。馬斯克、李飛飛都是在這個(gè)階段以移民的身份進(jìn)入到相對(duì)不錯(cuò)的高校的。
進(jìn)入常青藤名校普林斯頓大學(xué),是李飛飛人生的一次重要階層躍遷。
學(xué)校的食堂飯菜種類(lèi)豐富的不敢想象,宿舍比她家的面積還大,學(xué)校的博物館里面裝滿(mǎn)了價(jià)值連城的文物,宿舍里面裝有獨(dú)立的電話(huà)和信箱,圖書(shū)館的藏書(shū)非常豐富……有時(shí)候,還會(huì)有獲得諾貝爾獎(jiǎng)的老師來(lái)講課。
那時(shí)候的熱門(mén)專(zhuān)業(yè)是金融、法律、計(jì)算機(jī)這些,因?yàn)楫厴I(yè)后收入更高。但是李飛飛選擇了自己從小喜歡的物理學(xué),而且普林斯頓大學(xué)的物理系格外有名。雖然很多華人不太理解她的選擇,但是從小鼓勵(lì)她獨(dú)立的父母卻堅(jiān)定地支持了她的選擇。
只要混的不是太差,常青藤名校的畢業(yè)生,可以順利進(jìn)入500強(qiáng)企業(yè)工作,或者去華爾街、麥肯錫上班,在美國(guó)順利過(guò)上中產(chǎn)的生活。尤其是對(duì)于李飛飛這樣家境貧寒的移民學(xué)生來(lái)說(shuō),畢業(yè)后找一份收入豐厚的工作,是相當(dāng)有吸引力的。
但是父母從小的教育理念使她仍然堅(jiān)定選擇自己喜歡的事情,而不是完全考慮金錢(qián)因素。
5、
2000年,李飛飛從普林斯頓畢業(yè),她沒(méi)有選擇去許多待遇豐厚的知名企業(yè)工作,而是選擇進(jìn)入加州理工學(xué)院攻讀博士學(xué)位,師從計(jì)算機(jī)視覺(jué)專(zhuān)家彼得羅·佩羅納。博士期間,她創(chuàng)建了Caltech 101數(shù)據(jù)集,這是一個(gè)包含101個(gè)類(lèi)別、約9000張圖片的數(shù)據(jù)庫(kù)。這個(gè)項(xiàng)目讓她意識(shí)到:計(jì)算機(jī)視覺(jué)的突破,需要更大規(guī)模的數(shù)據(jù)。
那是1990年代末,互聯(lián)網(wǎng)泡沫正在膨脹,硅谷的創(chuàng)業(yè)故事每天都在上演。但李飛飛選擇了一條不同的路——她要做學(xué)術(shù)研究。
2009年,李飛飛加入普林斯頓大學(xué)擔(dān)任助理教授。2012年,她又跳槽到斯坦福大學(xué),成為計(jì)算機(jī)科學(xué)系的助理教授。一路走來(lái),她的學(xué)術(shù)道路看起來(lái)很順利。
但她心里一直有一個(gè)"瘋狂"的想法。
2007年的一天,李飛飛在辦公室里翻閱一本關(guān)于語(yǔ)言學(xué)的書(shū),書(shū)中提到了WordNet——一個(gè)由普林斯頓大學(xué)認(rèn)知科學(xué)家克里斯蒂安·費(fèi)爾鮑姆創(chuàng)建的英語(yǔ)詞匯數(shù)據(jù)庫(kù)。WordNet將英語(yǔ)單詞按照語(yǔ)義關(guān)系組織起來(lái),形成了一個(gè)龐大的知識(shí)網(wǎng)絡(luò)。
李飛飛突然想到:如果能為計(jì)算機(jī)視覺(jué)創(chuàng)建一個(gè)類(lèi)似的數(shù)據(jù)庫(kù),會(huì)怎么樣?
不是101個(gè)類(lèi)別,不是1000個(gè)類(lèi)別,而是涵蓋人類(lèi)視覺(jué)世界的所有類(lèi)別——至少3萬(wàn)個(gè)。每個(gè)類(lèi)別都有成百上千張圖片,每張圖片都經(jīng)過(guò)人工標(biāo)注。這樣的數(shù)據(jù)庫(kù),將成為訓(xùn)練人工智能的"視覺(jué)百科全書(shū)"。
她把這個(gè)想法告訴了導(dǎo)師吉滕德拉·馬利克。導(dǎo)師的反應(yīng)很謹(jǐn)慎:"這個(gè)項(xiàng)目太大了,風(fēng)險(xiǎn)太高。如果失敗了,會(huì)影響你的教職評(píng)審。"
李飛飛也知道風(fēng)險(xiǎn)。她做了一個(gè)粗略的計(jì)算:如果按照Caltech 101的標(biāo)注速度,完成3萬(wàn)個(gè)類(lèi)別、每個(gè)類(lèi)別1000張圖片的數(shù)據(jù)庫(kù),需要19年。即使優(yōu)化流程,也需要18年。
但她還是決定做。
這個(gè)決定背后,有一個(gè)關(guān)鍵的時(shí)刻。那是2007年的某一天,李飛飛去醫(yī)院看望母親。母親的心臟病又復(fù)發(fā)了,躺在病床上。李飛飛坐在床邊,和母親聊起自己的研究困境。
母親虛弱地問(wèn)她:"人工智能還能做哪些事來(lái)幫助別人?"
這句話(huà)讓李飛飛醍醐灌頂。她突然意識(shí)到,自己做研究不是為了發(fā)論文、評(píng)職稱(chēng),而是為了讓技術(shù)真正幫助人類(lèi)。如果ImageNet能夠成功,它將推動(dòng)整個(gè)人工智能領(lǐng)域的發(fā)展,讓機(jī)器真正"看見(jiàn)"世界。
她決定賭一把。
2007年,ImageNet項(xiàng)目正式啟動(dòng)。李飛飛組建了一個(gè)小團(tuán)隊(duì),包括幾個(gè)研究生和博士后。他們從WordNet的3萬(wàn)個(gè)名詞中,篩選出與視覺(jué)相關(guān)的類(lèi)別,然后開(kāi)始從互聯(lián)網(wǎng)上搜集圖片。
搜集圖片不難,難的是標(biāo)注。每張圖片都需要人工判斷:這是不是一只狗?是什么品種的狗?圖片質(zhì)量夠不夠好?這些工作必須由人來(lái)完成,機(jī)器無(wú)法替代。
團(tuán)隊(duì)成員每天坐在電腦前,一張一張地標(biāo)注圖片。一天8小時(shí),一周7天,進(jìn)度慢得令人絕望。按照這個(gè)速度,19年的預(yù)測(cè)一點(diǎn)都不夸張。
更糟糕的是,學(xué)術(shù)界的質(zhì)疑聲越來(lái)越大。
在一次學(xué)術(shù)會(huì)議上,一位資深教授當(dāng)眾質(zhì)問(wèn)李飛飛:"你為什么要浪費(fèi)時(shí)間做這種沒(méi)有技術(shù)含量的體力活?這對(duì)你的學(xué)術(shù)生涯有什么幫助?"
另一位同行更直接:"這個(gè)項(xiàng)目永遠(yuǎn)不可能完成。你應(yīng)該把精力放在算法創(chuàng)新上,而不是數(shù)據(jù)收集。"
甚至連導(dǎo)師吉滕德拉也建議她:"也許你應(yīng)該考慮縮小規(guī)模,或者干脆放棄。"
李飛飛陷入了深深的自我懷疑。她開(kāi)始失眠,每天晚上躺在床上,腦子里反復(fù)計(jì)算:還需要多少年?如果失敗了怎么辦?她的教職評(píng)審還有幾年?
就在這時(shí),一個(gè)研究生改變了一切。
他叫孫民,是李飛飛團(tuán)隊(duì)的一員。2008年的某一天,孫民走進(jìn)李飛飛的辦公室,興奮地說(shuō):"老師,我發(fā)現(xiàn)了一個(gè)東西,也許能幫我們。"
他介紹的是亞馬遜的一個(gè)眾包平臺(tái),叫"土耳其機(jī)器人"(Amazon Mechanical Turk)。這個(gè)平臺(tái)允許任何人發(fā)布簡(jiǎn)單的任務(wù),全世界的用戶(hù)可以接任務(wù)賺錢(qián)。任務(wù)可以是標(biāo)注圖片、轉(zhuǎn)錄音頻、填寫(xiě)問(wèn)卷等等。
李飛飛眼睛一亮。這不就是她需要的嗎?
她立刻開(kāi)始測(cè)試。他們?cè)谄脚_(tái)上發(fā)布了一個(gè)任務(wù):判斷這張圖片是不是一只狗?每完成一張圖片的標(biāo)注,支付0.5到2美元不等。
結(jié)果令人震驚。來(lái)自世界各地的用戶(hù)開(kāi)始接任務(wù),標(biāo)注速度比團(tuán)隊(duì)自己做快了幾十倍。更重要的是,通過(guò)設(shè)計(jì)巧妙的質(zhì)量控制機(jī)制——讓多個(gè)用戶(hù)標(biāo)注同一張圖片,然后交叉驗(yàn)證——他們可以保證標(biāo)注的準(zhǔn)確性。
李飛飛意識(shí)到,她找到了破局的鑰匙。
接下來(lái)的兩年,ImageNet項(xiàng)目全速推進(jìn)。來(lái)自167個(gè)國(guó)家的超過(guò)4.8萬(wàn)名貢獻(xiàn)者參與了標(biāo)注工作。ImageNet成為亞馬遜土耳其機(jī)器人平臺(tái)最大的雇主之一。
成本呢?根據(jù)后來(lái)的統(tǒng)計(jì),ImageNet項(xiàng)目的總投入超過(guò)700萬(wàn)美元。平均每張圖片的標(biāo)注成本約0.5到2美元。這筆錢(qián)從哪來(lái)?主要是斯坦福大學(xué)的研究經(jīng)費(fèi),以及李飛飛實(shí)驗(yàn)室的各種項(xiàng)目資金。對(duì)于一個(gè)學(xué)術(shù)項(xiàng)目來(lái)說(shuō),這是一筆巨大的投入。
但李飛飛賭對(duì)了。
2009年,ImageNet項(xiàng)目竣工。最終的數(shù)據(jù)庫(kù)包含2.2萬(wàn)個(gè)類(lèi)別、1500萬(wàn)張圖片,每張圖片都經(jīng)過(guò)人工標(biāo)注。這是人類(lèi)歷史上最大規(guī)模的視覺(jué)數(shù)據(jù)庫(kù)。
李飛飛做了一個(gè)更大膽的決定:把ImageNet免費(fèi)開(kāi)放給全世界的研究者,并且每年舉辦一次ImageNet挑戰(zhàn)賽,看誰(shuí)的算法能在圖像識(shí)別上取得最好的成績(jī)。
2010年,第一屆ImageNet挑戰(zhàn)賽舉辦。參賽團(tuán)隊(duì)的算法識(shí)別準(zhǔn)確率只有70%左右。2011年,第二屆挑戰(zhàn)賽,準(zhǔn)確率提升到75%。2012年,第三屆挑戰(zhàn)賽,奇跡發(fā)生了。一個(gè)來(lái)自多倫多大學(xué)的團(tuán)隊(duì),使用了一種叫"卷積神經(jīng)網(wǎng)絡(luò)"的算法,識(shí)別準(zhǔn)確率達(dá)到了85%——比上一年高出整整10個(gè)百分點(diǎn)。這個(gè)團(tuán)隊(duì)的領(lǐng)導(dǎo)者叫杰弗里·辛頓,他的學(xué)生亞歷克斯·克里澤夫斯基設(shè)計(jì)的算法,后來(lái)被稱(chēng)為"AlexNet"。
這次比賽,被認(rèn)為是深度學(xué)習(xí)時(shí)代的開(kāi)端。
AlexNet使用了兩張英偉達(dá)GTX 580 GPU進(jìn)行訓(xùn)練,每張顯卡當(dāng)時(shí)的價(jià)格約500美元。這次"一戰(zhàn)封神",不僅讓深度學(xué)習(xí)算法名聲大噪,也讓英偉達(dá)與AI歷史永久綁定。此后,英偉達(dá)的GPU成為AI訓(xùn)練的標(biāo)準(zhǔn)配置,公司市值一路飆升。
更重要的是,ImageNet證明了一件事:在人工智能領(lǐng)域,數(shù)據(jù)和算力同樣重要。沒(méi)有ImageNet這樣大規(guī)模的數(shù)據(jù)集,深度學(xué)習(xí)算法無(wú)法展現(xiàn)其威力。
李飛飛的"豪賭"成功了。
ImageNet迅速成為計(jì)算機(jī)視覺(jué)研究領(lǐng)域的基礎(chǔ)設(shè)施。幾乎所有的圖像識(shí)別算法,都要在ImageNet上測(cè)試性能。它不僅推動(dòng)了計(jì)算機(jī)視覺(jué)的發(fā)展,還間接推動(dòng)了語(yǔ)音識(shí)別、自然語(yǔ)言處理等其他AI領(lǐng)域的進(jìn)步。
但故事還沒(méi)有結(jié)束。2016年,李飛飛面臨了一個(gè)新的選擇:是繼續(xù)留在學(xué)術(shù)界,還是進(jìn)入產(chǎn)業(yè)界?這個(gè)選擇,將再次考驗(yàn)她的價(jià)值觀(guān)。
6、
2016年,李飛飛已經(jīng)是斯坦福大學(xué)計(jì)算機(jī)科學(xué)系的終身教授,還是首任紅杉講席教授。她的實(shí)驗(yàn)室有十幾個(gè)GPU,有一群優(yōu)秀的博士生,有穩(wěn)定的研究經(jīng)費(fèi)。不管是從學(xué)術(shù)地位還是個(gè)人收入上來(lái)說(shuō),李飛飛都已經(jīng)是成功人士。
這時(shí),谷歌云向她拋出了橄欖枝:擔(dān)任谷歌云人工智能及機(jī)器學(xué)習(xí)首席科學(xué)家,同時(shí)兼任副總裁。
這不是一個(gè)容易的決定。
谷歌能提供的資源,是任何大學(xué)都無(wú)法比擬的:更大規(guī)模的實(shí)驗(yàn)室、任何規(guī)模的高性能算力、博士組成的龐大研究團(tuán)隊(duì),以及"做夢(mèng)都無(wú)法想象的海量數(shù)據(jù)"。
經(jīng)過(guò)一番權(quán)衡后,李飛飛接受了這個(gè)職位,但她沒(méi)有完全離開(kāi)斯坦福。她申請(qǐng)了21個(gè)月的學(xué)術(shù)休假,每周仍在校園待一天,與實(shí)驗(yàn)室和學(xué)生保持聯(lián)系。
谷歌這樣的科技巨頭,帶給李飛飛的是和高校完全不同的震撼。
谷歌的一切都"比她所習(xí)慣的更大、更快、更精密、更復(fù)雜"。食物豐富得令人咋舌,幾乎每棟大樓每一層都有休息室。會(huì)議室"像科幻小說(shuō)里的場(chǎng)景"。她的團(tuán)隊(duì)從15人開(kāi)始,18個(gè)月內(nèi)規(guī)模擴(kuò)大了20倍。
但真正讓她震撼的,是一次技術(shù)演示。
團(tuán)隊(duì)向她展示了一個(gè)叫"神經(jīng)架構(gòu)搜索"的項(xiàng)目,這個(gè)項(xiàng)目需要800個(gè)GPU同時(shí)運(yùn)行。
800個(gè)!
而她在斯坦福的實(shí)驗(yàn)室,只有十幾個(gè)GPU。
那一刻,李飛飛意識(shí)到一個(gè)殘酷的事實(shí):人工智能正在成為一種特權(quán),一種排他性極強(qiáng)的特權(quán)。
行業(yè)的準(zhǔn)入壁壘像一座大山高聳在地平線(xiàn)上。沒(méi)有海量數(shù)據(jù),沒(méi)有強(qiáng)大算力,沒(méi)有頂尖人才,你根本無(wú)法在AI領(lǐng)域競(jìng)爭(zhēng)。而這些資源,越來(lái)越集中在少數(shù)幾家科技巨頭手中。
這讓她開(kāi)始思考:AI的未來(lái)應(yīng)該是什么樣的?是少數(shù)公司的專(zhuān)利,還是全人類(lèi)的工具?
在谷歌的日子里,李飛飛接觸到了"成千上萬(wàn)個(gè)人工智能的應(yīng)用案例"——制造業(yè)、農(nóng)業(yè)、保險(xiǎn)業(yè)、運(yùn)輸物流、零售、金融服務(wù),甚至政府部門(mén)。這種規(guī)模和種類(lèi)的接觸,確實(shí)是任何一所大學(xué)都無(wú)法同時(shí)提供的。
但她也目睹了AI技術(shù)的另一面。
2018年,谷歌云與美國(guó)國(guó)防部簽訂了Maven項(xiàng)目合同,利用AI技術(shù)分析無(wú)人機(jī)拍攝的視頻。這個(gè)項(xiàng)目在公司內(nèi)部引發(fā)了激烈爭(zhēng)議,緊張局勢(shì)從公司內(nèi)部蔓延到媒體,重新點(diǎn)燃了大眾關(guān)于技術(shù)在軍事事務(wù)中所扮演角色的長(zhǎng)期爭(zhēng)議。
李飛飛被卷入了爭(zhēng)議的中心。
她開(kāi)始思考:技術(shù)是中性的嗎?科學(xué)家應(yīng)該為技術(shù)的應(yīng)用負(fù)責(zé)嗎?當(dāng)AI被用于軍事目的時(shí),研究者應(yīng)該持什么立場(chǎng)?
這些問(wèn)題沒(méi)有標(biāo)準(zhǔn)答案。但李飛飛心里有了自己的答案。
2018年,她結(jié)束了在谷歌的學(xué)術(shù)休假,重返斯坦福大學(xué)。
很多人不理解。谷歌能提供的資源、薪水、影響力,都遠(yuǎn)超學(xué)術(shù)界。而且,留在谷歌意味著她可以直接影響AI技術(shù)的商業(yè)應(yīng)用,影響數(shù)十億用戶(hù)。
但李飛飛選擇了回到斯坦福,回到學(xué)術(shù)界。
她在自傳中寫(xiě)道:"我堅(jiān)信人工智能可以讓世界變得更好...科學(xué)的力量依然值得我們滿(mǎn)懷樂(lè)觀(guān)。"
回到斯坦福后,她做了幾件事,包括成立了一個(gè)研究院,致力于研究AI的倫理、政策和社會(huì)影響;創(chuàng)立了一個(gè)非營(yíng)利組織,專(zhuān)門(mén)為弱勢(shì)群體提供AI教育機(jī)會(huì);繼續(xù)她的學(xué)術(shù)研究,但更關(guān)注AI的人文關(guān)懷方向——比如醫(yī)療AI、老年護(hù)理AI等。
她記得母親病床上的那句話(huà):"人工智能還能做哪些事來(lái)幫助別人?"
2024年,李飛飛創(chuàng)立了一家名為World Labs的AI創(chuàng)業(yè)公司,估值已超過(guò)10億美元。但她依然保留著斯坦福大學(xué)的教職,依然每周給學(xué)生上課,依然在推動(dòng)AI的人文關(guān)懷研究。
結(jié)束語(yǔ):
我看過(guò)中外數(shù)百個(gè)名人的自傳,但李飛飛自傳的寫(xiě)作水平是其中水準(zhǔn)相當(dāng)高的,不太像是一個(gè)從事理工科的人的寫(xiě)作水平。
你從李飛飛的自傳身上可以看出他父母在家庭教育上很深的痕跡,應(yīng)該說(shuō)他父母的教育理念是那一代中國(guó)人當(dāng)中的異類(lèi),這在很大程度上促成了李飛飛日后的成功。
她的家庭教育有幾個(gè)特點(diǎn),首先注重培養(yǎng)小孩的好奇心——幾乎所有科學(xué)家都有類(lèi)似的特質(zhì),例如愛(ài)因斯坦、馮-諾伊曼等。然后不迷信權(quán)威,她的父母鼓勵(lì)她看了大量當(dāng)時(shí)不被學(xué)校老師所鼓勵(lì)的書(shū)籍,這些書(shū)籍在她日后的人生當(dāng)中都產(chǎn)生了較大影響。
同時(shí),李飛飛的母親一直希望女兒保持思維和決策的獨(dú)立性,例如在選擇職業(yè)發(fā)展方向的時(shí)候,不完全看重金錢(qián)的因素,這種理念使得他在移民美國(guó)號(hào)能夠比較好的融入美國(guó)的社會(huì)。
選擇大于努力。
在李飛飛移民美國(guó)的90年代初,正是美國(guó)剛贏得冷戰(zhàn)、全球化開(kāi)啟、信息技術(shù)革命方興未艾的時(shí)代,那是美國(guó)國(guó)力的巔峰時(shí)期,那一代在美國(guó)發(fā)展的華人,包括黃仁勛、蘇姿豐等,都吃到了這一波紅利。而中國(guó)的經(jīng)濟(jì)騰飛,還有信息產(chǎn)業(yè)的起飛,則要到2001年加入WTO以后了。
美國(guó)高校在90年代的時(shí)候?qū)τ谏贁?shù)族裔的移民有較多的傾斜,尤其歡迎亞裔移民去申請(qǐng)理工科類(lèi)的專(zhuān)業(yè),因此李飛飛和馬斯克這樣的移民,在當(dāng)時(shí)可以比較順利的進(jìn)入普林斯頓、斯坦福、賓夕法尼亞大學(xué)這樣的頂級(jí)高校就讀,而今天華人要想上這些高校難度是指數(shù)級(jí)的提升。
李飛飛在從普林斯頓大學(xué)畢業(yè)的時(shí)候沒(méi)有選擇去麥肯錫等待遇豐厚的傳統(tǒng)企業(yè)工作,而是選擇了前往加州理工進(jìn)行人工智能科學(xué)的早期研究。這個(gè)選擇在當(dāng)時(shí)看來(lái)似乎放棄了很多短期回報(bào),但是卻一不小心趕上了人工智能產(chǎn)業(yè)的超級(jí)大爆發(fā)。在選擇的過(guò)程中,他保持了一貫的獨(dú)立思考和遵從自身的興趣。這與他的早期家庭教育不無(wú)關(guān)系。
李飛飛是美國(guó)高校與企業(yè)間密切的產(chǎn)學(xué)研互動(dòng)的一個(gè)很典型的案例。美國(guó)有許多高校的老師日后都去創(chuàng)辦了企業(yè),或者在企業(yè)任職。比較典型的,例如思科公司的創(chuàng)始人(曾是斯坦福大學(xué)的教授),還有掃地機(jī)器人公司 iRobot 的創(chuàng)始人(曾是麻省理工的教授)等。而一些在企業(yè)里面積累了豐富經(jīng)驗(yàn)的企業(yè)家或者技術(shù)專(zhuān)家又回到高校繼續(xù)任教。為高校的科研和教學(xué)帶來(lái)了豐富的實(shí)踐經(jīng)驗(yàn)。
李飛飛和黃仁勛、蘇姿豐等華裔移民身上有非常鮮明的華人特質(zhì),他們重視理工科的教育,基礎(chǔ)扎實(shí),堅(jiān)韌抗壓,可以靠端盤(pán)子、刷碗、洗衣服維持生計(jì)。同時(shí)在成功后重視社會(huì)責(zé)任,不止追求商業(yè)上的成功。
![]()
作者:曾航 ,資深媒體人,軍武科技CEO,旗下有知名賬號(hào)軍武次位面、星海情報(bào)局、楊叔洞察、測(cè)評(píng)界的野路子等。曾任21世紀(jì)經(jīng)濟(jì)報(bào)道資深記者,著有《一只iPhone的全球之旅》、《移動(dòng)的帝國(guó)》、《大國(guó)鎖鑰》等書(shū)籍。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.