![]()
谷歌工作了14年的戴明博,與蘋(píng)果的楊寅飛共同創(chuàng)立了Elorian。
編譯 |萬(wàn)貴霞
編輯 |云鵬
智東西1月14日消息,據(jù)美國(guó)科技媒體The Information報(bào)道,兩位科技大廠前AI研究員——谷歌DeepMind前成員戴明博(Andrew Dai)與蘋(píng)果前研究科學(xué)家楊寅飛(Yinfei Yang),聯(lián)合創(chuàng)立了Elorian公司。該公司專(zhuān)注于開(kāi)發(fā)能夠同時(shí)理解和處理文本、圖像、視頻及音頻的AI模型。
目前,Elorian正在推進(jìn)一輪規(guī)模達(dá)5000萬(wàn)美元(約合人民幣3.5億元)的種子輪融資,Striker Venture Partners有望成為本輪領(lǐng)投方,雙方洽談已進(jìn)入關(guān)鍵階段。
戴明博出身于高知家庭,他父親是機(jī)構(gòu)學(xué)和機(jī)器人學(xué)領(lǐng)域大佬戴建生。作為Elorian的CEO,他之前在谷歌DeepMind任職超14年,負(fù)責(zé)數(shù)據(jù)驅(qū)動(dòng)型預(yù)訓(xùn)練相關(guān)工作。他深耕深度學(xué)習(xí)領(lǐng)域20年,曾在劍橋大學(xué)、愛(ài)丁堡大學(xué)攻讀過(guò)學(xué)位,是機(jī)器學(xué)習(xí)方向的博士。
Elorian另一位聯(lián)合創(chuàng)始人楊寅飛,學(xué)生時(shí)期曾在南京郵電大學(xué)Echo實(shí)驗(yàn)室,參與差分進(jìn)化算法參數(shù)控制相關(guān)研究,畢業(yè)作品Apollo3D(阿波羅3D)獲蘇州機(jī)器人世界杯第五名。他還參與癲癇診斷研究,開(kāi)發(fā)MRI圖像配準(zhǔn)與可視化系統(tǒng),之后在美國(guó)賓夕法尼亞大學(xué)攻讀碩士學(xué)位。
在AI創(chuàng)業(yè)從“拼應(yīng)用”轉(zhuǎn)向“拼底層能力”的背景下,具備長(zhǎng)期基礎(chǔ)模型研究經(jīng)驗(yàn)的華人科學(xué)家正加速走向創(chuàng)業(yè)前臺(tái),Elorian成為近期視覺(jué)AI賽道中備受關(guān)注的案例之一。
01.
前谷歌DeepMind與蘋(píng)果研究員聯(lián)合創(chuàng)業(yè)
據(jù)The Information報(bào)道,Elorian公司由戴明博與楊寅飛聯(lián)合創(chuàng)立。
戴明博與楊寅飛的領(lǐng)英個(gè)人資料顯示,二人目前就職于一家“隱形(Stealth)”狀態(tài)的公司,戴明博是該公司的CEO。
業(yè)內(nèi)普遍認(rèn)為,這家“隱形”公司很可能是Elorian。
![]()
▲“隱形(Stealth)”的領(lǐng)英主頁(yè)資料(圖源:領(lǐng)英)
1、戴明博,深耕DeepMind 14年,擔(dān)任Gemini預(yù)訓(xùn)練工作
據(jù)戴明博領(lǐng)英個(gè)人資料顯示,他在谷歌DeepMind工作超過(guò)14年,是Gemini數(shù)據(jù)領(lǐng)域的聯(lián)合負(fù)責(zé)人,擔(dān)任Gemini預(yù)訓(xùn)練工作。
此前,戴明博曾參與谷歌SGE的建模工作,在谷歌大腦(Google Brain)從事自然語(yǔ)言處理研究,在谷歌健康(Google Health)從事電子健康記錄研究,并參與了Google Now的開(kāi)發(fā)。
![]()
▲戴明博(圖源:領(lǐng)英)
在領(lǐng)英自我介紹中,戴明博寫(xiě)到自己在深度學(xué)習(xí)領(lǐng)域擁有豐富經(jīng)驗(yàn),研究方向包括自然語(yǔ)言理解和大型語(yǔ)言模型。
戴明博2003-2006年在英國(guó)劍橋大學(xué)計(jì)算機(jī)科學(xué)專(zhuān)業(yè)學(xué)習(xí);2007-2012年在愛(ài)丁堡大學(xué)攻讀機(jī)器學(xué)習(xí)博士。
他過(guò)去20年來(lái)一直從事預(yù)訓(xùn)練相關(guān)研究。其研究主要集中在開(kāi)發(fā)評(píng)估AI模型訓(xùn)練數(shù)據(jù)質(zhì)量的技術(shù),并確保模型使用來(lái)自各種不同來(lái)源的數(shù)據(jù)進(jìn)行訓(xùn)練。
據(jù)相關(guān)報(bào)道消息,戴明博出生于高知家庭,他的曾祖父畢業(yè)于金陵大學(xué)(南京大學(xué)前身),爺爺畢業(yè)于廈門(mén)大學(xué)土木工程系。
戴明博的爸爸則是開(kāi)辟了國(guó)際機(jī)構(gòu)學(xué)和機(jī)器人學(xué)研究新領(lǐng)域的大佬、現(xiàn)南方科技大學(xué)機(jī)器人研究院院長(zhǎng)戴建生。
![]()
▲戴明博在福建莆田的家庭合照,右下1為戴建生,左上1為戴明博(圖源:公眾號(hào)angrysprite不可言喻)
可能受父親的耳濡目染,戴明博也攻讀機(jī)器學(xué)習(xí)相關(guān)專(zhuān)業(yè),從事谷歌DeepMind相關(guān)工作,且創(chuàng)立了Elorian公司。
2、楊寅飛,橫跨谷歌蘋(píng)果,主攻視覺(jué)和語(yǔ)言多模態(tài)模型領(lǐng)域
楊寅飛領(lǐng)英主頁(yè)資料顯示,他于2022年1月加入蘋(píng)果,擔(dān)任蘋(píng)果公司AI機(jī)器學(xué)習(xí)部門(mén)的研究科學(xué)家。
![]()
▲楊寅飛(圖源:谷歌楊寅飛主頁(yè))
楊寅飛在學(xué)生階段就開(kāi)始接觸行業(yè)相關(guān)工作。據(jù)楊寅飛的谷歌個(gè)人介紹,2007年12月至2009年7月,他曾作為研究助理在南京郵電大學(xué)Echo實(shí)驗(yàn)室進(jìn)化計(jì)算研究組工作,參與設(shè)計(jì)了一種用于控制差分進(jìn)化算法參數(shù)的新方法。
在本科階段,楊寅飛完成的畢業(yè)作品名為Apollo3D(阿波羅3D),主要用于Robocup足球模擬器中的Simu-Robot動(dòng)作設(shè)計(jì)。該作品曾在蘇州機(jī)器人世界杯比賽中獲得第五名。
![]()
▲楊寅飛的畢業(yè)作品Apollo3D圖像演示(圖源:Source Forge)
2010年5月至10月,楊寅飛參與了一項(xiàng)跨校、跨國(guó)合作研究,與南京航空航天大學(xué)的鄭剛及田納西理工大學(xué)的 Forrest Sheng Bao合作,圍繞AI與腦磁圖(MEG)結(jié)合的癲癇診斷軟件展開(kāi)研究,目標(biāo)是驗(yàn)證機(jī)器學(xué)習(xí)方法在癲癇診斷中的可行性。
在具體實(shí)現(xiàn)上,他參與開(kāi)發(fā)了一套用于MRI圖像配準(zhǔn)與可視化的軟件系統(tǒng),并結(jié)合基于SAM-kurtosis algorithm(SAM[g2])計(jì)算的結(jié)果,對(duì)來(lái)自CTF腦磁圖系統(tǒng)的數(shù)據(jù)進(jìn)行處理。該項(xiàng)目源碼已開(kāi)源,并發(fā)布在Source Forge平臺(tái)。
![]()
▲MRI圖像可視化系統(tǒng)CTF-SAM-OUT的圖像演示(圖源:Source Forge)
2011年5月至2012年5月,楊寅飛擔(dān)任Longin Jan Latecki教授的研究助理,該教授是美國(guó)天普大學(xué)(Temple University)計(jì)算機(jī)與信息科學(xué)系的博士生導(dǎo)師。
![]()
▲2012年,Longin Jan Latecki教授發(fā)表論文《基于足跡檢測(cè)的跟蹤方法,實(shí)現(xiàn)對(duì)非靜態(tài)目標(biāo)物體的導(dǎo)航》,楊寅飛擔(dān)任二作(圖源:天普大學(xué)主頁(yè))
2012年至2013年,楊寅飛在美國(guó)賓夕法尼亞大學(xué)攻讀碩士學(xué)位,研究方向包括計(jì)算機(jī)視覺(jué)、機(jī)器人學(xué)和自然語(yǔ)言處理。
2013-2017年期間,他先后在亞馬遜和Redfin擔(dān)任研究工程師,負(fù)責(zé)機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)領(lǐng)域的研究。
之后,他在谷歌任職超4年,從事自然語(yǔ)言處理的研究,包括語(yǔ)義檢索(semantic retrieval)、多語(yǔ)言表示(multilingual representation)和多模態(tài)表示(multimodal representation)等。
2022年,楊寅飛擔(dān)任蘋(píng)果公司AI機(jī)器學(xué)習(xí)部門(mén)的研究科學(xué)家,主要研究視覺(jué)和語(yǔ)言基礎(chǔ)模型。
他于去年12月離開(kāi)蘋(píng)果,與戴明博一起籌劃創(chuàng)立Elorian。
02.
Elorian能同時(shí)理解圖像、視頻和音頻,
計(jì)劃融資3.5億元
戴明博在The Information的電話采訪中說(shuō),Elorian專(zhuān)注于構(gòu)建能夠通過(guò)同時(shí)處理圖像、視頻和音頻來(lái)對(duì)物理世界進(jìn)行視覺(jué)解讀和分析的AI模型。
戴明博還說(shuō),雖然機(jī)器人技術(shù)是Elorian的一個(gè)潛在應(yīng)用領(lǐng)域,但這家初創(chuàng)公司設(shè)想了許多其他應(yīng)用,不過(guò)他并未詳細(xì)說(shuō)明。楊寅飛尚未對(duì)此置評(píng)。
視覺(jué)推理模型因具備多模態(tài)功能整合能力,專(zhuān)為機(jī)器人系統(tǒng)等復(fù)雜AI應(yīng)用場(chǎng)景設(shè)計(jì),從而節(jié)省開(kāi)發(fā)人員拼接不同AI模型的工作量。
一些研究人員向外媒解釋道,這項(xiàng)技術(shù)對(duì)于需要解讀和理解圖像以執(zhí)行高級(jí)任務(wù)的AI智能體來(lái)說(shuō)非常有價(jià)值。
在融資方面,外媒據(jù)戴明博和另一位知情人士透露,初創(chuàng)公司Elorian正在與投資者洽談,計(jì)劃進(jìn)行約5000萬(wàn)美元(約合人民幣3.5億元)的種子輪融資。
該知情人士還說(shuō),由風(fēng)投公司CRV前普通合伙人Max Gazor于去年10月創(chuàng)立的風(fēng)險(xiǎn)投資公司Striker Venture Partners正在洽談?lì)I(lǐng)投此輪融資。
03.
結(jié)語(yǔ):視覺(jué)推理AI成為巨頭與創(chuàng)企關(guān)注焦點(diǎn)
從最早僅處理文本的大模型,到如今同時(shí)理解圖像、視頻與音頻的多模態(tài)系統(tǒng)。這一被稱(chēng)為視覺(jué)推理的研究領(lǐng)域,如今已成為包括谷歌、OpenAI和Anthropic在內(nèi)的眾多大型AI提供商和初創(chuàng)公司的關(guān)注焦點(diǎn)。
Elorian的出現(xiàn),正是這一浪潮中的縮影,其能否在視覺(jué)推理這一關(guān)鍵賽道中跑出差異化路徑,仍有待時(shí)間驗(yàn)證。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.