![]()
谷歌工作了14年的戴明博,與蘋果的楊寅飛共同創立了Elorian。
編譯 |萬貴霞
編輯 |云鵬
智東西1月14日消息,據美國科技媒體The Information報道,兩位科技大廠前AI研究員——谷歌DeepMind前成員戴明博(Andrew Dai)與蘋果前研究科學家楊寅飛(Yinfei Yang),聯合創立了Elorian公司。該公司專注于開發能夠同時理解和處理文本、圖像、視頻及音頻的AI模型。
目前,Elorian正在推進一輪規模達5000萬美元(約合人民幣3.5億元)的種子輪融資,Striker Venture Partners有望成為本輪領投方,雙方洽談已進入關鍵階段。
戴明博出身于高知家庭,他父親是機構學和機器人學領域大佬戴建生。作為Elorian的CEO,他之前在谷歌DeepMind任職超14年,負責數據驅動型預訓練相關工作。他深耕深度學習領域20年,曾在劍橋大學、愛丁堡大學攻讀過學位,是機器學習方向的博士。
Elorian另一位聯合創始人楊寅飛,學生時期曾在南京郵電大學Echo實驗室,參與差分進化算法參數控制相關研究,畢業作品Apollo3D(阿波羅3D)獲蘇州機器人世界杯第五名。他還參與癲癇診斷研究,開發MRI圖像配準與可視化系統,之后在美國賓夕法尼亞大學攻讀碩士學位。
在AI創業從“拼應用”轉向“拼底層能力”的背景下,具備長期基礎模型研究經驗的華人科學家正加速走向創業前臺,Elorian成為近期視覺AI賽道中備受關注的案例之一。
01.
前谷歌DeepMind與蘋果研究員聯合創業
據The Information報道,Elorian公司由戴明博與楊寅飛聯合創立。
戴明博與楊寅飛的領英個人資料顯示,二人目前就職于一家“隱形(Stealth)”狀態的公司,戴明博是該公司的CEO。
業內普遍認為,這家“隱形”公司很可能是Elorian。
![]()
▲“隱形(Stealth)”的領英主頁資料(圖源:領英)
1、戴明博,深耕DeepMind 14年,擔任Gemini預訓練工作
據戴明博領英個人資料顯示,他在谷歌DeepMind工作超過14年,是Gemini數據領域的聯合負責人,擔任Gemini預訓練工作。
此前,戴明博曾參與谷歌SGE的建模工作,在谷歌大腦(Google Brain)從事自然語言處理研究,在谷歌健康(Google Health)從事電子健康記錄研究,并參與了Google Now的開發。
![]()
▲戴明博(圖源:領英)
在領英自我介紹中,戴明博寫到自己在深度學習領域擁有豐富經驗,研究方向包括自然語言理解和大型語言模型。
戴明博2003-2006年在英國劍橋大學計算機科學專業學習;2007-2012年在愛丁堡大學攻讀機器學習博士。
他過去20年來一直從事預訓練相關研究。其研究主要集中在開發評估AI模型訓練數據質量的技術,并確保模型使用來自各種不同來源的數據進行訓練。
據相關報道消息,戴明博出生于高知家庭,他的曾祖父畢業于金陵大學(南京大學前身),爺爺畢業于廈門大學土木工程系。
戴明博的爸爸則是開辟了國際機構學和機器人學研究新領域的大佬、現南方科技大學機器人研究院院長戴建生。
![]()
▲戴明博在福建莆田的家庭合照,右下1為戴建生,左上1為戴明博(圖源:公眾號angrysprite不可言喻)
可能受父親的耳濡目染,戴明博也攻讀機器學習相關專業,從事谷歌DeepMind相關工作,且創立了Elorian公司。
2、楊寅飛,橫跨谷歌蘋果,主攻視覺和語言多模態模型領域
楊寅飛領英主頁資料顯示,他于2022年1月加入蘋果,擔任蘋果公司AI機器學習部門的研究科學家。
![]()
▲楊寅飛(圖源:谷歌楊寅飛主頁)
楊寅飛在學生階段就開始接觸行業相關工作。據楊寅飛的谷歌個人介紹,2007年12月至2009年7月,他曾作為研究助理在南京郵電大學Echo實驗室進化計算研究組工作,參與設計了一種用于控制差分進化算法參數的新方法。
在本科階段,楊寅飛完成的畢業作品名為Apollo3D(阿波羅3D),主要用于Robocup足球模擬器中的Simu-Robot動作設計。該作品曾在蘇州機器人世界杯比賽中獲得第五名。
![]()
▲楊寅飛的畢業作品Apollo3D圖像演示(圖源:Source Forge)
2010年5月至10月,楊寅飛參與了一項跨校、跨國合作研究,與南京航空航天大學的鄭剛及田納西理工大學的 Forrest Sheng Bao合作,圍繞AI與腦磁圖(MEG)結合的癲癇診斷軟件展開研究,目標是驗證機器學習方法在癲癇診斷中的可行性。
在具體實現上,他參與開發了一套用于MRI圖像配準與可視化的軟件系統,并結合基于SAM-kurtosis algorithm(SAM[g2])計算的結果,對來自CTF腦磁圖系統的數據進行處理。該項目源碼已開源,并發布在Source Forge平臺。
![]()
▲MRI圖像可視化系統CTF-SAM-OUT的圖像演示(圖源:Source Forge)
2011年5月至2012年5月,楊寅飛擔任Longin Jan Latecki教授的研究助理,該教授是美國天普大學(Temple University)計算機與信息科學系的博士生導師。
![]()
▲2012年,Longin Jan Latecki教授發表論文《基于足跡檢測的跟蹤方法,實現對非靜態目標物體的導航》,楊寅飛擔任二作(圖源:天普大學主頁)
2012年至2013年,楊寅飛在美國賓夕法尼亞大學攻讀碩士學位,研究方向包括計算機視覺、機器人學和自然語言處理。
2013-2017年期間,他先后在亞馬遜和Redfin擔任研究工程師,負責機器學習和計算機視覺領域的研究。
之后,他在谷歌任職超4年,從事自然語言處理的研究,包括語義檢索(semantic retrieval)、多語言表示(multilingual representation)和多模態表示(multimodal representation)等。
2022年,楊寅飛擔任蘋果公司AI機器學習部門的研究科學家,主要研究視覺和語言基礎模型。
他于去年12月離開蘋果,與戴明博一起籌劃創立Elorian。
02.
Elorian能同時理解圖像、視頻和音頻,
計劃融資3.5億元
戴明博在The Information的電話采訪中說,Elorian專注于構建能夠通過同時處理圖像、視頻和音頻來對物理世界進行視覺解讀和分析的AI模型。
戴明博還說,雖然機器人技術是Elorian的一個潛在應用領域,但這家初創公司設想了許多其他應用,不過他并未詳細說明。楊寅飛尚未對此置評。
視覺推理模型因具備多模態功能整合能力,專為機器人系統等復雜AI應用場景設計,從而節省開發人員拼接不同AI模型的工作量。
一些研究人員向外媒解釋道,這項技術對于需要解讀和理解圖像以執行高級任務的AI智能體來說非常有價值。
在融資方面,外媒據戴明博和另一位知情人士透露,初創公司Elorian正在與投資者洽談,計劃進行約5000萬美元(約合人民幣3.5億元)的種子輪融資。
該知情人士還說,由風投公司CRV前普通合伙人Max Gazor于去年10月創立的風險投資公司Striker Venture Partners正在洽談領投此輪融資。
03.
結語:視覺推理AI成為巨頭與創企關注焦點
從最早僅處理文本的大模型,到如今同時理解圖像、視頻與音頻的多模態系統。這一被稱為視覺推理的研究領域,如今已成為包括谷歌、OpenAI和Anthropic在內的眾多大型AI提供商和初創公司的關注焦點。
Elorian的出現,正是這一浪潮中的縮影,其能否在視覺推理這一關鍵賽道中跑出差異化路徑,仍有待時間驗證。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.