- 克雷西 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
具身智能領(lǐng)域論文被引次數(shù)最高的華人學(xué)者,帶著十七年海外積淀,回來了。
剛剛,在第五屆中國三維視覺大會(China3DV 2026)上,李飛飛弟子、ImageNet作者蘇昊正式被復(fù)旦官宣加盟。
加盟復(fù)旦后,蘇昊將擔(dān)任浩清特聘教授,領(lǐng)銜建設(shè)通用物理智能研究院并出任院長
![]()
對于蘇昊的回歸,復(fù)旦大學(xué)官方將其定義為復(fù)旦“面向智能時代的關(guān)鍵落子”。
實(shí)際上,早在官宣之前,UCSD和復(fù)旦校內(nèi)已有傳言流出,稱具身智能領(lǐng)域的領(lǐng)跑者蘇昊即將赴復(fù)旦任教。
如今靴子落地,坐實(shí)了這一場備受期待的回國。
誰是蘇昊?
蘇昊,具身智能領(lǐng)域論文被引次數(shù)最高的華人學(xué)者,ImageNet締造者之一,ShapeNet、PointNet、PartNet、SAPIEN、ManiSkill等一眾奠基級項(xiàng)目的主導(dǎo)者,具身智能公司Hillbot聯(lián)合創(chuàng)始人兼CTO。
在此之前,他是加州大學(xué)圣地亞哥分校(UCSD)計(jì)算機(jī)科學(xué)與工程系副教授,同時還是具身智能實(shí)驗(yàn)室主任。
早前,蘇昊在UCSD的個人主頁已經(jīng)停止維護(hù)、不再更新。
![]()
在蘇昊新的個人主頁上,已經(jīng)更新了在復(fù)旦的最新任職。
![]()
截至目前,其谷歌學(xué)術(shù)被引次數(shù)超過14.5萬次,在具身AI領(lǐng)域的華人學(xué)者中排名第一。
![]()
去年,他還與謝賽寧共同獲得了CVPR青年學(xué)者獎,理由是表彰他們在計(jì)算機(jī)視覺領(lǐng)域的杰出貢獻(xiàn)。
![]()
值得一提的是,蘇昊還是弋力(清華叉院助理教授)、盧策吾(穹徹智能創(chuàng)始人、上交教授)、王鶴(銀河通用創(chuàng)始人、北大助理教授)、嚴(yán)夢媛(OpenAI研究員)、莫凱淳(英偉達(dá)研究員)等一眾知名學(xué)者的師兄。
從北航到普林斯頓,再到斯坦福
2002年,蘇昊進(jìn)入北京航空航天大學(xué)攻讀計(jì)算機(jī)科學(xué)本科,是北航高等理工學(xué)院的第一屆學(xué)員。
本科期間,他師從中科院院士、前北航校長李未教授,研究數(shù)理邏輯與定理自動證明。
2005年,經(jīng)李未教授推薦,他前往微軟亞洲研究院(MSRA)實(shí)習(xí),師從孫劍、沈向洋、周明。
彼時他主攻自然語言處理,但隨著研究深入,他逐漸意識到,相較于抽象的語言,直接來自物理世界的信號(如視覺)才是理解智能更根本的途徑
蘇昊的研究重心,也由此轉(zhuǎn)向計(jì)算機(jī)視覺。
2008年,在沈向洋的推薦下,蘇昊先后在普林斯頓和斯坦福參與了ImageNet項(xiàng)目,并在2009年跟隨李飛飛正式轉(zhuǎn)入斯坦福
![]()
ImageNet這一奠基性數(shù)據(jù)集,后來推動了近二十年的人工智能浪潮。
在ImageNet之后,蘇昊與李佳合作了Object Bank,進(jìn)一步提升了圖像在高層視覺任務(wù)中的語義表示能力,使得簡單分類器也能在物體識別和場景分類等任務(wù)上取得優(yōu)異性能,這篇研究發(fā)表于2010年的NIPS上。
![]()
3D視覺的奠基人
當(dāng)2D視覺的方法論日趨完善后,蘇昊將目光轉(zhuǎn)向3D視覺。
2014年,在獲得北航數(shù)學(xué)博士學(xué)位后的他,在Leonidas Guibas指導(dǎo)下于斯坦福攻讀計(jì)算機(jī)博士,主攻三維感知。
2015年,他發(fā)布ShapeNet——全球第一個大規(guī)模3D數(shù)據(jù)集,包含逾300萬個3D CAD模型,涵蓋3135個類別,被外界譽(yù)為“3D領(lǐng)域的ImageNet”。
![]()
ShapeNet發(fā)布后,3D視覺研究隨即進(jìn)入黃金發(fā)展期。
2017年,PointNet與PointNet++相繼發(fā)布,讓3D視覺相關(guān)論文在頂會的占比從不足10%躍升至70%。
其中PointNet是首個直接處理原始點(diǎn)云數(shù)據(jù)的深度學(xué)習(xí)模型,而PointNet++則進(jìn)一步捕捉點(diǎn)云中的局部結(jié)構(gòu)信息。
這兩項(xiàng)工作,如今已廣泛應(yīng)用于自動駕駛系統(tǒng)。
![]()
2018年獲得斯坦福計(jì)算機(jī)博士后,蘇昊又發(fā)布了3D物體數(shù)據(jù)集PartNet,并入職加州大學(xué)圣地亞哥分校。
從視覺到具身
感知之后,蘇昊的下一個問題是,能不能把具體的感知算法整合進(jìn)一個更大的系統(tǒng)
這一思考,驅(qū)動他從計(jì)算機(jī)視覺遷移到機(jī)器人研究。
2020年,他基于PartNet發(fā)布了全球第一個以可泛化操作為核心的模擬器——SAPIEN(命名靈感來自《人類簡史》中的“智人”),為機(jī)器人視覺與交互任務(wù)的研究搭建了關(guān)鍵基礎(chǔ)設(shè)施。
![]()
2021年,他又在此基礎(chǔ)上推出ManiSkill機(jī)器人操作仿真平臺,用于測試和訓(xùn)練機(jī)器人操作技能。
![]()
同年ICCV,蘇昊發(fā)起workshop,聚焦基于物理的建模與仿真、基于學(xué)習(xí)的仿真、人體仿真到具身視覺和機(jī)器人學(xué)習(xí)等廣泛主題。
![]()
這些成果,也延續(xù)到了蘇昊創(chuàng)辦的具身智能公司Hillbot上。
2024年,蘇昊加入了具身智能的創(chuàng)業(yè)浪潮,創(chuàng)辦了Hillbot,并擔(dān)任首席技術(shù)官。
![]()
Hillbot旗下?lián)碛械膬蓮埻跖疲翘K昊此前發(fā)布的SAPIEN仿真器及ManiSkill訓(xùn)練平臺,主打模擬與3D生成。
另外,Hillbot已與英偉達(dá)合作,借助Nvidia Cosmos平臺生成高仿真視頻訓(xùn)練數(shù)據(jù)。
產(chǎn)品方面,Hillbot推出了輪式機(jī)器人Hillbot Alpha,基于仿真訓(xùn)練,主要用于復(fù)雜環(huán)境下的移動操縱任務(wù),如零售店、咖啡館和制造車間等。
![]()
為什么選擇復(fù)旦?
對于加盟復(fù)旦這個選擇,蘇昊給出了簡潔而堅(jiān)定的解釋:
- 因?yàn)閺?fù)旦要做的事,與我要做的事,是同一件事。
那件事,指的便是推動“物理智能”的最終實(shí)現(xiàn)
所謂物理智能,是讓AI系統(tǒng)在物理世界中有效完成任務(wù)——既能理解這個世界,也能執(zhí)行恰當(dāng)?shù)男袆印?/p>
在蘇昊看來,這不僅是算法問題,更涉及機(jī)器人實(shí)體、多學(xué)科交融,以及一個完善的產(chǎn)業(yè)生態(tài)。
他看中復(fù)旦的理由具體而落地,復(fù)旦擁有深厚的數(shù)學(xué)、物理學(xué)科根基,積極推進(jìn)的新工科建設(shè),以及地處上海和長三角中心的產(chǎn)業(yè)與區(qū)位優(yōu)勢。
![]()
以此為目標(biāo),加盟復(fù)旦后,蘇昊將領(lǐng)銜建設(shè)通用物理智能研究院
該學(xué)院依托復(fù)旦大學(xué)智能機(jī)器人與先進(jìn)制造創(chuàng)新學(xué)院,打破傳統(tǒng)院系劃分,不設(shè)學(xué)科邊界,完全圍繞問題導(dǎo)向,匯聚數(shù)學(xué)、物理、計(jì)算機(jī)、人機(jī)交互、腦機(jī)接口等多領(lǐng)域頂尖人才。
他直言,研究院的目標(biāo)是培養(yǎng)未來5到10年的人工智能領(lǐng)軍人物
在人才培養(yǎng)理念上,他強(qiáng)調(diào)兩點(diǎn)——高品位的科研眼光(知道什么問題值得做)和長周期的探索耐心(愿意把問題做完)。
- 論文不是目標(biāo),而是副產(chǎn)品。真正的標(biāo)尺,是能否在真實(shí)世界中實(shí)現(xiàn)智能體的有效行動與自主決策。
研究院將重構(gòu)課程體系,縮短從基礎(chǔ)到前沿的路徑,讓學(xué)生盡早進(jìn)入科研與實(shí)踐,同時大力支持師生創(chuàng)新創(chuàng)業(yè),推動成果轉(zhuǎn)化。
具身智能:樂觀,但謹(jǐn)慎
對于當(dāng)下火熱的具身智能賽道,蘇昊的判斷是“謹(jǐn)慎的樂觀”。
樂觀的底氣來自問題本身,因?yàn)?strong>這是一個既有科學(xué)深度、又有巨大產(chǎn)業(yè)潛力的真問題
謹(jǐn)慎則來自于現(xiàn)實(shí),因?yàn)楫?dāng)前涌現(xiàn)出的大量精彩演示,與真正的通用能力之間,仍存在關(guān)鍵斷層。
而填補(bǔ)這一斷層的核心,正是物理智能。
![]()
談到“具身智能的ChatGPT時刻”,蘇昊坦言,短期內(nèi)實(shí)現(xiàn)大語言模型那種程度的泛化還不現(xiàn)實(shí),但在更長時間尺度上,方向是清晰的。
他預(yù)見,具身智能將深度滲透制造業(yè)、服務(wù)業(yè)、養(yǎng)老行業(yè)等領(lǐng)域,最終推動人類走向“人機(jī)正面互動、人機(jī)共存的時代”。
而通往那一未來的橋梁,正建立在今天對物理智能的扎實(shí)探索之上。
蘇昊從中國出發(fā),一路從2D到3D,從視覺到具身,一步步打通“讓機(jī)器理解世界”的關(guān)鍵路徑。
如今,他帶著這一切回來了——落腳復(fù)旦,直面物理智能這道真正的難題。
世界級AI科學(xué)家的加盟,也把復(fù)旦在AI和具身智能,推向了世界最前沿。
[1]https://mp.weixin.qq.com/s/sv768xtTCHv6Uy9qbD92EA
[2]https://www.haosu.ai/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.