網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

ImageNet作者蘇昊回國任教復(fù)旦!具身第一高引,出任通用物理AI院長

2026-04-17 10:13:44　來源: 量子位

北京舉報(bào)

分享至

克雷西發(fā)自凹非寺
量子位 | 公眾號 QbitAI

具身智能領(lǐng)域論文被引次數(shù)最高的華人學(xué)者，帶著十七年海外積淀，回來了。

剛剛，在第五屆中國三維視覺大會（China3DV 2026）上，李飛飛弟子、ImageNet作者蘇昊正式被復(fù)旦官宣加盟。

加盟復(fù)旦后，蘇昊將擔(dān)任浩清特聘教授，領(lǐng)銜建設(shè)通用物理智能研究院并出任院長

對于蘇昊的回歸，復(fù)旦大學(xué)官方將其定義為復(fù)旦“面向智能時代的關(guān)鍵落子”。

實(shí)際上，早在官宣之前，UCSD和復(fù)旦校內(nèi)已有傳言流出，稱具身智能領(lǐng)域的領(lǐng)跑者蘇昊即將赴復(fù)旦任教。

如今靴子落地，坐實(shí)了這一場備受期待的回國。

誰是蘇昊？

蘇昊，具身智能領(lǐng)域論文被引次數(shù)最高的華人學(xué)者，ImageNet締造者之一，ShapeNet、PointNet、PartNet、SAPIEN、ManiSkill等一眾奠基級項(xiàng)目的主導(dǎo)者，具身智能公司Hillbot聯(lián)合創(chuàng)始人兼CTO。

在此之前，他是加州大學(xué)圣地亞哥分校（UCSD）計(jì)算機(jī)科學(xué)與工程系副教授，同時還是具身智能實(shí)驗(yàn)室主任。

早前，蘇昊在UCSD的個人主頁已經(jīng)停止維護(hù)、不再更新。

在蘇昊新的個人主頁上，已經(jīng)更新了在復(fù)旦的最新任職。

截至目前，其谷歌學(xué)術(shù)被引次數(shù)超過14.5萬次，在具身AI領(lǐng)域的華人學(xué)者中排名第一。

去年，他還與謝賽寧共同獲得了CVPR青年學(xué)者獎，理由是表彰他們在計(jì)算機(jī)視覺領(lǐng)域的杰出貢獻(xiàn)。

值得一提的是，蘇昊還是弋力（清華叉院助理教授）、盧策吾（穹徹智能創(chuàng)始人、上交教授）、王鶴（銀河通用創(chuàng)始人、北大助理教授）、嚴(yán)夢媛（OpenAI研究員）、莫凱淳（英偉達(dá)研究員）等一眾知名學(xué)者的師兄。

從北航到普林斯頓，再到斯坦福

2002年，蘇昊進(jìn)入北京航空航天大學(xué)攻讀計(jì)算機(jī)科學(xué)本科，是北航高等理工學(xué)院的第一屆學(xué)員。

本科期間，他師從中科院院士、前北航校長李未教授，研究數(shù)理邏輯與定理自動證明。

2005年，經(jīng)李未教授推薦，他前往微軟亞洲研究院（MSRA）實(shí)習(xí)，師從孫劍、沈向洋、周明。

彼時他主攻自然語言處理，但隨著研究深入，他逐漸意識到，相較于抽象的語言，直接來自物理世界的信號（如視覺）才是理解智能更根本的途徑

蘇昊的研究重心，也由此轉(zhuǎn)向計(jì)算機(jī)視覺。

2008年，在沈向洋的推薦下，蘇昊先后在普林斯頓和斯坦福參與了ImageNet項(xiàng)目，并在2009年跟隨李飛飛正式轉(zhuǎn)入斯坦福

ImageNet這一奠基性數(shù)據(jù)集，后來推動了近二十年的人工智能浪潮。

在ImageNet之后，蘇昊與李佳合作了Object Bank，進(jìn)一步提升了圖像在高層視覺任務(wù)中的語義表示能力，使得簡單分類器也能在物體識別和場景分類等任務(wù)上取得優(yōu)異性能，這篇研究發(fā)表于2010年的NIPS上。

3D視覺的奠基人

當(dāng)2D視覺的方法論日趨完善后，蘇昊將目光轉(zhuǎn)向3D視覺。

2014年，在獲得北航數(shù)學(xué)博士學(xué)位后的他，在Leonidas Guibas指導(dǎo)下于斯坦福攻讀計(jì)算機(jī)博士，主攻三維感知。

2015年，他發(fā)布ShapeNet——全球第一個大規(guī)模3D數(shù)據(jù)集，包含逾300萬個3D CAD模型，涵蓋3135個類別，被外界譽(yù)為“3D領(lǐng)域的ImageNet”。

ShapeNet發(fā)布后，3D視覺研究隨即進(jìn)入黃金發(fā)展期。

2017年，PointNet與PointNet++相繼發(fā)布，讓3D視覺相關(guān)論文在頂會的占比從不足10%躍升至70%。

其中PointNet是首個直接處理原始點(diǎn)云數(shù)據(jù)的深度學(xué)習(xí)模型，而PointNet++則進(jìn)一步捕捉點(diǎn)云中的局部結(jié)構(gòu)信息。

這兩項(xiàng)工作，如今已廣泛應(yīng)用于自動駕駛系統(tǒng)。

2018年獲得斯坦福計(jì)算機(jī)博士后，蘇昊又發(fā)布了3D物體數(shù)據(jù)集PartNet，并入職加州大學(xué)圣地亞哥分校。

從視覺到具身

感知之后，蘇昊的下一個問題是，能不能把具體的感知算法整合進(jìn)一個更大的系統(tǒng)

這一思考，驅(qū)動他從計(jì)算機(jī)視覺遷移到機(jī)器人研究。

2020年，他基于PartNet發(fā)布了全球第一個以可泛化操作為核心的模擬器——SAPIEN（命名靈感來自《人類簡史》中的“智人”），為機(jī)器人視覺與交互任務(wù)的研究搭建了關(guān)鍵基礎(chǔ)設(shè)施。

2021年，他又在此基礎(chǔ)上推出ManiSkill機(jī)器人操作仿真平臺，用于測試和訓(xùn)練機(jī)器人操作技能。

同年ICCV，蘇昊發(fā)起workshop，聚焦基于物理的建模與仿真、基于學(xué)習(xí)的仿真、人體仿真到具身視覺和機(jī)器人學(xué)習(xí)等廣泛主題。

這些成果，也延續(xù)到了蘇昊創(chuàng)辦的具身智能公司Hillbot上。

2024年，蘇昊加入了具身智能的創(chuàng)業(yè)浪潮，創(chuàng)辦了Hillbot，并擔(dān)任首席技術(shù)官。

Hillbot旗下?lián)碛械膬蓮埻跖疲翘K昊此前發(fā)布的SAPIEN仿真器及ManiSkill訓(xùn)練平臺，主打模擬與3D生成。

另外，Hillbot已與英偉達(dá)合作，借助Nvidia Cosmos平臺生成高仿真視頻訓(xùn)練數(shù)據(jù)。

產(chǎn)品方面，Hillbot推出了輪式機(jī)器人Hillbot Alpha，基于仿真訓(xùn)練，主要用于復(fù)雜環(huán)境下的移動操縱任務(wù)，如零售店、咖啡館和制造車間等。

為什么選擇復(fù)旦？

對于加盟復(fù)旦這個選擇，蘇昊給出了簡潔而堅(jiān)定的解釋：

因?yàn)閺?fù)旦要做的事，與我要做的事，是同一件事。

那件事，指的便是推動“物理智能”的最終實(shí)現(xiàn)

所謂物理智能，是讓AI系統(tǒng)在物理世界中有效完成任務(wù)——既能理解這個世界，也能執(zhí)行恰當(dāng)?shù)男袆印?/p>

在蘇昊看來，這不僅是算法問題，更涉及機(jī)器人實(shí)體、多學(xué)科交融，以及一個完善的產(chǎn)業(yè)生態(tài)。

他看中復(fù)旦的理由具體而落地，復(fù)旦擁有深厚的數(shù)學(xué)、物理學(xué)科根基，積極推進(jìn)的新工科建設(shè)，以及地處上海和長三角中心的產(chǎn)業(yè)與區(qū)位優(yōu)勢。

以此為目標(biāo)，加盟復(fù)旦后，蘇昊將領(lǐng)銜建設(shè)通用物理智能研究院

該學(xué)院依托復(fù)旦大學(xué)智能機(jī)器人與先進(jìn)制造創(chuàng)新學(xué)院，打破傳統(tǒng)院系劃分，不設(shè)學(xué)科邊界，完全圍繞問題導(dǎo)向，匯聚數(shù)學(xué)、物理、計(jì)算機(jī)、人機(jī)交互、腦機(jī)接口等多領(lǐng)域頂尖人才。

他直言，研究院的目標(biāo)是培養(yǎng)未來5到10年的人工智能領(lǐng)軍人物

在人才培養(yǎng)理念上，他強(qiáng)調(diào)兩點(diǎn)——高品位的科研眼光（知道什么問題值得做）和長周期的探索耐心（愿意把問題做完）。

論文不是目標(biāo)，而是副產(chǎn)品。真正的標(biāo)尺，是能否在真實(shí)世界中實(shí)現(xiàn)智能體的有效行動與自主決策。

研究院將重構(gòu)課程體系，縮短從基礎(chǔ)到前沿的路徑，讓學(xué)生盡早進(jìn)入科研與實(shí)踐，同時大力支持師生創(chuàng)新創(chuàng)業(yè)，推動成果轉(zhuǎn)化。

具身智能：樂觀，但謹(jǐn)慎

對于當(dāng)下火熱的具身智能賽道，蘇昊的判斷是“謹(jǐn)慎的樂觀”。

樂觀的底氣來自問題本身，因?yàn)?strong>這是一個既有科學(xué)深度、又有巨大產(chǎn)業(yè)潛力的真問題

謹(jǐn)慎則來自于現(xiàn)實(shí)，因?yàn)楫?dāng)前涌現(xiàn)出的大量精彩演示，與真正的通用能力之間，仍存在關(guān)鍵斷層。

而填補(bǔ)這一斷層的核心，正是物理智能。

談到“具身智能的ChatGPT時刻”，蘇昊坦言，短期內(nèi)實(shí)現(xiàn)大語言模型那種程度的泛化還不現(xiàn)實(shí)，但在更長時間尺度上，方向是清晰的。

他預(yù)見，具身智能將深度滲透制造業(yè)、服務(wù)業(yè)、養(yǎng)老行業(yè)等領(lǐng)域，最終推動人類走向“人機(jī)正面互動、人機(jī)共存的時代”。

而通往那一未來的橋梁，正建立在今天對物理智能的扎實(shí)探索之上。

蘇昊從中國出發(fā)，一路從2D到3D，從視覺到具身，一步步打通“讓機(jī)器理解世界”的關(guān)鍵路徑。

如今，他帶著這一切回來了——落腳復(fù)旦，直面物理智能這道真正的難題。

世界級AI科學(xué)家的加盟，也把復(fù)旦在AI和具身智能，推向了世界最前沿。

[1]https://mp.weixin.qq.com/s/sv768xtTCHv6Uy9qbD92EA
[2]https://www.haosu.ai/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.