![]()
修宇亮將在GAIR大會上帶來三項數字人領域的最新研究成果。
作者丨代聰飛
編輯丨馬曉寧
![]()
2025年 12 月 12-13 日,由 GAIR 研究院與雷峰網聯合主辦的「第八屆 GAIR 全球人工智能與機器人大會」,將在深圳南山·博林天瑞喜來登酒店舉辦。
今年大會,將開設三個主題論壇,聚焦大模型、算力變革、世界模型等多個議題,描繪 AI 最前沿的探索群像,折射學界與產業界共建的智能未來。
西湖大學助理教授、遠兮實驗室負責人修宇亮也將蒞臨 12 月 13 日《世界模型》論壇,帶來《走出蠟像館,交互新世界:開拓三維數字人研究新疆域》的主題演講。
當 AI 生成技術重塑內容創作生態,數字人已從影視特效場景走向直播、運動、教育等領域,但多數模型仍存在不同的問題,或是姿勢僵硬難以動彈,或是動作變形丟失細節。
12月13日,西湖大學助理教授、遠兮實驗室負責人修宇亮將帶來數字人研究領域的最新成果分享。
修宇亮一直致力于數字人方面的研究,從《ICON》破局三維數字人姿態重建方法的不足,到如今深入到數字人的交互模式。
2025年,修宇亮加入西湖大學,擔任遠兮實驗室負責人。
01
打破常規,90后西湖大學博導獲超高人氣
西湖大學一貫以博導姓名命名實驗室,但修宇亮加入后,一改慣例,選擇用“遠兮”為他的實驗室命名。
修宇亮是西湖大學最年輕的博導之一,1993年出生的他加入西湖大學后,很快展示出極高的人氣。他在知乎上發的《【英雄帖】西湖大學遠兮實驗室招生》收獲了1000+的贊同,700+的收藏。
在文章中,修宇亮對“遠兮”的來源這樣解釋,“遠兮實驗室”這個名字,取自“路漫漫其修遠兮,吾將上下而求索”。
修宇亮在文中坦言:“我也是剛從學生身份切換過來,對博士生活的苦與樂感同身受,深知博士研究對于絕大多數人來講都是要扒一層皮的。作為導師,除了學術指導,也需要提供足夠的情緒價值,幫大家挺過那一個個捶胸頓足的夜晚,守得云開見月明。”
從本科到博士,修宇亮從山東大學的數字傳媒技術專業起步,求學近十年,成為數字人領域的資深研究者。
修宇亮是一個地道的山東人,2016年,從山東大學本科畢業后,修宇亮走出山東, 奔赴上海求學。2019年,修宇亮從上海交通大學獲得計算機碩士學位。
此后,他又遠赴美國南加州大學 (USC) 和德國馬普所 (MPI-IS)求學。獲得馬克斯·普朗克智能系統研究所(MPI-IS)感知系統專業博士學位 。
修宇亮在視覺/圖形學/機器學習頂刊頂會 TOG、SIGGRAPH、TPAMI、CVPR、ICCV、NeurIPS、ICLR 等發表論文 20余篇,谷歌學術引用 2800 余次,主導開源項目獲 Github星標 13000 余次。
修宇亮研究方向圍繞數字人、三維視覺、圖形學與虛擬現實等方向。2022年,修宇亮團隊發表《ICON: Implicit Clothed humans Obtained from Normals》(以下簡稱《ICON》)論文,顯著提高了單張圖像重建三維數字人的姿勢水平。
ICON 的任務是給一張彩色圖片,將二維紙片人,還原成擁有豐富幾何細節的三維數字人。在此之前,圍繞這一目標,已經有一些研究,但始終沒有很好解決速度慢和姿勢魯棒性差兩大難題。
修宇亮團隊在 CVPR 發表的《ICON》論文為兩大難題提供了一個基礎的破局方案。ICON 在思路上借鑒了很多相關工作,包括 PIFuHD 里面的法向圖(Normal Image), PaMIR 用 SMPL body 做幾何空間約束。SMPL body 提供了一個粗糙的人體幾何,而法向圖則包含了豐富的衣服褶皺細節。
大體上,ICON的思路是:SMPL 輔助 normal 預測;normal 幫助優化 SMPL;舍棄 global encoder。
ICON簡化了3D虛擬人的創建過程,不再需要大量藝術家的工作和昂貴的掃描設備。只需一到幾張圖片,就能生成3D穿著化身,這為混合現實和增強現實應用開辟了新的道路,使得用戶能夠更便捷地自定義和操控自己的虛擬形象。
ICON只是修宇亮研究的一個起點。修宇亮團隊在之后進一步發表了《ECON: Explicit Clothed humans Optimized via Normal integration》,ECON解決了以往方法在重建寬松衣物或復雜姿態人體時易出現形狀畸變、拓撲缺陷等問題。
02
實驗室出發,決心做“會格斗的數字人”
一位高中生看到修宇亮在平臺發表的西湖大學招生貼(《【英雄帖】西湖大學遠兮實驗室招生》)后,在面試西湖大學的本科時表示,“研究會格斗的數字人,聽起來就很有趣。”
在西湖大學個人主頁,修宇亮寫道,“較長期的,我們將嘗試把人工智能技術應用于武術格斗領域。”
修宇亮認為,格斗,是人類掌握的最復雜的交互動作之一,在相同的肌肉強度和裝備下,戰力即智力。對武術機理的研究,將有助于我們更好地理解人體結構,研究生物力學(Biomechanics),這對運動分析和醫療保健具有潛在的產業價值。
此前,修宇亮的代表成果 ICON 和 ECON 系列已經被《紐約時報》應用于2022 年世界杯和 2023 年超級碗的賽事報道中,輔助精彩進球回放和戰術分析。
數字人研究課題可大致劃分為 “靜態” 與 “動態” 兩大方向。其中,靜態方向核心聚焦人的外表(如服裝、頭發、人臉等),目標是實現 “栩栩如生” 的視覺效果;動態方向則側重研究人的動作(如手部操作、全身運動)及與環境物體的交互,目標是達成 “活靈活現” 的動態表現。
12 月 13 日上午 10:30-11:00 的世界模型分論壇上,修宇亮將帶來遠兮實驗室的最新研究成果,從靜態走向動態,探索人與環境交互的可能性。
具體而言,修宇亮主要分享三項成果:一是,基于 “臟數據” 的個性化建模(UP2You);二是,從三維著裝人物中精準解析人體參數(ETCH);三是,從海量互聯網視頻中實時、一步到位地完成人物動作捕捉與三維環境重建(Human3R),該成果亦是探索人與環境交互、乃至構建立體世界觀的關鍵基礎。
讓我們共同期待修宇亮12月13日帶來數字人領域的精彩分享。
12月13日上午,GAIR 2025 世界模型專場,眾多嘉賓將圍繞“走向可交互的 3D AI 世界模型”主題展開精彩分享,敬請關注。
![]()
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!
公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.