網易首頁 > 網易號 > 正文申請入駐

西湖大學修宇亮，想做「會格斗的數字人」丨GAIR 2025

2025-12-05 08:04:29　來源: AI科技評論

廣東舉報

分享至

修宇亮將在GAIR大會上帶來三項數字人領域的最新研究成果。

作者丨代聰飛

編輯丨馬曉寧

2025年 12 月 12-13 日，由 GAIR 研究院與雷峰網聯合主辦的「第八屆 GAIR 全球人工智能與機器人大會」，將在深圳南山·博林天瑞喜來登酒店舉辦。

今年大會，將開設三個主題論壇，聚焦大模型、算力變革、世界模型等多個議題，描繪 AI 最前沿的探索群像，折射學界與產業界共建的智能未來。

西湖大學助理教授、遠兮實驗室負責人修宇亮也將蒞臨 12 月 13 日《世界模型》論壇，帶來《走出蠟像館，交互新世界：開拓三維數字人研究新疆域》的主題演講。

當 AI 生成技術重塑內容創作生態，數字人已從影視特效場景走向直播、運動、教育等領域，但多數模型仍存在不同的問題，或是姿勢僵硬難以動彈，或是動作變形丟失細節。

12月13日，西湖大學助理教授、遠兮實驗室負責人修宇亮將帶來數字人研究領域的最新成果分享。

修宇亮一直致力于數字人方面的研究，從《ICON》破局三維數字人姿態重建方法的不足，到如今深入到數字人的交互模式。

2025年，修宇亮加入西湖大學，擔任遠兮實驗室負責人。

打破常規，90后西湖大學博導獲超高人氣

西湖大學一貫以博導姓名命名實驗室，但修宇亮加入后，一改慣例，選擇用“遠兮”為他的實驗室命名。

修宇亮是西湖大學最年輕的博導之一，1993年出生的他加入西湖大學后，很快展示出極高的人氣。他在知乎上發的《【英雄帖】西湖大學遠兮實驗室招生》收獲了1000+的贊同，700+的收藏。

在文章中，修宇亮對“遠兮”的來源這樣解釋，“遠兮實驗室”這個名字，取自“路漫漫其修遠兮，吾將上下而求索”。

修宇亮在文中坦言：“我也是剛從學生身份切換過來，對博士生活的苦與樂感同身受，深知博士研究對于絕大多數人來講都是要扒一層皮的。作為導師，除了學術指導，也需要提供足夠的情緒價值，幫大家挺過那一個個捶胸頓足的夜晚，守得云開見月明。”

從本科到博士，修宇亮從山東大學的數字傳媒技術專業起步，求學近十年，成為數字人領域的資深研究者。

修宇亮是一個地道的山東人，2016年，從山東大學本科畢業后，修宇亮走出山東，奔赴上海求學。2019年，修宇亮從上海交通大學獲得計算機碩士學位。

此后，他又遠赴美國南加州大學 (USC) 和德國馬普所 (MPI-IS)求學。獲得馬克斯·普朗克智能系統研究所（MPI-IS）感知系統專業博士學位。

修宇亮在視覺/圖形學/機器學習頂刊頂會 TOG、SIGGRAPH、TPAMI、CVPR、ICCV、NeurIPS、ICLR 等發表論文 20余篇，谷歌學術引用 2800 余次，主導開源項目獲 Github星標 13000 余次。

修宇亮研究方向圍繞數字人、三維視覺、圖形學與虛擬現實等方向。2022年，修宇亮團隊發表《ICON: Implicit Clothed humans Obtained from Normals》（以下簡稱《ICON》）論文，顯著提高了單張圖像重建三維數字人的姿勢水平。

ICON 的任務是給一張彩色圖片，將二維紙片人，還原成擁有豐富幾何細節的三維數字人。在此之前，圍繞這一目標，已經有一些研究，但始終沒有很好解決速度慢和姿勢魯棒性差兩大難題。

修宇亮團隊在 CVPR 發表的《ICON》論文為兩大難題提供了一個基礎的破局方案。ICON 在思路上借鑒了很多相關工作，包括 PIFuHD 里面的法向圖（Normal Image）， PaMIR 用 SMPL body 做幾何空間約束。SMPL body 提供了一個粗糙的人體幾何，而法向圖則包含了豐富的衣服褶皺細節。

大體上，ICON的思路是：SMPL 輔助 normal 預測；normal 幫助優化 SMPL；舍棄 global encoder。

ICON簡化了3D虛擬人的創建過程，不再需要大量藝術家的工作和昂貴的掃描設備。只需一到幾張圖片，就能生成3D穿著化身，這為混合現實和增強現實應用開辟了新的道路，使得用戶能夠更便捷地自定義和操控自己的虛擬形象。

ICON只是修宇亮研究的一個起點。修宇亮團隊在之后進一步發表了《ECON: Explicit Clothed humans Optimized via Normal integration》，ECON解決了以往方法在重建寬松衣物或復雜姿態人體時易出現形狀畸變、拓撲缺陷等問題。

實驗室出發，決心做“會格斗的數字人”

一位高中生看到修宇亮在平臺發表的西湖大學招生貼（《【英雄帖】西湖大學遠兮實驗室招生》）后，在面試西湖大學的本科時表示，“研究會格斗的數字人，聽起來就很有趣。”

在西湖大學個人主頁，修宇亮寫道，“較長期的，我們將嘗試把人工智能技術應用于武術格斗領域。”

修宇亮認為，格斗，是人類掌握的最復雜的交互動作之一，在相同的肌肉強度和裝備下，戰力即智力。對武術機理的研究，將有助于我們更好地理解人體結構，研究生物力學（Biomechanics），這對運動分析和醫療保健具有潛在的產業價值。

此前，修宇亮的代表成果 ICON 和 ECON 系列已經被《紐約時報》應用于2022 年世界杯和 2023 年超級碗的賽事報道中，輔助精彩進球回放和戰術分析。

數字人研究課題可大致劃分為 “靜態” 與 “動態” 兩大方向。其中，靜態方向核心聚焦人的外表（如服裝、頭發、人臉等），目標是實現 “栩栩如生” 的視覺效果；動態方向則側重研究人的動作（如手部操作、全身運動）及與環境物體的交互，目標是達成 “活靈活現” 的動態表現。

12 月 13 日上午 10:30-11:00 的世界模型分論壇上，修宇亮將帶來遠兮實驗室的最新研究成果，從靜態走向動態，探索人與環境交互的可能性。

具體而言，修宇亮主要分享三項成果：一是，基于 “臟數據” 的個性化建模（UP2You）；二是，從三維著裝人物中精準解析人體參數（ETCH）；三是，從海量互聯網視頻中實時、一步到位地完成人物動作捕捉與三維環境重建（Human3R），該成果亦是探索人與環境交互、乃至構建立體世界觀的關鍵基礎。

讓我們共同期待修宇亮12月13日帶來數字人領域的精彩分享。

12月13日上午，GAIR 2025 世界模型專場，眾多嘉賓將圍繞“走向可交互的 3D AI 世界模型”主題展開精彩分享，敬請關注。

未經「AI科技評論」授權，嚴禁以任何方式在網頁、論壇、社區進行轉載！

公眾號轉載請先在「AI科技評論」后臺留言取得授權，轉載時需標注來源并插入本公眾號名片。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.