<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      后生可畏!何愷明團隊新成果發布,共一清華姚班大二在讀

      0
      分享至

      繼今年5月提出MeanFlow (MF) 之后,何愷明團隊于近日推出了最新的改進版本——

      Improved MeanFlow (iMF),iMF成功解決了原始MF在訓練穩定性、指導靈活性和架構效率上的三大核心問題。


      其通過將訓練目標重新表述為更穩定的瞬時速度損失,同時引入靈活的無分類器指導(CFG)和高效的上下文內條件作用,大幅提升了模型性能。

      在ImageNet 256x256基準測試中,iMF-XL/2模型在 1-NFE(單步函數評估)中取得了1.72的FID成績,相較于原始MF提升了50%,證明了從頭開始訓練的單步生成模型可以達到與多步擴散模型相媲美的結果。


      MeanFlow一作耿正陽依舊,值得注意的是共同一作的Yiyang Lu目前還是大二學生——來自清華姚班,而何愷明也在最后署了名。

      其他合作者包括:Adobe研究員Zongze WuEli Shechtman,及CMU機器學習系主任Zico Kolter

      重構預測函數,回到標準的回歸問題

      iMF (Improved MeanFlow) 的核心改進是通過重構預測函數,將訓練過程轉換為一個標準的回歸問題


      在原始的MeanFlow (MF) (上圖左)中,其直接最小化平均速度的損失。其中,Utgt是根據MeanFlow恒等式和條件速度e-x推導出來的目標平均速度。


      這里的問題在于,推導出來的目標Utgt包含網絡自身預測輸出的導數項,而這種“目標自依賴”的結構使得優化極不穩定、方差極大。


      基于此,iMF從瞬時速度的角度去構建損失,使整個訓練就變得穩定。

      值得注意的是,網絡輸出仍然是平均速度,而訓練損失則變成了瞬時速度損失,以獲得穩定的、標準的回歸訓練。


      它首先將輸入簡化為單一的含噪數據z,并在內部巧妙地修改了預測函數的計算方式。

      具體來說,iMF讓用于計算復合預測函數V(代表對瞬時速度的預測)中,雅可比向量積(JVP)項所需的切向量輸入不再是外部的e-x,而是由網絡自身預測的邊緣速度。

      通過這一系列步驟,iMF成功移除了復合預測函數V對目標近似值e-x的依賴。此時,iMF再將損失函數的目標設定為穩定的條件速度e-x。

      最終,iMF 成功將訓練流程轉換成了一個穩定的、標準的回歸問題,為平均速度的學習提供了堅實的優化基礎。

      除了對訓練目標進行改良外,iMF還通過以下兩大突破,全面提升了MeanFlow框架的實用性和效率:

      靈活的無分類器指導(CFG)

      原始MeanFlow框架的一大局限是:為了支持單步生成,無分類器指導(CFG)的指導尺度在訓練時必須被固定,這極大地限制了在推理時通過調整尺度來優化圖像質量或多樣性的能力。

      iMF通過將指導尺度內化為一個可學習的條件來解決此問題。

      具體來說,iMF直接將指導尺度作為一個輸入條件提供給網絡。

      在訓練階段,模型會從一個偏向較小值的冪分布中隨機采樣不同的指導尺度。這種處理方式使得網絡能夠適應并學習不同指導強度下的平均速度場,從而在推理時解鎖了CFG的全部靈活性。


      此外,iMF 還將這種靈活的條件作用擴展到支持CFG區間,進一步增強了模型對樣本多樣性的控制。

      高效的上下文內條件作用(In-context Conditioning)架構

      原始MF依賴于參數量巨大的adaLN-zero機制來處理多種異構條件(如時間步、類別標簽和指導尺度)。

      當條件數量增多時,簡單地對所有條件嵌入進行求和并交給adaLN-zero處理,會變得效率低下且參數冗余。

      iMF引入了改進的上下文內條件作用來解決此問題。


      它的創新點在于:它將所有條件(包括時間步、類別以及 CFG 因子等)編碼成多個可學習的Token(而非單一向量),并將這些條件Token直接沿序列軸與圖像潛在空間的Token進行拼接,然后一起輸入到 Transformer 塊中進行聯合處理。

      這一架構調整帶來的最大益處是:iMF可以徹底移除參數量巨大的adaLN-zero模塊。

      這使得iMF在性能提升的同時,模型尺寸得到了大幅優化,例如 iMF-Base 模型尺寸減小了約1/3(從 133M 降至 89M),極大地提升了模型的效率和設計靈活性。

      實驗結果

      iMF在最具挑戰性的ImageNet 256x256上的1-NFE中展示了卓越的性能。

      iMF-XL/2在1-NFE下的FID達到了1.72,將單步生成模型的性能推到了一個新的高度。


      iMF從頭開始訓練的性能甚至優于許多從預訓練多步模型中蒸餾而來的快進模型,證明了 iMF 框架在基礎訓練上的優越性。

      下圖在ImageNet 256x256上進行1-NFE(單步函數評估)生成的結果。


      iMF在2-NFE時的FID達到1.54,將單步模型與多步擴散模型(FID約1.4-1.7)的差距進一步縮小。


      One more thing

      如前文所述,IMF 一作延續前作Mean Flow(已入選 NeurIPS 2025 Oral)的核心班底——耿正陽。

      他本科畢業于四川大學,目前在CMU攻讀博士,師從Zico Kolter教授。


      共一作者為清華姚班大二學生Yiyang Lu,現于MIT跟隨何愷明教授研究計算機視覺,此前曾在清華叉院許華哲教授指導下研究機器人方向。


      這篇論文部分的內容由他們在MIT期間,于何愷明教授指導下完成。


      此外,論文的其他作者還包括:Adobe研究員Zongze Wu、Eli Shechtman,CMU機器學習系主任J. Zico Kolter以及何愷明教授。

      其中,Zongze Wu本科畢業于同濟大學,并在Hebrew University of Jerusalem獲得博士學位,他目前在Adobe舊金山研究院擔任研究科學家,


      同樣的,Eli Shechtman也同樣來自Adobe,他是Adobe Research圖像實驗室的高級首席科學家。他于2007加入 Adobe,并于2007–2010年間在華盛頓大學擔任博士后研究員。


      J. Zico Kolter是論文一作耿正陽的導師,他是CMU計算機科學學院教授,并擔任機器學習系主任。


      論文的尾作則是著名的機器學習科學家何愷明教授,他目前是MIT的終身副教授。

      他最出名的共工作是ResNet,是21世紀被引用次數最多的論文。


      就在最近的NeurIPS放榜中,何愷明參與的FastCNN還拿下了時間檢驗獎。

      [1]https://arxiv.org/pdf/2505.13447

      [2]https://gsunshine.github.io/

      [3]https://arxiv.org/pdf/2512.02012

      文章來源:量子位。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      重大考古發現!連云港鎮海遺址將我國長江以北海鹽生產史推至4400年前

      重大考古發現!連云港鎮海遺址將我國長江以北海鹽生產史推至4400年前

      極目新聞
      2026-02-04 21:47:06
      越媒:越南U13青年隊11-0橫掃中國俱樂部,小將范光凱獨中七元

      越媒:越南U13青年隊11-0橫掃中國俱樂部,小將范光凱獨中七元

      星耀國際足壇
      2026-02-04 13:49:50
      北京女子移植干細胞后,血型口味都變了

      北京女子移植干細胞后,血型口味都變了

      粵語音樂噴泉
      2026-02-04 15:04:59
      新研究:老年人低密度脂蛋白最佳范圍是3.6到4.2!應該怎么看

      新研究:老年人低密度脂蛋白最佳范圍是3.6到4.2!應該怎么看

      李藥師談健康
      2026-02-04 15:29:09
      爭議!WTA不和諧一幕:烏克蘭女將拒合影+握手 因對手去過俄羅斯

      爭議!WTA不和諧一幕:烏克蘭女將拒合影+握手 因對手去過俄羅斯

      侃球熊弟
      2026-02-05 00:10:03
      上海房價最離譜的郊區,為什么這么貴?

      上海房價最離譜的郊區,為什么這么貴?

      環線房產咨詢
      2026-02-05 07:09:18
      黃巖島對峙升級,中方已備最壞打算,美媒:轟6和055抵達

      黃巖島對峙升級,中方已備最壞打算,美媒:轟6和055抵達

      何氽簡史
      2026-02-04 20:09:13
      日本專家顛覆認知:想健康就不要跑步!?

      日本專家顛覆認知:想健康就不要跑步!?

      馬拉松跑步健身
      2026-02-03 06:30:10
      曝具俊曄將回韓過年,計劃給大S買房攢很多錢,汪小菲遭韓媒炮轟

      曝具俊曄將回韓過年,計劃給大S買房攢很多錢,汪小菲遭韓媒炮轟

      古希臘掌管月桂的神
      2026-02-04 19:50:03
      德國抓捕兩名工人,往軍艦發動機里倒鋼珠?西方的工匠精神哪去了

      德國抓捕兩名工人,往軍艦發動機里倒鋼珠?西方的工匠精神哪去了

      那場煙花雨淋濕了夢境了
      2026-02-04 20:22:16
      林詩棟換主管教練了,亞洲杯首輪3-0獲勝,新教練小試牛刀效果好

      林詩棟換主管教練了,亞洲杯首輪3-0獲勝,新教練小試牛刀效果好

      真理是我親戚
      2026-02-04 13:05:46
      潘粵明評價獲證實!董潔22年后與藍顏知己再牽手

      潘粵明評價獲證實!董潔22年后與藍顏知己再牽手

      獨舞獨舞
      2026-01-18 06:37:17
      王石:每晚最難熬的是等田樸珺回家,不知道回不回不知道幾點回

      王石:每晚最難熬的是等田樸珺回家,不知道回不回不知道幾點回

      報君知史
      2026-01-04 16:49:46
      41歲C羅結束罷賽 正式回歸訓練+提前2小時抵達基地 3天后迎來復出

      41歲C羅結束罷賽 正式回歸訓練+提前2小時抵達基地 3天后迎來復出

      風過鄉
      2026-02-04 22:56:15
      沈陽新娘遠嫁杭州,娘家30口人自駕送親,新郎只愿付當天住宿費

      沈陽新娘遠嫁杭州,娘家30口人自駕送親,新郎只愿付當天住宿費

      蘭姐說故事
      2025-08-21 20:05:04
      殺入4強!意甲領頭羊狂飆:豪取4連勝,齊沃目標直指三冠王

      殺入4強!意甲領頭羊狂飆:豪取4連勝,齊沃目標直指三冠王

      足球狗說
      2026-02-05 05:54:50
      韓媒揭露大S去世細節,搶救14小時榜熱搜,泡溫泉成死亡關鍵原因

      韓媒揭露大S去世細節,搶救14小時榜熱搜,泡溫泉成死亡關鍵原因

      黔鄉小姊妹
      2026-02-05 08:20:58
      科爾:或許是交易流言影響了球隊,大家情緒低落毫無競爭精神

      科爾:或許是交易流言影響了球隊,大家情緒低落毫無競爭精神

      懂球帝
      2026-02-04 14:51:24
      2026年家庭存款等級表流出:達到第3級,你才有資格談“不累”

      2026年家庭存款等級表流出:達到第3級,你才有資格談“不累”

      別人都叫我阿腈
      2026-02-04 19:33:38
      被曝藏身美國4個月,恒大前總裁再迎壞消息,許家印最后希望破滅

      被曝藏身美國4個月,恒大前總裁再迎壞消息,許家印最后希望破滅

      李橑在北漂
      2026-01-06 21:26:55
      2026-02-05 09:40:49
      算法與數學之美 incentive-icons
      算法與數學之美
      分享知識,交流思想
      5340文章數 64601關注度
      往期回顧 全部

      教育要聞

      申請美國簽證的大忌是什么?美簽沒有固定的模板

      頭條要聞

      牛彈琴:中國元首和特朗普通話 特朗普就臺灣問題表態

      頭條要聞

      牛彈琴:中國元首和特朗普通話 特朗普就臺灣問題表態

      體育要聞

      中國棒球,立春

      娛樂要聞

      春晚主持人陣容曝光,5位都是老面孔

      財經要聞

      黃金,出現拐點

      科技要聞

      微信給馬化騰澆了“一盆冷水”

      汽車要聞

      綜合續航1730km 5座中級電混SUV吉利銀河M7官圖發布

      態度原創

      親子
      房產
      數碼
      藝術
      公開課

      親子要聞

      坪山婦幼早孕關愛門診揭牌,為孕早期女性筑牢全周期健康防線

      房產要聞

      還在漲!成交量連飆四個月 海口二手房開始穩了!

      數碼要聞

      蘋果Apple TV電影《F1:狂飆飛車》爆火,官方暗示將拍續集

      藝術要聞

      草書識別新挑戰:為何70年未出硬筆書法大師?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版