<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      架構解耦是統一多模態模型所必須的嗎?全新AIA損失:No

      0
      分享至



      近一年以來,統一理解與生成模型發展十分迅速,該任務的主要挑戰在于視覺理解和生成任務本身在網絡層間會產生沖突。早期的完全統一模型(如 Emu3)與單任務的方法差距巨大,Janus-Pro、BAGEL 通過一步一步解耦模型架構,極大地減小了與單任務模型的性能差距,后續方法甚至通過直接拼接現有理解和生成模型以達到極致的性能。

      香港中文大學 MMLab 和美團的研究者相信,在不久的將來統一模型的性能一定能夠達到單任務的水平,但同時也引起了他們的思考,目前通過拆解架構換取性能提升的方式真的是正確的嗎,它是否背離統一模型的初衷,它能夠提升性能的內在原因又是什么,這種方式真的是統一模型必須的嗎?

      「統一模型的初衷」以及「 架構解耦的缺點」

      統一理解生成模型的初衷是為了通過透明化、合理化的圖文交錯思考過程,提高單任務的性能,例如讓模型走迷宮時統一模型可以生成每一步對應的圖像,可以在模型做數學題的時候給圖像畫上輔助線,或者是在生成一張圖像的時候邊畫邊思考有沒有生成不合理的地方并且自動修正,這些都是 Uni-MMMU 等當前統一模型基準所關注,也是它本身被獨立成一個領域的初衷。

      再回到架構解耦的模型,例如 BAGEL 上,它本身如果要實現圖文交錯思考,需要經歷隱空間解碼到文字或者像素空間,然后再編碼到隱空間的復雜過程,兩個任務也幾乎不在同一個模型空間中,具有計算開銷大、信息丟失兩大問題。雖然在當前情況下相比于其可觀的性能,這個問題似乎并不顯著,但是研究者認為隨著研究的進行,這會是一個很大的問題。

      AIA: 模型架構解耦不是統一模型必須的

      為了探究清楚「架構解耦帶來性能提升的內在原因」以及「探索不使用架構解耦的前提下提升模型性能的方式」,香港中文大學 MMLab 和美團聯合推出了 AIA。



      • 論文標題:Architecture Decoupling Is Not All You Need For Unified Multimodal Model
      • 論文鏈接:https://arxiv.org/abs/2511.22663
      • 代碼:https://github.com/zhengdian1/AIA
      • 網頁:https://github.com/zhengdian1/AIA-project

      研究者首先通過研究不同架構的統一模型在每一層網絡中跨模態交互的強度,他們驚訝地發現不管如何進行模型架構解耦,理解和生成任務在同一層網絡中始終呈現負相關的關系,同時進一步驗證了這個現象與輸入的模態、長度和類別都沒有關系,這說明是模型自發在學習如何合理地分配兩個任務在每一層中的占比,從而 「緩解沖突」,這又說明架構解耦本質上并沒有解決任務之間沖突的問題。

      研究者進一步在最后一列可視化了現在單任務 SOTA 的模型的多模態交互模式(HunyuanImage-3.0 雖然是統一模型,但更側重于生成效果),結果發現隨著模型解耦程度的增強,其對應的跨模態交互模式會趨向于單任務的表現,這也是能夠實現性能提升的主要原因



      基于這個發現,研究者設計了Attention Interaction Alignment (AIA) 損失,通過將單任務模型的跨模態交互模式作為學習目標,在訓練的過程中顯式地約束統一模型的交互模式。

      AIA 效果如何?

      研究者在 Emu3 和 Janus-Pro 這兩種完全統一架構、輕微模型解耦架構上進行了實驗,如下表所示,結果表明本文的方法能夠在沒有任何其他 trick 的情況下提升這些模型的性能,減小了與更高解耦程度模型的差距。



      同時,研究者給出了使用 AIA 損失之后 Emu3 和 Janus-Pro 跨模態交互模式曲線變化,可以發現加入了 AIA 損失之后,兩個模型的交互曲線都向單任務模型的表現靠近了,既證明了 AIA 損失的有效性,同時也說明了模型架構解耦不是唯一能夠提高統一模型性能的方式。

      當然,研究者也承認在目前情況下完全統一的方法和高解耦程度的模型之間存在很大的差距,但正如 Emu3.5 的出現,他們認為這個差距會越來越小。因此,研究者呼吁更多的人拋開表層的框架和數據配比,深入研究統一模型的任務沖突問題,尋找更優的解法。

      AIA 好訓嗎?

      由于 Emu3 只有預訓練 (PT) 階段是統一訓練的,因此研究者在其 PT 權重上進行微調,而 Janus-Pro 給的是最終 SFT 微調后的權重,研究者在此基礎上進行后訓練。

      研究者通過調整 AIA 損失與 next-token-prediction (NTP) 損失的比重來測試其微調的敏感度,結果發現訓練 Emu3 的時候由于其預訓練知識比較薄弱,AIA 損失在一個很大的范圍內都能達到穩定收斂的效果。而在 Janus-Pro 中,由于其本身預訓練知識很強,AIA 的加入非常容易影響模型訓練,但在合適的比重情況下仍然能夠達到不錯的效果。

      AIA 有什么優勢?

      AIA 損失的加入可以一定程度上減少現在常見的數據配比工程問題,本文的方法在生成與理解數據配比在 1:1 的情況下能夠達到更好的效果,這說明在一定程度上兩個任務的訓練不再是沖突的,產生了協同優化的效果。

      統一模型訓練的正確道路是什么?

      通過結合現在所有統一模型訓練的問題以及本文的實驗分析,可以發現不管怎樣解耦模型,其始終會在統一訓練的過程中動態分配不同任務在同一層的權重來緩解沖突,那這是否實際上代表了統一模型的正確行為



      另一條統一路徑是移除所有可以用來區分任務的線索(即采用統一分詞器、消除任務相關特殊 token、使用交錯數據數據輸入),迫使模型只能從輸入中學習真正的統一空間。雖然這種方法或許可以解決任務間的負相關問題,但也會顯著增加訓練難度。

      未來展望

      AIA 邁出了統一模型訓練原理分析的第一步,研究者希望能夠有更多志同道合的研究者加入這個領域的探索。統一模型現在的理論、架構都遠遠沒有達到成熟,需要大家共同進行探索。同時研究者也希望大家能夠更加關注統一模型真正的意義,不要一味地關注當前單任務基準上的性能。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      國內賺錢國外花,產品全抄別人家,富家女程曉玥終于翻車了

      國內賺錢國外花,產品全抄別人家,富家女程曉玥終于翻車了

      娛小北
      2025-12-07 19:52:53
      主場0-2告負,皇馬各項賽事對塞爾塔19場不敗和11連勝被終結

      主場0-2告負,皇馬各項賽事對塞爾塔19場不敗和11連勝被終結

      懂球帝
      2025-12-08 06:39:10
      72歲知名老戲骨,連發三條動態支持外孫女新戲,網友:內娛要完了

      72歲知名老戲骨,連發三條動態支持外孫女新戲,網友:內娛要完了

      娛人細品
      2025-12-06 20:00:50
      中超新軍痛失隊長?曝28歲日本功勛外援離隊 率隊問鼎中甲+獻19助

      中超新軍痛失隊長?曝28歲日本功勛外援離隊 率隊問鼎中甲+獻19助

      我愛英超
      2025-12-07 22:37:25
      文言文封神的十大千古名篇,你能背幾篇?最后一篇此生必背之

      文言文封神的十大千古名篇,你能背幾篇?最后一篇此生必背之

      長風文史
      2025-12-07 16:55:18
      “新冠疫苗之父”落馬,榮譽清零!打過三針的網友慌了

      “新冠疫苗之父”落馬,榮譽清零!打過三針的網友慌了

      胡嚴亂語
      2025-12-07 15:51:07
      又一款12000mAh新機公布:1月20日,即將發布登場!

      又一款12000mAh新機公布:1月20日,即將發布登場!

      科技堡壘
      2025-12-07 12:08:12
      辣眼睛!"搶鏡伴娘"刷爆網絡,深V禮服幾乎掉落,新郎眼神失控

      辣眼睛!"搶鏡伴娘"刷爆網絡,深V禮服幾乎掉落,新郎眼神失控

      派大星紀錄片
      2025-12-06 14:32:19
      小米粥再次被關注,調查發現:高血糖患者喝小米粥,或有4大改善

      小米粥再次被關注,調查發現:高血糖患者喝小米粥,或有4大改善

      九哥聊軍事
      2025-12-07 10:00:20
      沒時間了,特朗普準備換將,中國運回大批黃金,美債恐出現拋售潮

      沒時間了,特朗普準備換將,中國運回大批黃金,美債恐出現拋售潮

      影孖看世界
      2025-12-07 19:32:25
      用圍巾擦地的女乘客找到了!蘇州地鐵:已和她取得聯系,正約時間送出禮物

      用圍巾擦地的女乘客找到了!蘇州地鐵:已和她取得聯系,正約時間送出禮物

      極目新聞
      2025-12-07 16:35:20
      職稱公示58人48個假名,連夜下架遮丑,黑料越挖越多,網友質疑!

      職稱公示58人48個假名,連夜下架遮丑,黑料越挖越多,網友質疑!

      你食不食油餅
      2025-12-07 06:00:09
      英錦賽戰報:再爆大冷預警,世界第一特魯姆普決賽0-5到2-6

      英錦賽戰報:再爆大冷預警,世界第一特魯姆普決賽0-5到2-6

      求球不落諦
      2025-12-08 00:25:21
      要小心!不要真以為去甘蔗地里處男女朋友,廣西這個提示太及時了

      要小心!不要真以為去甘蔗地里處男女朋友,廣西這個提示太及時了

      火山詩話
      2025-12-07 07:23:45
      又一巨頭暴雷!收割2400億元,百萬人資金打水漂,創始人主動投案

      又一巨頭暴雷!收割2400億元,百萬人資金打水漂,創始人主動投案

      財經八卦
      2025-12-06 17:59:27
      馬斯克被干懵了:特斯拉全球第4,前3全是中國車,小米都排第7了

      馬斯克被干懵了:特斯拉全球第4,前3全是中國車,小米都排第7了

      互聯網.亂侃秀
      2025-12-07 11:37:05
      雅迪宣布新國標電動車C09上市:前后座設計,標配車筐

      雅迪宣布新國標電動車C09上市:前后座設計,標配車筐

      界面新聞
      2025-12-06 09:28:05
      父母百年后,家就散了嗎?網友:大概率我也是這結局!

      父母百年后,家就散了嗎?網友:大概率我也是這結局!

      帶你感受人間冷暖
      2025-12-07 00:10:07
      壓軸王者!新機官宣:12月25日,即將發布上市!

      壓軸王者!新機官宣:12月25日,即將發布上市!

      科技堡壘
      2025-12-07 12:02:22
      湖南煙花店老板放煙花自殺事件后續來了:真相大白,令人唏噓

      湖南煙花店老板放煙花自殺事件后續來了:真相大白,令人唏噓

      復轉這些年
      2025-12-07 18:02:55
      2025-12-08 07:00:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11862文章數 142509關注度
      往期回顧 全部

      科技要聞

      獨家|李笛再創業,炮轟大模型,再戰AI

      頭條要聞

      馬斯克一句話說到梅德韋杰夫心里 卻引發歐洲政治風暴

      頭條要聞

      馬斯克一句話說到梅德韋杰夫心里 卻引發歐洲政治風暴

      體育要聞

      梅開48度!2年半,這是梅西在邁阿密的一人一城

      娛樂要聞

      林俊杰AAA頒獎禮,韓娛愛豆均站起鞠躬

      財經要聞

      五糧液降價?回應來了

      汽車要聞

      傳奇超跑電動形態重生 雷克薩斯LFA純電概念車

      態度原創

      親子
      時尚
      游戲
      旅游
      健康

      親子要聞

      最近一次開懷大笑是因為什么? 網友分享: 必須給姑娘撐場子

      遼京:當一個媽媽開始寫作

      重生之年我在倩女端游做地府主君,主導生死!這波操作太上頭

      旅游要聞

      從小眾到爆火!連云港楓樹灣用一片紅葉,點亮江蘇秋冬旅游

      甲狀腺結節"排雷"指南

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 好紧好爽午夜视频| 欧洲码亚洲码的区别入口| jizz国产免费观看| 激情图区| 青青青爽视频在线观看| 亚洲成人精选| 中文字幕无码免费久久| 丰满少妇人妻无码专区| 亚洲精品久久久久国色天香| 色色色资源| 日韩精品人妻在线| 国产精欧美一区二区三区| 国产av一区二区三区| 91人妻论坛| 国产玖玖| av无码天堂| 国产精品无码久久综合网| 国产微拍一区二区三区四区| 国标熟女视频| AV中文天堂| 乱色精品无码一区二区国产盗| 揉着我的奶从后面进去视频| 亚洲国产成人精品女人久久久| 亚洲色大成网站www永久男同| 亚洲天堂男人天堂| 九九天堂网| 国产全是老熟女太爽了| 国产成人无码a区在线视频无码dvd| 久久这里只有精品免费首页| 91啪在线| av一卡二卡| 亚洲日韩国产二区无码| 99在线小视频| 国产偷伦| 日韩欧美卡一卡二卡新区| 天堂а在线中文在线新版| 九九热精品在线观看| 江达县| 日本成本人片免费网站| 老司机aⅴ在线精品导航| 女人天堂av|