<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

      Lumina-mGPT 2.0:自回歸模型華麗復(fù)興,媲美頂尖擴(kuò)散模型

      0
      分享至



      上海人工智能實(shí)驗(yàn)室等團(tuán)隊(duì)提出Lumina-mGPT 2.0 —— 一款獨(dú)立的、僅使用解碼器的自回歸模型,統(tǒng)一了包括文生圖、圖像對生成、主體驅(qū)動(dòng)生成、多輪圖像編輯、可控生成和密集預(yù)測在內(nèi)的廣泛任務(wù)。

      本文第一作者辛毅為南京大學(xué) & 上海創(chuàng)智學(xué)院博士生,現(xiàn)于上海人工智能實(shí)驗(yàn)室實(shí)習(xí),研究方向?yàn)閳D像 / 視頻生成、多模態(tài)生成與理解統(tǒng)一等。通訊作者為上海人工智能實(shí)驗(yàn)室青年科學(xué)家 — 高鵬。本文其他作者來自上海人工智能實(shí)驗(yàn)室、香港中文大學(xué)、上海交通大學(xué)、上海創(chuàng)智學(xué)院、浙江工業(yè)大學(xué)等。



      • 論文標(biāo)題:Lumina-mGPT 2.0: Stand-Alone AutoRegressive Image Modeling
      • 論文鏈接:arxiv.org/pdf/2507.17801
      • GitHub 地址:Alpha-VLLM/Lumina-mGPT-2.0
      • 關(guān)鍵詞:圖像生成、自回歸模型、基座模型。

      核心技術(shù)與突破

      完全獨(dú)立的訓(xùn)練架構(gòu)

      不同于依賴預(yù)訓(xùn)練權(quán)重的傳統(tǒng)方案,Lumina-mGPT 2.0 采用純解碼器 Transformer 架構(gòu),從參數(shù)初始化開始完全獨(dú)立訓(xùn)練。這帶來三大優(yōu)勢:架構(gòu)設(shè)計(jì)不受限制(提供了 20 億和 70 億參數(shù)兩個(gè)版本)、規(guī)避授權(quán)限制(如Chameleon的版權(quán)問題)、減少預(yù)訓(xùn)練模型帶來的固有偏差。



      圖像分詞器方面,通過對比 VQGAN、ViT-VQGAN 等多種方案,最終選擇在 MS-COCO 數(shù)據(jù)集上重建質(zhì)量最優(yōu)的 SBER-MoVQGAN,為高質(zhì)量生成奠定基礎(chǔ)。



      統(tǒng)一多任務(wù)處理框架

      創(chuàng)新地采用統(tǒng)一的圖像分詞方案,將圖生圖任務(wù)通過上下拼接視為一張圖像,并通過提示描述進(jìn)行控制,實(shí)現(xiàn)多任務(wù)訓(xùn)練與文生圖訓(xùn)練的一致性。使得單一模型能夠無縫支持以下任務(wù):

      • 文生圖
      • 主體驅(qū)動(dòng)生成
      • 圖像編輯
      • 可控生成(如基于輪廓 / 深度的生成)
      • 密集預(yù)測

      這種設(shè)計(jì)避免了傳統(tǒng)模型需切換不同框架的繁瑣,通過系統(tǒng)提示詞即可靈活控制任務(wù)類型。



      高效的推理策略

      為了解決自回歸模型生成速度慢的痛點(diǎn),團(tuán)隊(duì)引入兩種優(yōu)化:

      • 模型量化:將模型權(quán)重量化為 4 位整數(shù),同時(shí)保持激活張量為 bfloat16,通過 PyTorch 2.0 中的原生編譯工具和 torch.compile 的 reduce-overhead 模式實(shí)現(xiàn)無需改變模型架構(gòu)的優(yōu)化。

      • 推測式 Jacobi 采樣:通過靜態(tài) KV 緩存和靜態(tài)因果注意掩碼的方案,使 SJD 兼容于靜態(tài)編譯框架,從而實(shí)現(xiàn)加速采樣,同時(shí)避免動(dòng)態(tài)調(diào)整緩存。結(jié)合 4 位量化技術(shù),減少 60% GPU 顯存消耗,同時(shí)通過并行解碼加速生成。

      實(shí)驗(yàn)顯示,優(yōu)化后模型在保持質(zhì)量的前提下,生成效率顯著提升。



      實(shí)驗(yàn)結(jié)果

      文生圖實(shí)驗(yàn)結(jié)果

      在文本到圖像生成領(lǐng)域,Lumina-mGPT 2.0 在多個(gè)基準(zhǔn)測試中表現(xiàn)優(yōu)異,與 SANA 和Janus Pro等擴(kuò)散模型和自回歸模型相當(dāng)甚至超越,特別是在 “兩個(gè)物體” 和 “顏色屬性” 測試中表現(xiàn)卓越,以 0.80 的GenEval 分?jǐn)?shù)躋身頂級(jí)生成模型之列。



      此外,在實(shí)際生成效果上,Lumina-mGPT 2.0 在真實(shí)感、細(xì)節(jié)和連貫性方面優(yōu)于前代 Lumina-mGPT 和 Janus Pro,更具視覺吸引力和自然美感。



      多任務(wù)實(shí)驗(yàn)結(jié)果

      在 Graph200K 多任務(wù)基準(zhǔn)中(可控生成、物體驅(qū)動(dòng)生成),Lumina-mGPT 2.0 表現(xiàn)優(yōu)異,證明了純自回歸模型在單一框架下完成多模態(tài)生成任務(wù)的可能性。



      此外,團(tuán)隊(duì)與其他的多任務(wù)生成模型進(jìn)行了實(shí)際比較,Lumina-mGPT 2.0 在可控生成和主題驅(qū)動(dòng)生成任務(wù)中表現(xiàn)突出,與 Lumina-mGPT、OneDiffusion和 OmniGen 等模型相比,展示了卓越的生成能力和靈活性。



      未來方向

      Lumina-mGPT 2.0 在優(yōu)化推理后,仍面臨采樣時(shí)間長的問題,與其他基于自回歸的生成模型相似,這影響了用戶體驗(yàn),后續(xù)將進(jìn)一步優(yōu)化。當(dāng)前 Lumina-mGPT 2.0 的重點(diǎn)在多模態(tài)生成, 但計(jì)劃更新擴(kuò)展至多模態(tài)理解,以提高其整體功能和性能,這將使 Lumina-mGPT 2.0 在滿足用戶需求方面更加全面。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      小特朗普暗示:特朗普或因腐敗丑聞退出烏克蘭和平進(jìn)程

      小特朗普暗示:特朗普或因腐敗丑聞退出烏克蘭和平進(jìn)程

      新浪財(cái)經(jīng)
      2025-12-08 06:12:05
      一旦俄烏戰(zhàn)爭結(jié)束,3國面臨亡國,還有1國將會(huì)被西方烏克蘭化

      一旦俄烏戰(zhàn)爭結(jié)束,3國面臨亡國,還有1國將會(huì)被西方烏克蘭化

      顧史
      2025-12-04 20:19:47
      接親時(shí)新娘要12萬才下車,公公淡定刷卡,婚宴致辭:今天我得說件事

      接親時(shí)新娘要12萬才下車,公公淡定刷卡,婚宴致辭:今天我得說件事

      溫情郵局
      2025-11-21 11:13:13
      一部《芳華》,為何在今天突然刺痛了這么多人?

      一部《芳華》,為何在今天突然刺痛了這么多人?

      草莓解說體育
      2025-12-08 09:46:53
      天妒英才!上海31歲一級(jí)教師諸倩蕓去世,獲獎(jiǎng)無數(shù),臨終僅剩82斤

      天妒英才!上海31歲一級(jí)教師諸倩蕓去世,獲獎(jiǎng)無數(shù),臨終僅剩82斤

      烈史
      2025-12-07 21:27:12
      油價(jià)暴跌!明天12月9號(hào):油價(jià)一夜大反水!油價(jià)大跌、暴跌!加油站92、95號(hào)汽油,零號(hào)柴油最新報(bào)價(jià)!

      油價(jià)暴跌!明天12月9號(hào):油價(jià)一夜大反水!油價(jià)大跌、暴跌!加油站92、95號(hào)汽油,零號(hào)柴油最新報(bào)價(jià)!

      新浪財(cái)經(jīng)
      2025-12-08 04:49:03
      102-105!這就是波斯特和格林的區(qū)別,勇士第一防守球員已有答案

      102-105!這就是波斯特和格林的區(qū)別,勇士第一防守球員已有答案

      奕辰說球
      2025-12-08 10:31:49
      《瘋狂動(dòng)物城2》票房破30億,這是一個(gè)信號(hào):情感消費(fèi)已成趨勢!

      《瘋狂動(dòng)物城2》票房破30億,這是一個(gè)信號(hào):情感消費(fèi)已成趨勢!

      老方
      2025-12-07 20:58:41
      柬泰沖突細(xì)節(jié)披露 洪森要求部隊(duì)“克制”

      柬泰沖突細(xì)節(jié)披露 洪森要求部隊(duì)“克制”

      新華社
      2025-12-08 12:54:11
      建議冬季別買這8類“坑人冬裝”,貨不對板,基本都是大垃圾!

      建議冬季別買這8類“坑人冬裝”,貨不對板,基本都是大垃圾!

      裝修秀
      2025-12-08 11:45:02
      多地機(jī)關(guān)事業(yè)單位大整頓啟動(dòng),這幾類人受沖擊最大,來看看

      多地機(jī)關(guān)事業(yè)單位大整頓啟動(dòng),這幾類人受沖擊最大,來看看

      好賢觀史記
      2025-12-08 10:27:26
      徐靜雨:如果這是詹姆斯的最后一季,費(fèi)城主場球迷則不虛此行

      徐靜雨:如果這是詹姆斯的最后一季,費(fèi)城主場球迷則不虛此行

      懂球帝
      2025-12-08 11:49:50
      A股:今天放量大漲,釋放兩個(gè)信號(hào),股市尾聲,如期而至?

      A股:今天放量大漲,釋放兩個(gè)信號(hào),股市尾聲,如期而至?

      深析古今
      2025-12-08 11:49:40
      男子掉粉碎機(jī)后續(xù):結(jié)婚不到一年,女兒4個(gè)月,賠償50萬分期三年

      男子掉粉碎機(jī)后續(xù):結(jié)婚不到一年,女兒4個(gè)月,賠償50萬分期三年

      天天熱點(diǎn)見聞
      2025-12-08 08:43:26
      人民日報(bào)專訪,揭開32歲周深的真實(shí)處境,那英確實(shí)一個(gè)字都沒說錯(cuò)

      人民日報(bào)專訪,揭開32歲周深的真實(shí)處境,那英確實(shí)一個(gè)字都沒說錯(cuò)

      八斗小先生
      2025-11-01 08:46:54
      奪冠大合影引熱議!好不容易登頂混上雙世一了,還不能站一塊?

      奪冠大合影引熱議!好不容易登頂混上雙世一了,還不能站一塊?

      不同時(shí)代的魅力
      2025-12-08 12:10:16
      院士撕開了5G專利遮羞布,數(shù)量多但含金量不高,導(dǎo)致專利費(fèi)凈支出

      院士撕開了5G專利遮羞布,數(shù)量多但含金量不高,導(dǎo)致專利費(fèi)凈支出

      柏銘銳談
      2025-12-06 23:32:43
      首測全球最長航線,挑戰(zhàn)飛機(jī)上度過26小時(shí)

      首測全球最長航線,挑戰(zhàn)飛機(jī)上度過26小時(shí)

      航旅圈
      2025-12-08 01:48:41
      沒事就愛看點(diǎn)有意思的聊天記錄,莫名其妙能笑上半天!

      沒事就愛看點(diǎn)有意思的聊天記錄,莫名其妙能笑上半天!

      另子維愛讀史
      2025-12-05 21:07:18
      老羅終于開炮了!

      老羅終于開炮了!

      燕梳樓頻道
      2025-12-07 14:10:03
      2025-12-08 14:23:00
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      11864文章數(shù) 142510關(guān)注度
      往期回顧 全部

      科技要聞

      外面有人挖,家里有人跑:蘋果亂成了一鍋粥

      頭條要聞

      牛彈琴:對日斗爭突發(fā)新情況 中國軍方回應(yīng)火力全開

      頭條要聞

      牛彈琴:對日斗爭突發(fā)新情況 中國軍方回應(yīng)火力全開

      體育要聞

      厲害的后衛(wèi)何其多 想想還少了哪一個(gè)

      娛樂要聞

      郭麒麟也救不了的德云社了?

      財(cái)經(jīng)要聞

      養(yǎng)牛場未見一頭牛 每天開采礦石倒賣

      汽車要聞

      挑戰(zhàn)深圳地獄級(jí)路況 魏牌藍(lán)山VLA上車會(huì)思考聽得懂人話

      態(tài)度原創(chuàng)

      時(shí)尚
      親子
      手機(jī)
      游戲
      軍事航空

      除了大衣,今年最火的外套一定就是它了!

      親子要聞

      幼兒園報(bào)到那天,我一眼就看到了差距!

      手機(jī)要聞

      iPhone 18系列確認(rèn)測試屏下Face ID:首發(fā)小號(hào)靈動(dòng)島

      破次元壁的集結(jié)號(hào)!國內(nèi)首款二次元RTS《無限幻想戰(zhàn)線》正式公開,戰(zhàn)略的浪漫由此啟程

      軍事要聞

      日本稱中方雷達(dá)照射日戰(zhàn)機(jī) 國防部回應(yīng)

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 欧美成人影院亚洲综合图| av天堂午夜精品一区| 富宁县| 日韩99在线a| 天天躁狠狠躁狠狠躁夜夜躁| 思思热在线播放| 日韩精品毛片无码一区到三区| 国产97色在线 | 日韩| 甘洛县| 一出一进一爽一粗一大视频| 久久久久亚洲av成人网址| 国产日韩精品一区二区三区在线| 五莲县| 国产精品亚洲аv无码播放| 国内精品久久久久久无码不卡| 国产熟人av一二三区| 中文字幕有码无码| 少妇扒开双腿自慰出白浆| 亚洲伊人久久综合成人| 亚洲色大成网站www久久九九| 国产va| 99国产精品欧美一区二区三区| 无尺码精品产品视频| 99在线视频免费观看| 国产精品18久久久久久vr| 泰来县| 欧美另类性爱| 免费视频国产在线观看| 丝袜福利导航| 一本久道久久综合无码中文| 久久亚洲av午夜福利精品一区| 亚欧美无遮挡hd高清在线视频| 影音先锋男人站| 精品免费国产一区二区三区四区| 国产一区二区三四区| 日本视频精品一区二区| 生产安全高潮呻吟久久av| 亚洲av影院一区二区三区| 亚洲熟妇av日韩熟妇在线| 少妇被粗大的猛烈进出免费视频| 91久久国产性奴调教|