<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      Lumina-mGPT 2.0:自回歸模型華麗復(fù)興,媲美頂尖擴(kuò)散模型

      0
      分享至



      上海人工智能實(shí)驗(yàn)室等團(tuán)隊(duì)提出Lumina-mGPT 2.0 —— 一款獨(dú)立的、僅使用解碼器的自回歸模型,統(tǒng)一了包括文生圖、圖像對(duì)生成、主體驅(qū)動(dòng)生成、多輪圖像編輯、可控生成和密集預(yù)測(cè)在內(nèi)的廣泛任務(wù)。

      本文第一作者辛毅為南京大學(xué) & 上海創(chuàng)智學(xué)院博士生,現(xiàn)于上海人工智能實(shí)驗(yàn)室實(shí)習(xí),研究方向?yàn)閳D像 / 視頻生成、多模態(tài)生成與理解統(tǒng)一等。通訊作者為上海人工智能實(shí)驗(yàn)室青年科學(xué)家 — 高鵬。本文其他作者來(lái)自上海人工智能實(shí)驗(yàn)室、香港中文大學(xué)、上海交通大學(xué)、上海創(chuàng)智學(xué)院、浙江工業(yè)大學(xué)等。



      • 論文標(biāo)題:Lumina-mGPT 2.0: Stand-Alone AutoRegressive Image Modeling
      • 論文鏈接:arxiv.org/pdf/2507.17801
      • GitHub 地址:Alpha-VLLM/Lumina-mGPT-2.0
      • 關(guān)鍵詞:圖像生成、自回歸模型、基座模型。

      核心技術(shù)與突破

      完全獨(dú)立的訓(xùn)練架構(gòu)

      不同于依賴預(yù)訓(xùn)練權(quán)重的傳統(tǒng)方案,Lumina-mGPT 2.0 采用純解碼器 Transformer 架構(gòu),從參數(shù)初始化開(kāi)始完全獨(dú)立訓(xùn)練。這帶來(lái)三大優(yōu)勢(shì):架構(gòu)設(shè)計(jì)不受限制(提供了 20 億和 70 億參數(shù)兩個(gè)版本)、規(guī)避授權(quán)限制(如Chameleon的版權(quán)問(wèn)題)、減少預(yù)訓(xùn)練模型帶來(lái)的固有偏差。



      圖像分詞器方面,通過(guò)對(duì)比 VQGAN、ViT-VQGAN 等多種方案,最終選擇在 MS-COCO 數(shù)據(jù)集上重建質(zhì)量最優(yōu)的 SBER-MoVQGAN,為高質(zhì)量生成奠定基礎(chǔ)。



      統(tǒng)一多任務(wù)處理框架

      創(chuàng)新地采用統(tǒng)一的圖像分詞方案,將圖生圖任務(wù)通過(guò)上下拼接視為一張圖像,并通過(guò)提示描述進(jìn)行控制,實(shí)現(xiàn)多任務(wù)訓(xùn)練與文生圖訓(xùn)練的一致性。使得單一模型能夠無(wú)縫支持以下任務(wù):

      • 文生圖
      • 主體驅(qū)動(dòng)生成
      • 圖像編輯
      • 可控生成(如基于輪廓 / 深度的生成)
      • 密集預(yù)測(cè)

      這種設(shè)計(jì)避免了傳統(tǒng)模型需切換不同框架的繁瑣,通過(guò)系統(tǒng)提示詞即可靈活控制任務(wù)類型。



      高效的推理策略

      為了解決自回歸模型生成速度慢的痛點(diǎn),團(tuán)隊(duì)引入兩種優(yōu)化:

      • 模型量化:將模型權(quán)重量化為 4 位整數(shù),同時(shí)保持激活張量為 bfloat16,通過(guò) PyTorch 2.0 中的原生編譯工具和 torch.compile 的 reduce-overhead 模式實(shí)現(xiàn)無(wú)需改變模型架構(gòu)的優(yōu)化。

      • 推測(cè)式 Jacobi 采樣:通過(guò)靜態(tài) KV 緩存和靜態(tài)因果注意掩碼的方案,使 SJD 兼容于靜態(tài)編譯框架,從而實(shí)現(xiàn)加速采樣,同時(shí)避免動(dòng)態(tài)調(diào)整緩存。結(jié)合 4 位量化技術(shù),減少 60% GPU 顯存消耗,同時(shí)通過(guò)并行解碼加速生成。

      實(shí)驗(yàn)顯示,優(yōu)化后模型在保持質(zhì)量的前提下,生成效率顯著提升。



      實(shí)驗(yàn)結(jié)果

      文生圖實(shí)驗(yàn)結(jié)果

      在文本到圖像生成領(lǐng)域,Lumina-mGPT 2.0 在多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,與 SANA 和Janus Pro等擴(kuò)散模型和自回歸模型相當(dāng)甚至超越,特別是在 “兩個(gè)物體” 和 “顏色屬性” 測(cè)試中表現(xiàn)卓越,以 0.80 的GenEval 分?jǐn)?shù)躋身頂級(jí)生成模型之列。



      此外,在實(shí)際生成效果上,Lumina-mGPT 2.0 在真實(shí)感、細(xì)節(jié)和連貫性方面優(yōu)于前代 Lumina-mGPT 和 Janus Pro,更具視覺(jué)吸引力和自然美感。



      多任務(wù)實(shí)驗(yàn)結(jié)果

      在 Graph200K 多任務(wù)基準(zhǔn)中(可控生成、物體驅(qū)動(dòng)生成),Lumina-mGPT 2.0 表現(xiàn)優(yōu)異,證明了純自回歸模型在單一框架下完成多模態(tài)生成任務(wù)的可能性。



      此外,團(tuán)隊(duì)與其他的多任務(wù)生成模型進(jìn)行了實(shí)際比較,Lumina-mGPT 2.0 在可控生成和主題驅(qū)動(dòng)生成任務(wù)中表現(xiàn)突出,與 Lumina-mGPT、OneDiffusion和 OmniGen 等模型相比,展示了卓越的生成能力和靈活性。



      未來(lái)方向

      Lumina-mGPT 2.0 在優(yōu)化推理后,仍面臨采樣時(shí)間長(zhǎng)的問(wèn)題,與其他基于自回歸的生成模型相似,這影響了用戶體驗(yàn),后續(xù)將進(jìn)一步優(yōu)化。當(dāng)前 Lumina-mGPT 2.0 的重點(diǎn)在多模態(tài)生成, 但計(jì)劃更新擴(kuò)展至多模態(tài)理解,以提高其整體功能和性能,這將使 Lumina-mGPT 2.0 在滿足用戶需求方面更加全面。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      街面復(fù)市物價(jià)沖天!德黑蘭的平靜之下全是生存焦慮

      街面復(fù)市物價(jià)沖天!德黑蘭的平靜之下全是生存焦慮

      愛(ài)下廚的阿釃
      2026-01-25 05:02:48
      倒霉的演員甘婷婷:演了個(gè)潘金蓮,居然把自己的下半輩子搭進(jìn)去了

      倒霉的演員甘婷婷:演了個(gè)潘金蓮,居然把自己的下半輩子搭進(jìn)去了

      眼底星碎
      2026-01-25 03:12:02
      央視怒批,國(guó)務(wù)院點(diǎn)名封殺!這幾位蒙騙老百姓的大網(wǎng)紅,徹底涼涼

      央視怒批,國(guó)務(wù)院點(diǎn)名封殺!這幾位蒙騙老百姓的大網(wǎng)紅,徹底涼涼

      大魚簡(jiǎn)科
      2025-09-02 19:34:00
      辦百日宴擺了28桌,只來(lái)15個(gè)客人!家長(zhǎng):禮錢都沒(méi)看到,虧大了!

      辦百日宴擺了28桌,只來(lái)15個(gè)客人!家長(zhǎng):禮錢都沒(méi)看到,虧大了!

      磊子講史
      2025-09-24 14:17:06
      李銀橋在回憶錄中提及毛岸英犧牲需由彭德懷承擔(dān)一定責(zé)任,但這一表述缺乏充分依據(jù),難以成立

      李銀橋在回憶錄中提及毛岸英犧牲需由彭德懷承擔(dān)一定責(zé)任,但這一表述缺乏充分依據(jù),難以成立

      史海殘?jiān)?/span>
      2025-12-23 11:22:17
      以為是普通貨船?中達(dá) 79 號(hào)藏 60 導(dǎo)彈管,美軍扣船就是賭命

      以為是普通貨船?中達(dá) 79 號(hào)藏 60 導(dǎo)彈管,美軍扣船就是賭命

      流年拾光
      2026-01-23 16:10:18
      他是首任海軍司令,6個(gè)兒子中有3位將軍2個(gè)副主席,兒媳家喻戶曉

      他是首任海軍司令,6個(gè)兒子中有3位將軍2個(gè)副主席,兒媳家喻戶曉

      百年歷史老號(hào)
      2024-05-16 13:39:53
      英超20億大戰(zhàn)!阿森納劍指雙殺曼聯(lián):沖擊百年紀(jì)錄 核心對(duì)決

      英超20億大戰(zhàn)!阿森納劍指雙殺曼聯(lián):沖擊百年紀(jì)錄 核心對(duì)決

      葉青足球世界
      2026-01-25 05:00:03
      三四線城市,翻盤了

      三四線城市,翻盤了

      城市財(cái)經(jīng)
      2026-01-12 11:39:42
      云南省公安廳情報(bào)指揮中心合成作戰(zhàn)支隊(duì)支隊(duì)長(zhǎng)袁滿榮接受紀(jì)律審查和監(jiān)察調(diào)查

      云南省公安廳情報(bào)指揮中心合成作戰(zhàn)支隊(duì)支隊(duì)長(zhǎng)袁滿榮接受紀(jì)律審查和監(jiān)察調(diào)查

      昆明信息港
      2026-01-24 14:55:58
      太精彩了!溫瑞博苦戰(zhàn)七局擊敗樊振東德國(guó)隊(duì)友,奪冠后振臂歡呼

      太精彩了!溫瑞博苦戰(zhàn)七局擊敗樊振東德國(guó)隊(duì)友,奪冠后振臂歡呼

      楊哥乒乓
      2026-01-24 21:49:04
      WTT馬斯喀特站國(guó)乒喜憂參半:溫瑞博首冠封神,林詩(shī)棟陷保分危機(jī)

      WTT馬斯喀特站國(guó)乒喜憂參半:溫瑞博首冠封神,林詩(shī)棟陷保分危機(jī)

      上觀新聞
      2026-01-25 04:47:06
      記住吧,歷史總要清算

      記住吧,歷史總要清算

      火事雜談
      2026-01-24 18:52:38
      暴跌60%,引來(lái)全國(guó)牙科關(guān)店潮,暴利的牙科生意真的走到了盡頭?

      暴跌60%,引來(lái)全國(guó)牙科關(guān)店潮,暴利的牙科生意真的走到了盡頭?

      小熊侃史
      2026-01-17 07:50:11
      CBA最新消息!曝頂級(jí)外援加盟遼寧男籃,上海男籃留用弗格

      CBA最新消息!曝頂級(jí)外援加盟遼寧男籃,上海男籃留用弗格

      體壇瞎白話
      2026-01-24 10:09:39
      開(kāi)年必看!5款本月發(fā)售游戲盤點(diǎn),硬核競(jìng)技與史詩(shī)劇情拉滿

      開(kāi)年必看!5款本月發(fā)售游戲盤點(diǎn),硬核競(jìng)技與史詩(shī)劇情拉滿

      17173游戲網(wǎng)
      2026-01-23 10:25:15
      舒淇談拍全裸寫真:“笨啊,反正都要脫,干脆啪就脫給你看”

      舒淇談拍全裸寫真:“笨啊,反正都要脫,干脆啪就脫給你看”

      TVB的四小花
      2026-01-22 15:25:56
      甘愿讓國(guó)家消失!小國(guó)總統(tǒng)走投無(wú)路,請(qǐng)求徹底并入北約鄰國(guó)

      甘愿讓國(guó)家消失!小國(guó)總統(tǒng)走投無(wú)路,請(qǐng)求徹底并入北約鄰國(guó)

      Hi科普啦
      2026-01-22 14:10:07
      少些勝負(fù)觀、多些平常心,U23亞洲杯決賽中國(guó)隊(duì)對(duì)決日本隊(duì),重在享受比賽!

      少些勝負(fù)觀、多些平常心,U23亞洲杯決賽中國(guó)隊(duì)對(duì)決日本隊(duì),重在享受比賽!

      上觀新聞
      2026-01-24 04:37:08
      上海知名主持蔚蘭近況!自爆三個(gè)月沒(méi)洗澡,住進(jìn)月租1.2萬(wàn)養(yǎng)老院

      上海知名主持蔚蘭近況!自爆三個(gè)月沒(méi)洗澡,住進(jìn)月租1.2萬(wàn)養(yǎng)老院

      說(shuō)歷史的老牢
      2026-01-24 11:49:25
      2026-01-25 06:24:49
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12179文章數(shù) 142549關(guān)注度
      往期回顧 全部

      科技要聞

      黃仁勛現(xiàn)身上海菜市場(chǎng)

      頭條要聞

      張又俠、劉振立被查 解放軍報(bào)發(fā)布社論

      頭條要聞

      張又俠、劉振立被查 解放軍報(bào)發(fā)布社論

      體育要聞

      當(dāng)家球星打替補(bǔ),他們?cè)诠室鈹[爛?

      娛樂(lè)要聞

      回歸還是頂流 鳳凰傳奇將現(xiàn)身馬年春晚

      財(cái)經(jīng)要聞

      “百年老字號(hào)”張小泉遭60億債務(wù)壓頂

      汽車要聞

      有增程和純電版可選 日產(chǎn)NX8或于3-4月間上市

      態(tài)度原創(chuàng)

      本地
      家居
      旅游
      健康
      藝術(shù)

      本地新聞

      云游中國(guó)|格爾木的四季朋友圈,張張值得你點(diǎn)贊

      家居要聞

      在家度假 160平南洋混搭宅

      旅游要聞

      搜索量飆升!巴西免簽,引爆中國(guó)游客春節(jié)出游熱情

      耳石脫落為何讓人天旋地轉(zhuǎn)+惡心?

      藝術(shù)要聞

      18位西方畫家筆下的女人,美得驚艷了時(shí)光!

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产成人无码A区在线观看视频| 人妻综合在线| 五月丁香色综合久久4438| 久久99精品国产99久久6男男| 欧美一道本| 67194成是人免费无码| 综合一区二区三区| 67194熟妇| 女人被狂c躁到高潮视频| 狠狠色丁香婷婷亚洲综合| 欧洲熟妇色xxxx欧美老妇老头多毛| 成人a网站| 成人免费区一区二区三区| 精品无码老熟妇magnet| 亚洲色鬼| 五月激情综合网| 日韩,变态,另类,中文,人妻| 无码人妻精品一区二区三区免费| 久久精品无码专区免费东京热| 国产精品国产精品国产专区不卡| 色AV综合| 精选国产av精选一区二区三区 | 亚洲中文字幕无码一久久区| 成年片色大黄全免费网站久久 | 人妻夜夜爽天天爽| 日日插插| 国产传媒在线观看| 乱中年女人伦| 99久久国产宗和精品1上映| 91在线无码精品秘?国产千人斩| 亚洲中文字幕AV在线| 久久www免费人成一看片| 国产成人成网站在线播放青青| 6699嫩草久久久精品影院| 1024你懂的国产精品| 色综合网址你懂的| 偷国产乱人伦偷精品视频| 香蕉社区| 在线观看的网站| 人妻 丝袜美腿 中文字幕| 成人网中文字幕|