<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      騰訊開源 X-Omni:RL縫合混合架構,對標 GPT-4o,中文文本渲染登頂

      0
      分享至

      大數據文摘出品

      近日,騰訊研究團隊打造了一款新型圖像生成模型X-Omni。技術上,采用了強化學習重構混合模型架構;性能上,直接對標OpenAI的GPT-4o。


      地址:https://arxiv.org/pdf/2507.22058

      這款模型不僅在中英文文字渲染方面刷新了已有基準,還在多個圖像生成任務中擊敗了商用大模型。

      它的核心技術來自不同開源社區,甚至包括直接競爭者,展現出一種“拼圖式”AI構建思路。

      混合架構的斷層,被強化學習縫合


      圖像生成AI領域,始終存在一個核心難題:如何在語義理解和圖像還原之間找到平衡。

      目前主流做法,是采用“混合模型”架構:一部分使用自回歸模型來生成語義token,另一部分用擴散模型來還原圖像。

      這種架構的優勢是互補,但也帶來了新的問題:語義token與擴散解碼器之間“語言不通”。

      兩部分常常各說各話,生成結果的質量不穩定,尤其在遇到復雜文本或高精度場景時,錯誤容易累積。

      騰訊的X-Omni摒棄了傳統混合架構“各自訓練、強行拼接”的模式,引入統一的強化學習流程,通過RL對齊兩部分、提升協同。


      首先,由自回歸模型生成語義token;接著,擴散模型FLUX.1-dev負責根據token生成圖像;再由一個綜合評價系統給出反饋,指導自回歸模型更精準地輸出token。

      這個評價系統由三部分組成:人工美學偏好評分、高分辨率圖像質量評分模型,以及視覺-語言模型Qwen2.5-VL-32B。

      同時,為驗證圖像中文字是否準確,系統還引入GOT-OCR-2.0與PaddleOCR做比對。

      在約200步RL訓練后,模型指標已超過SFT+Best-of-N的最佳結果。

      結果顯示,在相同訓練輪數下,X-Omni的輸出圖像質量超過常規訓練方式所得最佳結果。

      文本是關鍵,中文才是戰場


      在與GPT-4o的對比中,X-Omni在最難的環節,圖像中的文字渲染場景中,獲得了優勢。

      圖像文字生成一直是大模型的痛點,越長的文本越容易錯漏、變形,甚至無法識別。

      為此,騰訊團隊專門構建了名為“LongText-Bench”的測試基準,用以測評在長段文字下的圖像渲染穩定性。

      結果顯示,X-Omni在英文文本準確率上達到了0.901,超越所有同類模型。

      而在中文文本渲染方面,在OneIG中文任務上,X-Omni超過了GPT-4o,與Seedream 3.0表現相當;在中文長文本(LongText-Bench)評測中,X-Omni取得第一。

      X-Omni采用的是一種叫SigLIP-VQ的tokenizer,不再以像素為單位構建圖像,而是將圖像編碼為16,384個語義token。

      這些token更貼近“概念”,而非圖像細節,使模型更擅長理解語言并在圖像中復現。

      整個系統的語言能力依托于Qwen2.5-7B,這是由阿里巴巴開源的一款語言模型。

      騰訊團隊在其基礎上增加了圖像理解與生成模塊,使X-Omni具備圖文雙向通感能力。

      這意味著,無論是菜單、海報、UI界面,還是演講稿、說明書,都可以被自然地轉化為高質量圖像。

      對中國本土市場而言,這種能力至關重要。開源對壘商用,生態之戰才剛開始

      雖然X-Omni在多個關鍵維度上表現優異,但它并未宣稱“碾壓”GPT-4o。評測顯示,改進幅度有限,非革命性躍遷。GPT-4o依然在綜合性能上具備強大競爭力。

      X-Omni的最大意義在于,它將來自多個組織、多個生態的開源技術融為一體,拼出了一個“模塊化大模型”的可能形態。

      它的擴散模型來自德國初創公司Black Forest Labs。語言模型來自阿里巴巴。評價系統與OCR系統則綜合多個開源庫構建而成。

      這一切被整合進一個由騰訊發布的開源代碼與模型,并已在Hugging Face與GitHub上全面開放。

      這和OpenAI閉源的GPT-4o構成了鮮明對照。

      后者雖然強大,但本質上仍是“黑箱”。當GPT-4o在ChatGPT上線圖像生成功能,引發業界驚嘆之時,

      X-Omni則代表著另一條路徑:開放、拼接、重構、調優。

      這種路線或許無法一步登天,卻為AI產業生態提供了另一種可持續發展模式。“后發者”可以通過策略、工程能力和生態協作縮小差距。

      作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!

      GPU 訓練特惠!

      H100/H200 GPU算力按秒計費,平均節省開支30%以上!

      掃碼了解詳情?


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      難以置信!徐萌嫁給87歲的范曾還是“黃花閨女”,妥妥的頭婚…

      難以置信!徐萌嫁給87歲的范曾還是“黃花閨女”,妥妥的頭婚…

      火山詩話
      2025-12-12 07:31:45
      煙臺劉女士事件升級!又一商家發聲,涉案金額已超10萬,攤大事了

      煙臺劉女士事件升級!又一商家發聲,涉案金額已超10萬,攤大事了

      鋭娛之樂
      2025-12-13 08:56:27
      看明白了,2026年春節要“涼涼”?不是沒錢,而是累得不想再折騰

      看明白了,2026年春節要“涼涼”?不是沒錢,而是累得不想再折騰

      冷紫葉
      2025-12-13 15:01:11
      4斤黃金鳳冠被毀!千萬粉絲博主稱是“丈夫親手設計打造”!網友:那個小孩碰了不止一下

      4斤黃金鳳冠被毀!千萬粉絲博主稱是“丈夫親手設計打造”!網友:那個小孩碰了不止一下

      極目新聞
      2025-12-13 20:41:48
      被曝出軌,保劍鋒工作室回應

      被曝出軌,保劍鋒工作室回應

      觀察者網
      2025-12-13 09:59:40
      魔法打敗魔法!銀行辦業務被“刁難”,男子報警要求反查職員身份

      魔法打敗魔法!銀行辦業務被“刁難”,男子報警要求反查職員身份

      火山詩話
      2025-12-14 06:33:29
      見證歷史,中國籃球出現最奇葩比賽,CBA徹底成了大笑話

      見證歷史,中國籃球出現最奇葩比賽,CBA徹底成了大笑話

      宗介說體育
      2025-12-13 15:46:24
      官方:2026年,力爭全國基本實現生娃不花錢

      官方:2026年,力爭全國基本實現生娃不花錢

      南方都市報
      2025-12-13 17:54:15
      難以置信!10年無人發現993萬流失,政務大廳居然放置個人收款碼

      難以置信!10年無人發現993萬流失,政務大廳居然放置個人收款碼

      火山詩話
      2025-12-13 06:53:21
      泰國轟炸柬埔寨電詐園區,效果比反詐軟件好多了

      泰國轟炸柬埔寨電詐園區,效果比反詐軟件好多了

      歷史總在押韻
      2025-12-13 00:33:27
      佳能給員工發63萬,平臺刪視頻,誰在怕勞動者體面?

      佳能給員工發63萬,平臺刪視頻,誰在怕勞動者體面?

      網絡易不易
      2025-12-13 17:52:51
      內江市人大常委會原一級巡視員陳偉全被查

      內江市人大常委會原一級巡視員陳偉全被查

      愛看頭條
      2025-12-13 18:47:06
      常態化暴打日本!全球圍觀吃瓜!更狠的就要來了!

      常態化暴打日本!全球圍觀吃瓜!更狠的就要來了!

      一個壞土豆
      2025-12-12 19:49:47
      湖北十堰市委書記黃劍雄任宜昌市委書記

      湖北十堰市委書記黃劍雄任宜昌市委書記

      澎湃新聞
      2025-12-13 22:00:27
      3名美方人員遇襲死亡,特朗普誓言報復

      3名美方人員遇襲死亡,特朗普誓言報復

      新京報政事兒
      2025-12-14 07:22:53
      利物浦2-0布萊頓!4輪不敗暫升第6 新援閃擊+雙響 薩拉赫替補助攻

      利物浦2-0布萊頓!4輪不敗暫升第6 新援閃擊+雙響 薩拉赫替補助攻

      我愛英超
      2025-12-14 01:04:34
      66個寒冷預警,冷空氣已全面影響廣東!周日或下周一早晨,將出現最低溫

      66個寒冷預警,冷空氣已全面影響廣東!周日或下周一早晨,將出現最低溫

      南方都市報
      2025-12-13 22:40:44
      霸王餐女后續:賬號被扒連夜清空作品,知情人曝更多,早有目的

      霸王餐女后續:賬號被扒連夜清空作品,知情人曝更多,早有目的

      阿纂看事
      2025-12-13 09:24:46
      10人聚餐逃單后續:組局人身份被扒,拒不付餐費,結局大快人心

      10人聚餐逃單后續:組局人身份被扒,拒不付餐費,結局大快人心

      李健政觀察
      2025-12-13 16:15:45
      中山佳能都解散了!為啥還要這樣?安保、綠化、保潔舉動讓人淚目

      中山佳能都解散了!為啥還要這樣?安保、綠化、保潔舉動讓人淚目

      火山詩話
      2025-12-13 08:43:56
      2025-12-14 08:31:00
      大數據文摘 incentive-icons
      大數據文摘
      專注大數據,每日有分享!
      6806文章數 94518關注度
      往期回顧 全部

      科技要聞

      比亞迪、小鵬、北汽,集體表態

      頭條要聞

      女子225個快遞"僅退款"被披露后又有商家發聲:也是她

      頭條要聞

      女子225個快遞"僅退款"被披露后又有商家發聲:也是她

      體育要聞

      有了風騷白人禿頭,忘掉談了10年的前任

      娛樂要聞

      插刀門后,印小天一舉動實現口碑逆轉

      財經要聞

      鎂信健康闖關港交所:被指竊取商業秘密

      汽車要聞

      表面風平浪靜 內里翻天覆地!試駕銀河星艦7 EM-i

      態度原創

      手機
      時尚
      親子
      公開課
      軍事航空

      手機要聞

      三星三折疊對比華為Mate XTs丨Galaxy Z TriFold新形態有何亮點

      法式方頭靴的30種穿法,時髦不重樣!

      親子要聞

      七小七:用清潔配方重新定義兒童食品健康標準,獲雙品類銷量第一

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      俄烏“和平計劃”磋商頓巴斯成焦點

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 一边捏奶头一边高潮视频| 免费无码又爽又刺激高潮的视频 | 欧美真人做爰在线观看| 亚洲大尺度无码无码专线| 欧美顶级metart裸体自慰| AV?无码?白浆| 377p欧洲日本亚洲大胆| 天天躁人人躁人人躁狂躁| 97人妻免费碰视频碰免| 亚洲天堂2013| 精品国产AV| 国产欧美国日产高清| 亚洲蜜桃v妇女| 骚虎视频在线观看| 91亚洲视频| 少妇一边呻吟一边说使劲视频| 中国国语毛片免费观看视频| 4480yy亚洲午夜私人影院剧情| 第一福利导航视频| 少妇的丰满3中文字幕| 久久久久人妻一区精品| 国产一区二区三区在线| 久治县| 苍井空浴缸大战猛男120分钟| 中文字幕亚洲乱码熟女在线萌芽| 三级色网| 91狠狠爱| 国产人妻精品无码av在线| 无套内谢孕妇毛片免费看| 国产成人一区二区三区小说| 富裕县| 粗大的内捧猛烈进出小视频| 四虎国产精品成人免费久久| 上海集散中心旅游官网订票| 日本人妻中文| 国产日产欧产精品精乱了派| 国产精品va无码一区二区| 美女91美女视频网站| 欧美亚洲国产精品久久| 中文字幕乱码人妻二区三区| 中文字幕日韩av|