<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      多模態推理新范式!DiffThinker:用擴散模型「畫」出推理和答案

      0
      分享至



      在多模態大模型(MLLMs)領域,思維鏈(CoT)一直被視為提升推理能力的核心技術。然而,面對復雜的長程、視覺中心任務,這種基于文本生成的推理方式正面臨瓶頸:文本難以精確追蹤視覺信息的變化。形象地說,模型不知道自己想到哪一步了,對應圖像是什么狀態。

      盡管近期的「Thinking with Image」范式可以通過工具等對圖像進行操作,但它們難以擴展到更復雜的長程任務,且在多輪交互中本身開銷巨大。

      近日,來自上海人工智能實驗室、南京大學、香港中文大學和上海交通大學的研究團隊提出了一種全新的生成式多模態推理(Generative Multimodal Reasoning)范式,并發布了模型DiffThinker

      DiffThinker 徹底打破了「多模態輸入 -> 文本輸出」的傳統定式,將推理過程重構為圖像到圖像(Image-to-Image)的生成任務。通過擴散模型(Diffusion Models),DiffThinker 能夠在視覺空間中直接生成推理路徑。

      實驗結果令人驚訝:在包含長程規劃、組合優化、約束滿足、空間推理等 7 項視覺中心的復雜任務中,DiffThinker 的表現顯著優于包括GPT-5 (+314.2%)和Gemini-3-Flash (+111.6%)在內的頂尖閉源模型,以及經過相同數據微調的 Qwen3-VL-32B 基線 (+39.0%)。

      • 論文標題:DiffThinker: Towards Generative Multimodal Reasoning with Diffusion Models
      • 論文地址
      • https://arxiv.org/abs/2512.24165
      • 項目主頁
      • https://diffthinker-project.github.io
      • 代碼倉庫
      • https://github.com/lcqysl/DiffThinker



      01 從「以文思考」到「以圖思考」

      現有的多模態大模型在處理視覺推理任務時,難以追蹤視覺信息的變化。比如在空間導航任務(VSP、Maze 等)中,模型僅靠語言分析路徑,但輸入圖像不變,路徑一長就很容易「看走眼」,不知道自己已經走到了哪。又比如拼圖任務,模型如果不能直接對拼圖操作,很難憑空想象出答案。即便是最新的「Thinking with Image」范式,也往往依賴于多輪對話和工具調用,導致推理鏈路極長,難以擴展到復雜場景。

      研究團隊還在項目主頁提供了幾個小游戲,以直觀理解人與 MLLM 的思維范式差異。

      那么,為什么不能讓模型直接「看」著問題,把答案「畫」出來?

      DiffThinker 提出的核心理念正是如此。研究團隊認為,多模態推理不應局限于符號空間,而應回歸視覺空間,利用擴散模型直接生成答案。具體來說,DiffThinker 基于 Qwen-Image-Edit,配合 Flow Matching 訓練直接用圖像生產答案。



      02 DiffThinker 的四大核心特性


      作為全新的生成式推理范式,DiffThinker 展現出了傳統 MLLM 難以企及的四大特性:

      • 高效推理(Efficient Reasoning)相比于 MLLM 動輒生成數千個 Token 的長思維鏈,DiffThinker 在訓練和推理效率上均表現出色,且準確率更高。



      • 可控推理(Controllable Reasoning)MLLM 的輸出長度不可預測,常出現過長思維鏈甚至輸出崩潰導致死循環。而 DiffThinker 通過固定步數的歐拉求解器,能夠以確定的計算預算完成推理,不受任務邏輯復雜度的干擾。

      • 原生并行推理(Native Parallel Reasoning)這是擴散模型獨有的優勢。在推理時,DiffThinker 能夠在視覺空間中同時探索多條潛在路徑,并隨著去噪過程逐步收斂到最優解。這使得模型可以「邊畫邊推理」,更直觀。



      • 協同推理(Collaborative Reasoning)DiffThinker 還可以與 MLLM 合作。它生成多個候選視覺解,再由 MLLM 進行邏輯驗證。實驗顯示,這種「DiffThinker 生成 + MLLM 驗證」的組合,性能實現「1+1>2」,超越了任何單一模型。



      03 實驗結果:碾壓級的性能


      研究團隊在四個領域的七大任務上進行了系統評測,包括:

      • 序列規劃:VSP,VSP-Super,Maze(迷宮)
      • 組合優化:TSP(旅行商問題)
      • 約束滿足:Sudoku(數獨)
      • 空間配置:Jigsaw(拼圖),VisPuzzle

      主要結果如下:



      DiffThinker 在所有任務上的平均得分高達87.4,而 GPT-5 僅為 21.1,Gemini-3-Flash 為 41.3。同數據訓練的 Qwen3-VL-32B 也只有62.9。

      04 視頻生成 vs 圖像生成


      既然是視覺推理,用視頻模型(Video Generation)會不會更好?

      團隊基于 Wan2.2-TI2V-5B 開發了 DiffThinker-Video 版本。結果發現,雖然視頻能展示動態過程,但在推理準確率上反而不如圖像生成模型,且推理時間增加了近一倍(1.1s vs 2.0s)。這表明,在當前的算力與模型架構下,「以圖思考」仍是比「以視頻思考」更高效的路徑。

      05 結語


      DiffThinker 的出現,標志著生成式多模態推理(Generative Multimodal Reasoning)時代的開啟。它證明了擴散模型不僅能畫畫,還能進行嚴密的邏輯推理。

      對于長程、視覺中心的復雜任務,將推理過程從「文本流」轉變為「視覺流」,或許正是通往下一代通用人工智能的關鍵一步。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      江蘇南京一模特太漂亮 身高177cm體重55kg五官精致到無懈可擊

      江蘇南京一模特太漂亮 身高177cm體重55kg五官精致到無懈可擊

      陳意小可愛
      2026-01-10 01:19:36
      前威爾士國腳已官宣加盟申花!本賽季將正式挑大梁,直接補強頑疾

      前威爾士國腳已官宣加盟申花!本賽季將正式挑大梁,直接補強頑疾

      振剛說足球
      2026-01-09 09:28:48
      伊朗最高領袖哈梅內伊呼吁伊朗人民保持團結

      伊朗最高領袖哈梅內伊呼吁伊朗人民保持團結

      界面新聞
      2026-01-09 17:26:42
      官宣,上海男籃3人離隊,2小前鋒+1內線,王哲林送祝福

      官宣,上海男籃3人離隊,2小前鋒+1內線,王哲林送祝福

      樂聊球
      2026-01-10 08:39:43
      色字頭上一把刀!沈陽一男子追求00后女生“霸王硬上弓”,被判刑

      色字頭上一把刀!沈陽一男子追求00后女生“霸王硬上弓”,被判刑

      火山詩話
      2026-01-09 08:45:32
      皮爾斯:老鷹就是中游球隊,他們要能奪冠我從洛杉磯跪到紐約

      皮爾斯:老鷹就是中游球隊,他們要能奪冠我從洛杉磯跪到紐約

      懂球帝
      2026-01-10 11:22:02
      1976年毛主席追悼會后,葉帥密會許世友,只問了一句話,南京軍區的指揮權到底在誰手里?

      1976年毛主席追悼會后,葉帥密會許世友,只問了一句話,南京軍區的指揮權到底在誰手里?

      文史明鑒
      2026-01-04 18:33:13
      洗澡可能影響壽命!醫生再次提醒:51歲以后,牢記洗澡“4不要”

      洗澡可能影響壽命!醫生再次提醒:51歲以后,牢記洗澡“4不要”

      39健康網
      2026-01-08 20:18:51
      烏方公布據稱為“榛樹”導彈殘骸照片 披露俄軍襲擊細節

      烏方公布據稱為“榛樹”導彈殘骸照片 披露俄軍襲擊細節

      環球網資訊
      2026-01-09 21:41:11
      無錫博物院嚴正聲明!

      無錫博物院嚴正聲明!

      江南晚報
      2026-01-09 17:46:57
      格陵蘭發達到什么水平?我去了才發現,差距真的太大

      格陵蘭發達到什么水平?我去了才發現,差距真的太大

      娛樂八卦木木子
      2026-01-07 15:14:07
      華為突然官宣:1月10日,Mate直降1800元

      華為突然官宣:1月10日,Mate直降1800元

      3C毒物
      2026-01-10 00:07:03
      宋喆近況曝光,今隱居縣城太落魄,判若兩人,前妻楊慧過上新生活

      宋喆近況曝光,今隱居縣城太落魄,判若兩人,前妻楊慧過上新生活

      豐譚筆錄
      2026-01-08 07:20:07
      最低調普京女婿被億萬富豪當街暴打:拒絕10億賠償,只提一個要求

      最低調普京女婿被億萬富豪當街暴打:拒絕10億賠償,只提一個要求

      貳文
      2024-10-31 00:30:11
      被處決毒梟要水喝,3停5口是17年前教的暗號:我是臥底,有內鬼!

      被處決毒梟要水喝,3停5口是17年前教的暗號:我是臥底,有內鬼!

      星宇共鳴
      2025-12-29 09:56:33
      410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

      410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

      深度報
      2025-12-14 22:36:54
      吳綺莉26歲女兒近況曝光。在香港開設計工作室,自曝收入夠給房租

      吳綺莉26歲女兒近況曝光。在香港開設計工作室,自曝收入夠給房租

      艷兒說電影
      2026-01-06 16:01:21
      今夏將聯合舉行世界杯足球賽,特朗普突然發聲:販毒集團控制墨西哥,很快對其陸地打擊

      今夏將聯合舉行世界杯足球賽,特朗普突然發聲:販毒集團控制墨西哥,很快對其陸地打擊

      紅星新聞
      2026-01-09 16:23:21
      美國千億投資打水漂后,郭臺銘想通了!帶46臺光刻機回國求賞飯

      美國千億投資打水漂后,郭臺銘想通了!帶46臺光刻機回國求賞飯

      奉壹數碼
      2026-01-05 14:06:20
      1972年,175位將軍復出沒人要,各大軍區紛紛甩鍋,周總理這招絕了

      1972年,175位將軍復出沒人要,各大軍區紛紛甩鍋,周總理這招絕了

      寄史言志
      2026-01-08 18:02:14
      2026-01-10 11:56:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12088文章數 142533關注度
      往期回顧 全部

      科技要聞

      傳DeepSeek準備第二次震驚全世界

      頭條要聞

      媒體:中國若在其任期統一特朗普不悅 中方回應滴水不漏

      頭條要聞

      媒體:中國若在其任期統一特朗普不悅 中方回應滴水不漏

      體育要聞

      楊瀚森:上場時間要去爭取 而不是要求

      娛樂要聞

      趙櫻子稱和蔣毅試婚三天:像試面膜

      財經要聞

      投資必看!瑞銀李萌給出3大核心配置建議

      汽車要聞

      寶馬25年全球銷量246.3萬臺 中國仍是第一大市場

      態度原創

      健康
      藝術
      本地
      公開課
      軍事航空

      這些新療法,讓化療不再那么痛苦

      藝術要聞

      你能認出毛主席手書的全部嗎?揭秘其中隱藏的秘密!

      本地新聞

      云游內蒙|“包”你再來?一座在硬核里釀出詩意的城

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:已開始從委石油資源中賺錢

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产品无码一区二区三区在线| 久久久久久亚洲精品成人| 罗田县| 天堂中文最新版在线官网在线| 亚洲丝袜熟女在线樱桃| 中国AV网| 麻豆a级片| 亚洲av成人在线网站| 亚洲精品国产suv| 韩国三级大全久久网站| 熟女人妻视频| 青青久草| 色狠狠一区二区三区香蕉| 97人人爽| 精品国产91久久久久久亚瑟 | 亚洲∧v久久久无码精品| 欧美噜噜久久久xxx| AV激情亚洲男人的天堂| 果冻传媒一区| 顺义区| 麻豆国产va免费精品高清在线| 99伊人网| 18岁日韩内射颜射午夜久久成人 | 亚洲av无码专区在线厂| 成人免费看www网址入口| 香蕉久久av一区二区三区| 人人添人人妻人人爽夜欢视频| 久久久av波多野一区二区| 涟源市| 国产精品污www在线观看| AV亚洲?电影AV?AV天堂| 久久精品亚洲中文无东京热| www.黄色| 99精品在线| 亚洲?欧美?自拍?偷拍| 中文字幕?人妻熟女| av在线无码| 日韩成人电影一区| 欧洲美熟女乱又伦免费视频| 国产精品无码久久久久久| 亚洲精品无amm毛片|