<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      把它「畫」進隱空間!新框架RoT探索大模型隱空間推理新范式

      0
      分享至



      在 LLM 時代,思維鏈( CoT)已成為解鎖模型復雜推理能力的關鍵鑰匙。然而,CoT 的冗長問題一直困擾著研究者——中間推理步驟和解碼操作帶來了巨大的計算開銷和顯存占用,嚴重制約了模型的推理效率。

      為了解決這個問題,研究界近期嘗試了「隱式 CoT」(Implicit CoT),即讓模型在內部隱狀態中完成推理,而不輸出具體的文本。這種方法雖然快,但卻是個「黑盒」:我們無法知道模型到底想了什么,也難以進行監督。

      有什么方案既保證推理速度快,又使得過程可分析,還無需昂貴的預訓練?

      針對這一挑戰,騰訊內容服務部 BAC 聯合清華大學與北京大學,提出了一種名為Render-of-Thought (RoT)的新框架。RoT 的核心思想非常巧妙:利用多模態模型(VLM)已有的視覺編碼器作為「語義錨點」,將文本推理步驟「渲染」為圖像的視覺嵌入(Visual Embeddings)。

      這種方法不僅將推理過程壓縮到了致密的視覺潛空間中,還通過視覺渲染讓隱式推理過程變得可分析且可追蹤。



      • 論文標題:Render-of-Thought: Rendering Textual Chain-of-Thought as Images for Visual Latent Reasoning
      • 論文地址:https://arxiv.org/abs/2601.14750
      • Github 地址:https://github.com/TencentBAC/RoT
      • Huggingface地址:https://huggingface.co/collections/TencentBAC/rot

      顯式太慢,隱式太黑盒?

      RoT 走出第三條路

      顯式 CoT (Explicit CoT):讓模型把每一步推理都寫出來,就像學生做數學題寫步驟一樣。生成幾百個 Token 的中間步驟不僅費時,還極其消耗顯存。

      隱式 CoT (Implicit CoT):模型直接在內部隱狀態中進行推理,不輸出具體文本。這種方式就像把思考過程扔進了一個「黑箱」,缺乏中間過程的監督。

      Render-of-Thought (RoT):另辟蹊徑,把「思考」變成了「作畫」。利用視覺信息的高密度特性,將冗長的文本壓縮成緊湊的視覺向量。這不僅有跡可循,還大幅提升了推理速度。



      拒絕「黑盒」:

      讓隱式推理「看得見、摸得著」

      RoT 是一種將文本思維鏈通過光學渲染(Optical Rendering)和視覺知識蒸餾轉化為緊湊視覺表征的新范式。

      與以往需要從頭學習「推理 Token」的隱式方法不同,RoT 直接利用了現有 VLM(如 Qwen-VL, LLaVA)中凍結的視覺編碼器。通過將 LLM 的隱狀態與渲染文本的視覺嵌入對齊,RoT 實現了即插即用(Plug-and-Play),無需額外的預訓練開銷。渲染方案將文本推理步驟轉化為單行圖像,隱空間推理方法通過投影頭將 LLM 生成的隱狀態與視覺特征對齊。

      為了適應自回歸思維鏈的序列化建模,研究團隊摒棄了固定尺寸的圖像渲染方案,采用了單行圖像渲染。該策略可以根據文本長度動態修改所需的圖像寬度。此外,單行的渲染方式確保圖像的 Patch 嚴格按照從左到右的方式提取,自然地將視覺序列與文本順序對齊。



      移花接木的藝術:

      兩步訓練實現「降維打擊」

      RoT 的實現過程主要分為兩個階段,旨在逐步將 LLM 的離散推理能力轉化為連續的視覺隱空間推理能力。

      階段一:視覺對齊 (Visual Alignment)

      這一階段凍結了 LLM 和視覺編碼器,僅訓練一個輕量級的「視覺投影頭」(Visual Projection Head)。目標是將 LLM 的文本隱狀態映射到由視覺編碼器提取的「渲染 CoT 圖像」的特征空間上。





      此外,在第一階段中,為了使模型與所提出的推理模式保持一致,同時對<|img_end|>這一 special token 和答案的交叉熵損失進行了建模:





      階段二:潛在監督微調 (Latent Supervised Fine-Tuning)

      在對齊之后,第二階段通過 LoRA 微調 LLM,并且凍結已經訓練對齊的投影頭。此時,模型不再生成文本 Token,而是自回歸地生成一串連續的「潛在視覺 Token」(Latent Visual Tokens)。這些 Token 在隱空間中模擬了視覺編碼器的輸出,最終引導模型解碼出正確的文本答案。



      推理與解碼策略

      推理過程要求模型自主地從連續的潛在推理空間導航到離散的文本解空間。研究團隊探索了兩種方案:基于 Special Token 的動態終止策略以及固定 Token 預算的靜態終止策略。

      • 基于 Special Token 的動態終止策略







      • 固定 Token 預算的靜態終止策略

      該策略將潛在思維鏈的長度限制為一個固定的超參數。達到這個閾值時,會手動添加<|img_end|>這一 special token,以觸發從潛在推理到文本生成的轉換。

      研究團隊在實驗中發現,動態終止策略的性能明顯低于固定 Token 預算策略。這種性能差距可能源于連續潛空間中自我調節停止機制的內在不穩定性。在生成潛空間推理嵌入時,隱藏狀態可能無法始終如一地為終止標記生成高置信度的預測,從而導致過早或延遲的轉換,破壞推理流程。

      此外,采用固定 Token 預算策略時,每個數據集的最優 Token 預算各不相同。在 GSM8k-Aug 數據集上,32 個 Token 能實現最佳性能,而 MATH 數據集則需要 64 個 Token 才能達到峰值準確率。研究者推測這種差異的出現是因為 MATH 數據集更具挑戰性,需要更長的推理鏈。



      實測數據說話:

      推理速度「狂飆」

      研究團隊在 GSM8k、MATH、SVAMP 等多個數學和邏輯推理基準上對 RoT 進行了廣泛測試。實驗基于 Qwen3-VL 和 LLaVA-V1.6 等主流架構。

      • 顯著的壓縮與加速:相比于顯式 CoT,RoT 實現了 3-4 倍的 Token 壓縮率。在推理速度上,RoT 展現出了巨大的優勢。例如在 Qwen3-VL-4B 模型上,Pass@1/#L(準確率與長度比)指標顯著優于基線。



      • 優于現有的隱式推理方法:與 Coconut、CoLaR 等最新的隱式推理方法相比,RoT 在準確率上表現出色。特別是在 MultiArith 數據集上,RoT (Qwen3-VL-4B) 達到了 97.2% 的準確率,顯著優于同等規模下其他隱空間推理方案。





      • 隱空間推理的可分析性:RoT 的一大亮點在于其可分析性。由于隱狀態被對齊到了視覺空間,可以通過熱力圖(Heatmap)等來觀察模型的「思考過程」。研究團隊展示了 MATH 數據集的一個案例。可以看到,生成的潛在 Token 呈現出明顯的結構化模式,Token 相似度矩陣顯示了推理的階段性。這證明模型并非在隨機生成向量,而是在進行有邏輯的隱式推理。



      單行渲染 vs. 多行渲染

      在 RoT 中,傳統的固定尺寸的多行渲染會導致文本在圖像中頻繁換行。對于模型來說,這種換行在視覺空間中引入了不必要的「空間跳躍」,打斷了語義的連續性。

      為了驗證這一點,研究團隊對比了「固定尺寸的多行渲染圖像」與 RoT 文中使用的「單行動態寬度圖像」。



      如上圖所示,單行渲染相比多行渲染收斂更快,同時能夠更好地契合語言模型從左到右的序列生成特性。

      兩階段訓練缺一不可

      為了評估漸進式訓練策略的效果,研究團隊分別對每個階段進行獨立消融實驗。

      去除第一階段會導致 MATH 的準確率從 33.2% 降至 22.2%,表明視覺對齊對于構建潛在空間結構以及在復雜任務中防止表示坍縮至關重要。同樣,排除第二階段也會導致性能顯著下降,這會導致模型難以從連續的潛在空間中推導出最終答案。



      展望

      Render-of-Thought 提出了一種極具前景的「視覺化思維」范式。它打破了文本模態的限制,利用視覺信息的高密度特性來壓縮推理過程。

      這項工作不僅大幅提升了推理效率,更重要的是,它通過「將思維渲染為圖像」這一直觀的想法,為理解大模型神秘的內部隱空間提供了一扇新的窗口。對于未來在端側設備等資源受限場景下部署強推理模型,RoT 提供了一條切實可行的技術路徑。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      就一點
      2025-11-22 10:36:39
      徹底崩盤!基輔上演“大逃亡”,美軍M270被俄打爆,小澤幻想破滅

      徹底崩盤!基輔上演“大逃亡”,美軍M270被俄打爆,小澤幻想破滅

      妙知
      2026-01-23 11:55:37
      大陸發布26道警告,賴清德家人已逃亡美國,洪秀柱:統一指日可待

      大陸發布26道警告,賴清德家人已逃亡美國,洪秀柱:統一指日可待

      boss外傳
      2026-01-24 20:00:03
      澳網女單十六強出爐!王欣瑜成中國金花獨苗,刷新個人最佳戰績

      澳網女單十六強出爐!王欣瑜成中國金花獨苗,刷新個人最佳戰績

      女網連連看
      2026-01-24 20:08:07
      植物人妻子懷孕生下孩子,一聲媽媽我愛你,喊醒昏迷多年的妻子

      植物人妻子懷孕生下孩子,一聲媽媽我愛你,喊醒昏迷多年的妻子

      有書
      2026-01-23 20:40:19
      李亞鵬最驕傲的投資:16年養大的汶川女孩,如今給他轉了10008元

      李亞鵬最驕傲的投資:16年養大的汶川女孩,如今給他轉了10008元

      牛牛叨史
      2025-12-10 22:19:51
      官媒親宣,33歲韋東奕再破天花板,讓王虹和整個學術圈“沉默”了

      官媒親宣,33歲韋東奕再破天花板,讓王虹和整個學術圈“沉默”了

      趣文說娛
      2026-01-24 15:17:05
      后悔也晚了!大批F35逼到家門口,伊朗卻發現紅旗9和殲10還未到位

      后悔也晚了!大批F35逼到家門口,伊朗卻發現紅旗9和殲10還未到位

      書紀文譚
      2026-01-23 19:37:18
      新郎曬44張婚紗照,僅有6張新娘正臉,其余大半是母親,女方回應

      新郎曬44張婚紗照,僅有6張新娘正臉,其余大半是母親,女方回應

      小涵愛說事
      2026-01-23 14:28:54
      很多中國人并不知道,高學歷的華人在美國根本就沒出路!

      很多中國人并不知道,高學歷的華人在美國根本就沒出路!

      達文西看世界
      2026-01-24 15:28:50
      24 小時內,中美爆發兩波爭端,美軍艦硬闖臺海,解放軍火速出手

      24 小時內,中美爆發兩波爭端,美軍艦硬闖臺海,解放軍火速出手

      議紀史
      2026-01-23 14:25:03
      特朗普:考慮全面封鎖!油價大漲!

      特朗普:考慮全面封鎖!油價大漲!

      魯中晨報
      2026-01-24 09:55:02
      故事:大伯排污口對準我魚塘,我不吭聲,連夜抽干水種五十株桉樹

      故事:大伯排污口對準我魚塘,我不吭聲,連夜抽干水種五十株桉樹

      二十一號故事鋪
      2026-01-19 22:40:04
      諾阿:我過了好久才接受公牛打不過詹姆斯的事實;當時每年都盼著對陣他

      諾阿:我過了好久才接受公牛打不過詹姆斯的事實;當時每年都盼著對陣他

      懂球帝
      2026-01-24 15:06:36
      官媒發文,趙心童再破天花板,讓羅伯遜和所有臺球名將刮目相看

      官媒發文,趙心童再破天花板,讓羅伯遜和所有臺球名將刮目相看

      曉囝愛八卦
      2026-01-24 15:23:50
      大海慟哭,渤海二號石油鉆井平臺沉沒,事故背后隱藏著悲慘真相

      大海慟哭,渤海二號石油鉆井平臺沉沒,事故背后隱藏著悲慘真相

      丞丞故事匯
      2026-01-22 06:09:45
      小伙騎車撞特斯拉后賠償1.5萬修車費,4S店發票咋只開了9000元?多方回應

      小伙騎車撞特斯拉后賠償1.5萬修車費,4S店發票咋只開了9000元?多方回應

      大風新聞
      2026-01-22 12:09:03
      日本真子公主找到新工作!律師老公負責帶娃,比哈里和大布強太多

      日本真子公主找到新工作!律師老公負責帶娃,比哈里和大布強太多

      手工制作阿殲
      2026-01-24 02:55:57
      祝賀國乒!一場3-1,林詩棟、黃友政打敗德國組合,斬獲男雙冠軍

      祝賀國乒!一場3-1,林詩棟、黃友政打敗德國組合,斬獲男雙冠軍

      齊帥
      2026-01-24 18:41:12
      德國總理默茨:大國新時代已經開啟

      德國總理默茨:大國新時代已經開啟

      參考消息
      2026-01-23 16:32:08
      2026-01-24 20:59:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12179文章數 142549關注度
      往期回顧 全部

      科技要聞

      特斯拉Cybercrab即將落地 每公里不到1塊錢

      頭條要聞

      安徽女教師校內宿舍病亡2天后才被發現 學校:建議起訴

      頭條要聞

      安徽女教師校內宿舍病亡2天后才被發現 學校:建議起訴

      體育要聞

      當家球星打替補,他們在故意擺爛?

      娛樂要聞

      回歸還是頂流 鳳凰傳奇將現身馬年春晚

      財經要聞

      “百年老字號”張小泉遭60億債務壓頂

      汽車要聞

      有增程和純電版可選 日產NX8或于3-4月間上市

      態度原創

      健康
      教育
      家居
      游戲
      時尚

      耳石脫落為何讓人天旋地轉+惡心?

      教育要聞

      高三生注意!2026年四川高校體育單招簡章發布

      家居要聞

      在家度假 160平南洋混搭宅

      踢球還能爆衣?這款足球新游還是太懂玩家了

      冬天最佳“顯瘦”公式:上短+下長

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲av日韩av中文高清性色| 亚洲男人的天堂AV| 亚洲成人黄色网| 欧美成人黄在线观看| 国精产品一二三区精华液| 人妻无码中文久久久久专区| 久久精品国产精品亚洲蜜月| 国产网站在线看| 人人妻人人玩人人澡人人爽| 日韩成人综合| 在线无码中文字幕一区| 国产熟妇乱子伦视频在线观看 | 久久夜色撩人精品国产小说 | 无码视频伊人| 免费av网站| 免费观看欧美性一级| 亚洲欧美成人一区二区在线电影 | 国产在线观看不卡免费| 中文字幕无码乱码人妻系列蜜桃 | 色综合久久成人综合网| 国模无码在线| 永久免费无码av网站在线观看| 亚洲丝袜熟女| 一本本月无码-| 亚洲一区av| 亚洲欧洲日韩国产综合在线二区| 亚洲人成网站在线播放2019| 亚洲老妈激情一区二区三区 | 龙州县| 国产成人8x视频网站入口| 九九色综合| 隔壁老王国产在线精品| 亚州成人在线| 国产亚洲精品久久久闺蜜| 国产av制服丝袜| 精品国产91久久久久久亚瑟 | 久久国产精品偷| 乱人伦中文字幕成人网站在线| 国语自产精品视频在线看| 欧美黑人又粗又硬xxxxx喷水| 国产成人综合久久精品免费|