<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek-OCR是「長文本理解」未來方向?中科院VTCBench給出答案

      0
      分享至



      DeepSeek-OCR 的視覺文本壓縮(VTC)技術通過將文本編碼為視覺 Token,實現高達 10 倍的壓縮率,大幅降低大模型處理長文本的成本。但是,視覺語言模型能否理解壓縮后的高密度信息?中科院自動化所等推出 VTCBench 基準測試,評估模型在視覺空間中的認知極限,包括信息檢索、關聯推理和長期記憶三大任務。

      近期,DeepSeek-OCR 憑借其創新的「視覺文本壓縮」(Vision-Text Compression, VTC)范式引發了技術圈的高度關注,以極少的視覺 Token 實現高效的文本信息編碼,為長文本處理開辟了新路徑。

      這一突破性進展讓大模型處理超長文本的成本大幅降低,但也拋出了一個核心問題:當長文本被高度壓縮為 2D 圖像后,視覺語言模型(VLM)真的能理解其中的內容嗎?

      為了解答這一疑問,來自中科院自動化所、中國科學院香港創新研究院等機構的研究團隊推出了首個專門針對視覺 - 文本壓縮范式的基準測試 ——VTCBench。



      • 論文鏈接:https://arxiv.org/abs/2512.15649
      • VTCBench 鏈接: https://github.com/Moenupa/VTCBench
      • VLMEvalKit 鏈接:https://github.com/bjzhb666/VLMEvalKit
      • Huggingface 鏈接: https://huggingface.co/datasets/MLLM-CL/VTCBench



      圖 1:視覺 - 文本壓縮 (VTC) 流程演示及 VTCBench

      與傳統大模型直接讀取成千上萬的純文本 Token 不同,VTC 范式(如 DeepSeek-OCR)先將長文檔渲染 (Rendering)為高密度的 2D 圖像,再由視覺編碼器轉化為少量的視覺 Token。

      該技術可實現 2 倍至 10 倍的 Token 壓縮率,顯著降低了長文本處理時的計算與顯存開銷。

      VTCBench 現已在 GitHub 和 Huggingface 全面開源,其衍生版本 VTCBench-Wild 是一個統一的、全方位評估模型在復雜現實場景下視覺文本壓縮的魯棒性,現已集成到 VLMevalkit。

      核心使命——衡量「看得見」之后的「看得懂」

      目前的 VLM 也許能出色地完成 OCR 識別,但在處理 VTC 壓縮后的高密度信息時,其長文本理解能力仍存疑。

      VTCBench 通過三大任務,系統性地評估模型在視覺空間中的認知極限:

      1. VTC-Retrieval (信息檢索):在視覺「大海」中尋找特定事實的「針」(Needle-in-a-Haystack),測試模型對空間分布信息的捕捉能力;
      2. VTC-Reasoning (關聯推理):挑戰模型在幾乎沒有文本重疊的情況下,通過關聯推理尋找事實,超越單純的詞匯檢索;
      3. VTC-Memory (長期記憶):模擬超長對話,評估模型在視覺壓縮框架下,抵御時間與結構性信息衰減的能力。

      此外,團隊同步推出了 VTCBench-Wild,引入 99 種不同的渲染配置(涵蓋多種字體、字號、行高及背景),全方位檢測模型在復雜現實場景下的魯棒性。

      揭秘視覺壓縮背后的認知瓶頸



      圖 2:VTCBench 針對模型在長圖像中檢索信息的熱力圖。橫軸代表上下文長度,縱軸代表關鍵事實(Needle)在文檔中的深度。展現了模型表現的「迷失」與突破。

      測試結果呈現出顯著的 「U 型曲線」:與文本模型類似,視覺語言模型(VLM)能夠精準捕捉開頭和結尾的信息,但對于中間部分的事實,理解能力會隨著文檔變長而劇烈衰退。

      這證明了即使在視覺空間,模型依然存在嚴重的「空間注意力偏見」,是未來 VTC 架構優化的關鍵方向。

      行業洞察 —— 視覺壓縮是長文本的終局嗎?



      通過對 GPT、Gemini、Claude、QwenVL、InternVL、Gemma、KimiVL、Seed1.5 等 10 余種尖端模型的深度評測,可以發現:

      雖然 VTC 極大提升了效率,但現有 VLM 在復雜推理和記憶任務上的表現仍顯著弱于純文本 LLM;

      消融實驗證明,信息密度是決定模型性能的關鍵因素,直接影響視覺編碼器的識別精度;

      Gemini-3-Pro 在 VTCBench-Wild 上表現驚艷,其視覺理解能力已幾乎追平其純文本基準,證明了 VTC 是實現大規模長文本處理的極其可行的路徑!

      總結

      如果說傳統的長文本處理是「逐字閱讀」,那么, DeepSeek-OCR 所引領的 VTC 范式就是「過目成誦」的攝影式記憶。VTCBench 的出現,正是為了確保模型在擁有這種「超能力」的同時,依然能夠讀懂字里行間的微言大義。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      有哪些說話給人下套的例子?網友:偏僻叫不到代駕,都給安排明白

      有哪些說話給人下套的例子?網友:偏僻叫不到代駕,都給安排明白

      夜深愛雜談
      2026-01-21 20:01:54
      未來兩周觸底反彈!3大生肖喜事臨門,貴人相助,好日子開始

      未來兩周觸底反彈!3大生肖喜事臨門,貴人相助,好日子開始

      人閒情事
      2026-01-22 12:21:54
      徐州市委書記回應“為何不急著官宣萬億”

      徐州市委書記回應“為何不急著官宣萬億”

      極目新聞
      2026-01-21 21:29:39
      《楚喬傳2》林更新從冰湖出來變成了李昀銳,兩個人差距太大了!

      《楚喬傳2》林更新從冰湖出來變成了李昀銳,兩個人差距太大了!

      小娛樂悠悠
      2026-01-21 11:01:51
      開始行動!勇士拉動三方交易,想吃回頭草帶回狀元?但科爾或離隊

      開始行動!勇士拉動三方交易,想吃回頭草帶回狀元?但科爾或離隊

      你的籃球頻道
      2026-01-22 08:38:07
      武統、和統都沒戲了?臺軍事專家:中國大陸已經在走第三條路

      武統、和統都沒戲了?臺軍事專家:中國大陸已經在走第三條路

      近史博覽
      2026-01-18 16:23:54
      第7艘!中國香港油輪突發被美軍扣押,對華海上封鎖預演已經打響

      第7艘!中國香港油輪突發被美軍扣押,對華海上封鎖預演已經打響

      阿傖說事
      2026-01-22 11:20:54
      中美默契淋漓盡致,中方拒絕日本入常,特朗普一句話直戳高市痛點

      中美默契淋漓盡致,中方拒絕日本入常,特朗普一句話直戳高市痛點

      史料布籍
      2026-01-22 12:41:48
      貝森特放狠話:無懼美債遭拋售,“丹麥本身都無足輕重”

      貝森特放狠話:無懼美債遭拋售,“丹麥本身都無足輕重”

      財聯社
      2026-01-21 18:10:41
      美媒很感慨:要不是中國還在反抗特朗普,幾乎全世界都向他投降了

      美媒很感慨:要不是中國還在反抗特朗普,幾乎全世界都向他投降了

      南宗歷史
      2026-01-21 11:21:54
      王勵勤出手了!國乒大洗牌重點培養5位選手 孫穎莎王楚欽陷入兩難

      王勵勤出手了!國乒大洗牌重點培養5位選手 孫穎莎王楚欽陷入兩難

      做一個合格的吃瓜群眾
      2026-01-17 16:38:59
      梁洛施罕見談離開李澤楷原因:他很富有,是一生摯愛,也不后悔

      梁洛施罕見談離開李澤楷原因:他很富有,是一生摯愛,也不后悔

      阿代說事
      2026-01-21 16:09:15
      為何一艘美航母上,都要帶足大量女兵,她們在航母上有什么作用?

      為何一艘美航母上,都要帶足大量女兵,她們在航母上有什么作用?

      大千世界觀
      2025-12-19 21:58:37
      馬克龍涉華表態,中方回應

      馬克龍涉華表態,中方回應

      環球時報國際
      2026-01-21 16:20:45
      4-2!亞馬爾缺席,萊萬搶戲,弗里克神換人,巴薩輕取歐冠弱旅

      4-2!亞馬爾缺席,萊萬搶戲,弗里克神換人,巴薩輕取歐冠弱旅

      我的護球最獨特
      2026-01-22 06:09:57
      趙露思新劇《戀人》狂刪10集,播出時間曝光!3大隱憂被唱衰

      趙露思新劇《戀人》狂刪10集,播出時間曝光!3大隱憂被唱衰

      一盅情懷
      2026-01-22 13:00:23
      特大地磁暴爆發!星鏈衛星大量墜落地球,空間站航天員該怎么應對

      特大地磁暴爆發!星鏈衛星大量墜落地球,空間站航天員該怎么應對

      三農老歷
      2026-01-22 00:17:52
      “美商務部長發表暴論,歐洲央行行長直接離場”

      “美商務部長發表暴論,歐洲央行行長直接離場”

      觀察者網
      2026-01-21 22:11:04
      小面罩引爆TikTok市場,一周狂銷80萬,賣家發財了

      小面罩引爆TikTok市場,一周狂銷80萬,賣家發財了

      跨境派Pro
      2026-01-19 14:12:10
      新四軍剛沖出日軍包圍圈,旅長卻下令:打回去,日軍人數不對勁!

      新四軍剛沖出日軍包圍圈,旅長卻下令:打回去,日軍人數不對勁!

      史之銘
      2026-01-22 06:29:44
      2026-01-22 13:43:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12163文章數 142546關注度
      往期回顧 全部

      科技要聞

      幾千億只是開胃菜,AI基建還得再砸幾萬億

      頭條要聞

      小伙騎車撞特斯拉后貸款賠1.5萬修車費 發票只開9千元

      頭條要聞

      小伙騎車撞特斯拉后貸款賠1.5萬修車費 發票只開9千元

      體育要聞

      珍妮回應爆料:湖人不感激詹姆斯付出絕非事實

      娛樂要聞

      鐘麗緹土耳其高空落淚 與張倫碩擁吻

      財經要聞

      申通快遞創始人被前夫索要股份

      汽車要聞

      今年集中上市 旅行車的春天可能真要來了

      態度原創

      藝術
      游戲
      教育
      親子
      軍事航空

      藝術要聞

      一場雪,飄進了唐詩

      威世智竊喜?萬智牌新卡包混入3月預定的珍稀卡

      教育要聞

      時間定了!今年高考全國統考將于6月7日、8日舉行

      親子要聞

      駝奶粉哪個牌子好?2026駱駝奶粉品牌十強!

      軍事要聞

      特朗普:對美國的真正威脅是聯合國和北約

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 精品人妻大屁股白浆无码| 少妇人妻精品一区二区| 亚洲色网导航| 久久国产精品二国产人妻| 精品无码黑人又粗又大又长| 中文字幕网红自拍偷拍视频| av无码av天天av天天爽| 綦江县| 果冻传媒mv免费播放在线观看| 国产av制服丝袜| 亚洲综合色中文网| 内射极品少妇xxxxxhd| 国产精品人成视频免费播放| 精品人伦一区二区三区潘金莲| 中文字幕乱码人妻无码久久| 波多野42部无码喷潮| xxx综合网| 日韩欧美的偷拍?一区二区| 亚洲中文字幕免费| 蜜臀av中文人妻系列| 亚洲国产成人精品av区按摩| 国产精品99久久久久久猫咪| 日韩成人无码| 国产精品厕所| 中文无码日韩欧| www国产内插视频| 免费无码又黄又爽又刺激| 江陵县| 丰满熟妇人妻av无码区| 亚洲欧洲AV| 亚洲va中文字幕无码久久不卡| jizzjizz亚洲| 亚洲成人a| 国产精品999| 四房播播成人网| 狠狠色婷婷久久综合频道日韩| 日韩人妻OL丝袜AV一二区| 精品熟女日韩中文十区| 久久国产成人午夜av影院| 女人色熟女乱| 91免费国产高清观看|