網易首頁 > 網易號 > 正文申請入駐

DeepSeek-OCR 2 發布：識別性能提升 3.73%

2026-01-27 19:02:25　來源: DoNews網站

北京舉報

分享至

DeepSeek 今日公布了其最新一代文檔識別模型 DeepSeek-OCR 2。很顯然，該模型是在 DeepSeek-OCR 的基礎上升級而來，核心變化集中在視覺編碼器設計上。

研究團隊提出了一種名為 DeepEncoder V2 的新型編碼器結構，它能夠根據圖像語義動態調整視覺信息的處理順序，使模型在進行文字識別前先對視覺內容進行智能排序。這項技術突破源于對傳統視覺語言模型處理方式的重新思考，旨在讓機器更貼近人類的視覺閱讀邏輯。

在傳統的視覺語言模型中，圖像通常會被切分為若干視覺 token，并按照從左上到右下的固定柵格順序送入模型處理。這種方式雖然實現簡單，但與人類在閱讀文檔、表格或公式時基于語義和邏輯關系進行跳躍式瀏覽的方式并不一致。

DeepSeek 論文指出，尤其在版式復雜的文檔場景中，視覺元素之間往往存在明確的邏輯先后關系，僅依賴空間順序可能限制模型對內容結構的理解能力。

DeepSeek-OCR 2 的改進重點在于引入“視覺因果流”的概念。在 DeepEncoder V2 中，研究團隊用一種類語言模型結構替代了原先基于 CLIP 的視覺編碼模塊，并在編碼器內部引入可學習的“因果流查詢 token”。

其編碼器同時包含雙向注意力與因果注意力兩種處理模式，原始視覺信息通過雙向注意力進行全局感知，而新增的查詢標記則通過因果注意力逐步建立語義順序，從而在編碼階段對視覺 token 的順序進行動態重排。最終，只有經過因果重排后的查詢 token 會被送入后續的解碼器，用于生成識別結果。

在整體架構上，DeepSeek-OCR 2 仍沿用了前代模型的編解碼框架。編碼器將圖像轉換為視覺標記并進行壓縮，被壓縮為較少數量的視覺 token，再由 DeepEncoder V2 進行語義建模和順序重組，最后交由一個基于混合專家架構（MoE）的語言模型解碼。

DeepSeek 論文指出，該設計在不顯著增加解碼負擔的前提下，將單頁文檔所使用的視覺 token 數量控制在 256 到 1120 之間，與前代模型及同類系統的資源開銷保持在相近水平。

為驗證模型性能，研究團隊在 OmniDocBench v1.5 基準上進行了全面評估。該基準涵蓋多種類型的中英文文檔，包括學術論文、雜志、報告等，重點考察文本識別、公式解析、表格結構還原以及閱讀順序等指標。

測試結果顯示，在視覺 token 上限更低的情況下，DeepSeek-OCR 2 的整體得分達到 91.09%，相較 DeepSeek-OCR 提升了 3.73%。特別是在閱讀順序準確度方面，編輯距離從 0.085 降至 0.057，表明新模型能夠更合理地理解文檔內容結構。

DeepSeek-OCR 2 在生產環境中也表現出更好的穩定性。在線用戶日志圖像的重復率從 6.25% 降至 4.17%，批處理 PDF 數據的重復率從 3.69% 降至 2.88%。這些改進使得模型在保持高壓縮率的同時，提升了實際應用場景中的可靠性。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

節后首日連發兩條公告中國反制升級對日本軍工"亮劍"

環球網資訊 2026-02-24 17:42:07
4891 跟貼 4891
南海部分海域進行實彈射擊禁止駛入

央視新聞客戶端 2026-02-24 21:54:47
4281 跟貼 4281

巴拿馬政府強行進入并接管港口，李嘉誠旗下長和回應：相關行動不合法，構成嚴重風險，將研究所有可行途徑

都市快報橙柿互動 2026-02-24 14:12:41
2775 跟貼 2775

女子高速堵車走國道偶遇10年沒見過面的初戀，一眼認出對方車牌，確認后互相打招呼

大象新聞 2026-02-24 18:44:05
71 跟貼 71
全美5600多架次航班取消，多州進入緊急狀態

每日經濟新聞 2026-02-24 12:16:37
1147 跟貼 1147

一家四口春節“硬核”出游：從杭州自駕到嘉峪關，2700公里電車充電18次，“真香了”

極目新聞 2026-02-24 18:14:46
51 跟貼 51

300多只東北虎“輕斷食”？景區：每天斷食1個園，司機會帶游客找可投喂區

封面新聞 2026-02-23 16:29:03
1619 跟貼 1619
“不合理不透明！”滬上新能源車充電，遭遇“三重收費”！市民直呼“太離譜”

新民晚報 2026-02-24 19:05:37
122 跟貼 122

《鏢人》原著作者許先哲的逆襲：欠債青年畫出“世界級水平中國動漫精品”

封面新聞 2026-02-24 13:33:07
374 跟貼 374
高盛：AI去年對美國GDP貢獻幾乎為零

財聯社 2026-02-24 16:04:31
139 跟貼 139
“現在至少要10萬”，有人剛花11萬買進：這是剛需，不等了

最江陰 2026-02-24 19:15:01
159 跟貼 159
中辦發文強調“正確政績觀”，有何深意？

中國新聞周刊 2026-02-24 18:35:03
63 跟貼 63
哈爾濱冰雪大世界：正式閉園

大風新聞 2026-02-21 20:36:03
1869 跟貼 1869
“停車1小時繳費60元”，誰在被高昂停車費“背刺”？

中國能源網 2026-02-24 15:13:18
198 跟貼 198
春節期間這些謠言你信了嗎（2026·02·24）

今日辟謠 2026-02-24 17:00:40
147 跟貼 147
媒體：馬斯克設想從月球電磁彈射AI衛星

新華社 2026-02-24 19:17:03
251 跟貼 251
節后首日機票價格回落多條航線單程票價低至200元

界面新聞 2026-02-25 07:10:02
57 跟貼 57
環境空氣質量新國標來了 "好天氣"標準更嚴

新華社 2026-02-24 20:10:04
380 跟貼 380
里薩謝：無論是否先發在場上我都會全力以赴

北青網-北京青年報 2026-02-25 08:40:02
4 跟貼 4
Stein：國王今夏是否留下小薩取決于選秀大會的結果

北青網-北京青年報 2026-02-25 08:40:03
4 跟貼 4
重磅微視頻丨山海尋夢

國際在線 2026-02-24 11:54:11
520 跟貼 520
瘋狂的亞朵：4000元房價過山車

北京商報 2026-02-25 01:15:03
18 跟貼 18
遭博德閃耀雙殺，國米無緣歐冠16強

上游新聞 2026-02-25 09:06:40
2 跟貼 2
葡萄330元/斤，草莓360元/斤！網友高速上看到水果廣告牌驚呆了，種植企業回應

極目新聞 2026-02-24 12:58:13
0 跟貼 0
聚會間隙爸爸驚見3歲兒子從2樓墜落！消防提醒

襄陽市消防救援支隊 2026-02-25 09:56:18
0 跟貼 0
江西一家5口自駕返程遇車禍致1死4傷目擊者稱一半車身被大貨車擠壓在護欄上

閃電新聞 2026-02-25 09:57:16
0 跟貼 0

手機 / 數碼

房產 / 家居

DeepSeek-OCR 2 發布：識別性能提升 3.73%

蘋果MacBook Pro要加觸摸屏了，還帶靈動島

牛彈琴：美伊大戰若還不打 全世界都會看特朗普的笑話

牛彈琴：美伊大戰若還不打 全世界都會看特朗普的笑話

曝雄鹿計劃今夏追小卡 字母哥渴望與其并肩作戰

汪小菲官宣三胎出生：承諾會照顧好3個孩子

春節檔"開門黑" 電影票少賣了7000萬張

態度原創

如果吳清源重生，他會如何與柯潔較量？

《彩虹六號》手游版正式運營開啟 5V5攻防戰術FPS

上海匯工大學揭秘！別被名稱坑了志愿

榮耀MagicPad 4平板曝4月發布，搭載最新驍龍8系處理器

牛彈琴：美伊大戰若還不打全世界都會看特朗普的笑話

牛彈琴：美伊大戰若還不打全世界都會看特朗普的笑話

曝雄鹿計劃今夏追小卡字母哥渴望與其并肩作戰