<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek 新模型震撼 AI 圈:用視覺模型讀文檔,壓縮率高達 90%,信息保真 97%!

      0
      分享至


      大數據文摘出品

      最近,DeepSeek 推出了一種全新的 OCR 系統,能讓 AI 在不超出內存限制的情況下,處理更長的文檔。


      地址: https://github.com/deepseek-ai/DeepSeek-OCR?tab=readme-ov-file

      這套系統的關鍵,是把文字當作圖像來壓縮。DeepSeek 發現,處理圖片反而比處理純文本更節省算力。

      據其技術論文,系統在保留97% 信息量的前提下,可將文檔壓縮至原來的十分之一。

      換句話說,一本上百頁的 PDF,經 DeepSeek 處理后,只需原來十分之一的 token 數量,就能被 AI 完整閱讀。

      DeepSeek OCR 的核心由兩部分組成:一是圖像處理模塊,DeepEncoder,二是基于Deepseek-3B-MoE的文本生成器。.

      DeepEncoder 擁有 3.8 億參數,負責將文檔圖片分析為壓縮后的視覺 token;文本生成器在此基礎上恢復文字與結構。


      在技術上,它融合了 Meta 的SAM(Segment Anything Model)與 OpenAI 的CLIP 模型

      SAM 擔任局部視覺分析,CLIP 則提供全局語義關聯。兩者之間,嵌入了一個16 倍壓縮器,大幅減少圖像 token 數量。

      一張 1024×1024 像素的圖片,起初被分為 4096 個 token;經壓縮后,只剩 256 個。這一過程的算力節省是數量級的:CLIP 的計算負擔因此顯著下降。

      在低分辨率下,DeepSeek OCR 每張圖僅需 64 個視覺 token;高分辨率時也不超過 400。

      相比之下,傳統 OCR 系統往往需要數千 token 才能完成同樣的任務。


      DeepSeek 并不僅僅識別文字。它能識別圖表、化學式、幾何圖形等多種復雜結構。

      研究團隊稱,系統可直接從財報圖表中提取結構化數據,并自動生成 Markdown 表格。

      在“深度解析模式”下,它能將金融圖表、幾何圖形重新繪制成矢量圖,并同時保留說明文字。

      測試結果顯示,DeepSeek OCR 在OmniDocBench 基準上超過了 GOT-OCR 2.0

      在僅使用 100 個視覺 token 的情況下,它的表現優于 GOT-OCR 2.0 使用 256 token 的結果。

      即使在 800 token 以下,DeepSeek 也擊敗了MinerU 2.0,后者每頁需超過 6000 token。


      根據對比數據,DeepSeek OCR 的Gundam-M 模式在中英文混合識別上取得了最佳編輯距離分數。

      系統根據文檔復雜度自動選擇模式:簡單演示文檔用 64 token;普通報告約 100;復雜報紙需啟用“Gundam 模式”,上限 800 token。

      此外,它還提供Resize、Padding、Multi-page、Sliding 四種策略,在多頁文檔中平衡壓縮率與準確性。


      DeepSeek OCR 的訓練規模同樣罕見。研究團隊使用了三千萬頁 PDF 語料,覆蓋約一百種語言。

      其中包括2500 萬頁中英文文檔,以及一千萬張合成圖表、五百萬化學公式、一百萬幾何圖形。

      這些數據讓模型具備了跨領域、跨語言的泛化能力。

      它不僅能保持原始排版,還能在輸出中附帶文字描述和圖像內容說明。

      在多模態大模型中,文本上下文的限制一直是瓶頸。DeepSeek 的方法繞開了傳統 token 計數邏輯,用視覺 token 替代文本 token。

      這使得語言模型能在“看圖”的同時完成“讀文”。

      對研究者而言,這是一種近似“外接硬盤”的解決方案:通過視覺壓縮,AI 的上下文長度幾乎無上限。

      這種方式也預示著未來的模型架構可能不再區分“文本理解”和“圖像理解”。

      注:頭圖AI生成

      作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!

      GPU 訓練特惠!

      H100/H200 GPU算力按秒計費,平均節省開支30%以上!

      掃碼了解詳情?

      點「贊」的人都變好看了哦!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      伊朗國防部隊: 進入全面備戰狀態

      伊朗國防部隊: 進入全面備戰狀態

      每日經濟新聞
      2026-02-19 16:07:49
      意大利知名地標“愛情拱門”突然崩塌,永久消失,當地市長:曾有成千上萬的情侶來打卡,旅游業遭“毀滅性打擊”

      意大利知名地標“愛情拱門”突然崩塌,永久消失,當地市長:曾有成千上萬的情侶來打卡,旅游業遭“毀滅性打擊”

      大風新聞
      2026-02-17 19:26:03
      南京一商場晚上突發火災,看電影的觀眾緊急逃生,應急部門:火已撲滅,無人傷亡

      南京一商場晚上突發火災,看電影的觀眾緊急逃生,應急部門:火已撲滅,無人傷亡

      極目新聞
      2026-02-19 12:49:48
      浙江一地通知:即日起全域禁止銷售

      浙江一地通知:即日起全域禁止銷售

      都市快報橙柿互動
      2026-02-19 17:58:37
      后續,江蘇一家人吃飯父親酒后掀桌,兒子透露更多,以后不回家了

      后續,江蘇一家人吃飯父親酒后掀桌,兒子透露更多,以后不回家了

      離離言幾許
      2026-02-18 23:24:35
      第3金還要耐心等待!天公不作美,中國隊冬奧熱門沖金項再次延期

      第3金還要耐心等待!天公不作美,中國隊冬奧熱門沖金項再次延期

      全景體育V
      2026-02-19 10:10:31
      南方大米產量第一,為啥超市里大部分還是東北米?南方米去哪了?

      南方大米產量第一,為啥超市里大部分還是東北米?南方米去哪了?

      天下十三洲獵奇
      2026-02-18 23:53:55
      突發!美國出手封殺多家中國機構

      突發!美國出手封殺多家中國機構

      芯火相承
      2026-02-19 10:02:18
      42歲王濛再破天花板!退役12年,再次讓李琰和整個冰壇“沉默”了

      42歲王濛再破天花板!退役12年,再次讓李琰和整個冰壇“沉默”了

      翰飛觀事
      2026-02-16 11:29:39
      林丹在西班牙過年,別墅內景曝光,全家人與朋友除夕吃海鮮大餐

      林丹在西班牙過年,別墅內景曝光,全家人與朋友除夕吃海鮮大餐

      手工制作阿殲
      2026-02-19 11:58:33
      再立新功!俄價值超1.2億美元的S-300VM與道爾防空系統遭摧毀

      再立新功!俄價值超1.2億美元的S-300VM與道爾防空系統遭摧毀

      軍迷戰情室
      2026-02-18 23:58:09
      2018年,張扣扣向王家復仇,唯獨不殺王自新妻子:她有不死的理由

      2018年,張扣扣向王家復仇,唯獨不殺王自新妻子:她有不死的理由

      米果說識
      2026-02-19 09:32:34
      凌晨發送恐嚇信息?桔子酒店涉事門店:已報警,非員工發送

      凌晨發送恐嚇信息?桔子酒店涉事門店:已報警,非員工發送

      大風新聞
      2026-02-19 09:46:23
      12死!湖北煙花店爆炸:店主身份被扒,大量內幕披露,知情者發聲

      12死!湖北煙花店爆炸:店主身份被扒,大量內幕披露,知情者發聲

      博士觀察
      2026-02-19 00:06:41
      2月17日俄烏最新: 2.5 年來的最大戰果

      2月17日俄烏最新: 2.5 年來的最大戰果

      西樓飲月
      2026-02-17 20:49:47
      湖北12死煙花爆燃:死者身份公布,大量內部照流出,責任人被控制

      湖北12死煙花爆燃:死者身份公布,大量內部照流出,責任人被控制

      博士觀察
      2026-02-19 11:41:09
      尹錫悅庭審細節曝光:被判無期只瞥了一眼法官,離庭時與律師相視一笑!法官闡述為何不判死刑

      尹錫悅庭審細節曝光:被判無期只瞥了一眼法官,離庭時與律師相視一笑!法官闡述為何不判死刑

      紅星新聞
      2026-02-19 17:28:30
      太尷尬了!大年初一,上海網友哭訴稱大門被鄰居貼兩張“大字報”

      太尷尬了!大年初一,上海網友哭訴稱大門被鄰居貼兩張“大字報”

      火山詩話
      2026-02-19 15:05:12
      襄陽宜城煙花店才50多平米,要了12條人命!最害人的,或是防盜網

      襄陽宜城煙花店才50多平米,要了12條人命!最害人的,或是防盜網

      火山詩話
      2026-02-19 13:50:13
      坐3.6億飛機,戴1000萬名表,拿5000萬炒股的秦奮究竟什么背景

      坐3.6億飛機,戴1000萬名表,拿5000萬炒股的秦奮究竟什么背景

      涵豆說娛
      2026-01-19 17:21:55
      2026-02-19 18:43:00
      大數據文摘 incentive-icons
      大數據文摘
      專注大數據,每日有分享!
      6825文章數 94529關注度
      往期回顧 全部

      科技要聞

      怒燒45億,騰訊字節阿里決戰春節

      頭條要聞

      媒體:高市2.0 日本政局發生了意料之中的變動

      頭條要聞

      媒體:高市2.0 日本政局發生了意料之中的變動

      體育要聞

      中國隊第二金!徐夢桃贏女子空中技巧兩連冠 邵琪銅牌

      娛樂要聞

      明星過年百態!黃曉明等現身三亞

      財經要聞

      面條火腿香菇醬!上市公司這些年請你吃

      汽車要聞

      量產甲醇插混 吉利銀河星耀6甲醇插混版申報圖

      態度原創

      旅游
      健康
      親子
      教育
      藝術

      旅游要聞

      “分段式過年”火爆,汕頭領跑全國“特色年味游”熱門目的地

      轉頭就暈的耳石癥,能開車上班嗎?

      親子要聞

      過年期間這幾樣東西,一口都不要給孩子吃!

      教育要聞

      聽懂這5點,下學期教書,哪還有什么不幸福的?

      藝術要聞

      震驚!安徒生竟是畫家,他的田園生活太美了!

      無障礙瀏覽 進入關懷版