<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek 最新開源OCR模型,實測,不如百度

      0
      分享至

      大家好,我是 Ai 學習的老章


      DeepSeek-OCR

      DeepSeek 最近發布了《DeepSeek-OCR:基于視覺壓縮的大模型長上下文增強方案》這篇論文,同步開源了模型文件。

      最近一段時間好像是迎來了 OCR 的黃金時代,百度的 PaddleOCR-VL、阿里 Qwen3-VL、小紅書的 dots-ocr、Nanonets-OCR2 等等。

      更早之前我也測試過一些,閱讀不佳就沒再繼續

      論文上看,DeepSeek-OCR有兩個核心,一個是純粹的 OCR,這是本文測試的重點。


      另一個就是上下文光學壓縮(Contexts Optical Compression),解決了大模型在長上下文處理上的算力瓶頸。這玩意我是看不太懂,只看到市面上幾乎全部文章吹捧。

      DeepSeek-OCR 不僅是 OCR 模型,通過視覺壓縮實現“以小博大”,在長文本處理上突破了算力與精度的平衡,是大模型長上下文的一個解決方案,它讓 AI 的“記憶”更像人類,或許正在打開通往下一代智能的鑰匙。
      Andrej Jarpathy 也給予 DeepSeek-OCR 極高評價

      再回到 OCR 方面,DeepSeek-OCR 表現不俗

      • 壓縮比 ≤10 倍時,準確率 >95%,幾乎無損。

      • ICDAR 2023 數據集:10 倍壓縮下準確率 97.3%,速度 8.2 頁/秒,顯存僅 4.5GB。

      • 對比 MinerU2.0(6000+ tokens/頁,1.5 頁/秒,12.8GB 顯存),優勢明顯。

      • 財報:286 頁年報,表格還原率 95.7%,耗時 4 分鐘(

      • 論文:公式識別率 92.1%,LaTeX 可直接使用。

      • 合同:批注關聯率 89.5%,比 Tesseract 高 27%。

      DepSeek-OCR 實測--公式

      我沒有本地部署,直接使用了 HF 上一個 Space,應該是用的 Gradio 開發的


      https://huggingface.co/spaces/khang119966/DeepSeek-OCR-DEMO

      測試樣例取自我之前這篇文章:

      文中我測試幾個大模型(Kimi、Qwen-3-235B-A22B、Claude-3.7-sonnet、GPT-4.1、Gemini 2.5 Pro)在 latex 公式識別中的表現,測試從帶公式的圖片中識別出公式代碼,有兩個手寫公式識別,難度不小。當時 DeepSeek 不是多模態,沒有參與對比,本文剛好補上。

      例 1:中高難度,模糊手寫,數字是歐洲寫法,比如 7 中間加了一橫,其中有一個 8 寫的極像 6


      之前我測試只有 Gemini 2.5 Pro 可以完成任務,DeepSeek-OCR 犯了和其他模型一樣的問題,其中一個模糊的 8 識別成了 6。

      另外這個工具有一段奇怪的字符串

      刪掉之后就正常了,后面幾個,為了展示方便,我都刪了

      百度Paddle也沒完成,8識別成了6.

      例 2:簡單點,印刷版,可以完成任務,這個太簡單了,其他模型也都可以勝任


      例 3:上難度,多個復雜公式一次識別


      還行,有瑕疵,中間有奇怪符號,而且沒有換行

      百度完成的就很好


      例 4:復雜公式,帶矩陣運算

      DeepSeek-OCR 完成的不錯

      例 5:最高難度,模糊手寫,公式混在文本中,橫線與筆記本自帶的線混在一起


      這個只有 Gemini 2.5 Pro 成功識別的題目,DeepSeek- OCR 完成的很一般


      最后在看一個復雜表格識別

      DeepSeek- OCR 沒有把表頭識別好


      百度 paddle 就很 OK


      中間很多我沒有同時讓百度表現,因為也是用了 HF 的 Space,很不穩定


      總結看DeepSeek-OCR 確實很優秀,但是絕不是 SOTA 級別

      補充說明,不是 DeepSeek-OCR 不好,它有我無法理解的偉大創新。單 OCR 這一塊,單這幾個實例,它確實不如百度 PaddleOCR-VL 這個 0.9B 的小模型。

      此外,我還測試了一文中提到的 API,調用 DeepSeek-OCR 把 PDF 轉 Markdown。

      速度極快,22 頁,一分鐘不到。返回的是 json 格式,正文部分大量\n 預覽起來很費勁,簡單看,它沒有去理解配圖,其他都還行。


      制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      愛潑斯坦案亞裔受害者發聲:被帶進紅房間,被逼迫帶女孩同行

      愛潑斯坦案亞裔受害者發聲:被帶進紅房間,被逼迫帶女孩同行

      法老不說教
      2026-02-11 17:08:59
      精神小妹的生活原來是這樣的!網友:終于知道她們為啥都這么瘦了

      精神小妹的生活原來是這樣的!網友:終于知道她們為啥都這么瘦了

      深度報
      2026-02-11 23:35:03
      陶琳回應特斯拉中國銷量下滑真相!還預告了FSD入華進展

      陶琳回應特斯拉中國銷量下滑真相!還預告了FSD入華進展

      車東西
      2026-02-09 18:43:34
      破案了!看了牢A的直播后,終于知道宋祖兒為什么會被全網黑了!

      破案了!看了牢A的直播后,終于知道宋祖兒為什么會被全網黑了!

      樂悠悠娛樂
      2026-01-22 08:57:21
      央視動真格了!2026春晚大換血,趙本山當年的狠話終于應驗

      央視動真格了!2026春晚大換血,趙本山當年的狠話終于應驗

      絢麗的畫卷
      2026-02-07 13:53:12
      冠軍聯賽三連冠+賽季第三冠!塞爾比輕取吳宜澤斬獲巡回賽第41冠

      冠軍聯賽三連冠+賽季第三冠!塞爾比輕取吳宜澤斬獲巡回賽第41冠

      世界體壇觀察家
      2026-02-12 06:33:50
      清算終于開始了!一個要求,震動東京:中國要求日本限期內歸還

      清算終于開始了!一個要求,震動東京:中國要求日本限期內歸還

      壹知眠羊
      2026-01-28 22:03:28
      隨著利物浦1-0,曼城3-0,維拉1-0,英超最新積分榜出爐

      隨著利物浦1-0,曼城3-0,維拉1-0,英超最新積分榜出爐

      側身凌空斬
      2026-02-12 06:34:40
      美股三大股指收盤普跌 美光科技漲近10%

      美股三大股指收盤普跌 美光科技漲近10%

      每日經濟新聞
      2026-02-12 05:10:06
      巨力索具:網傳“中標4.58億海南火箭海上回收系統項目”等不實

      巨力索具:網傳“中標4.58億海南火箭海上回收系統項目”等不實

      界面新聞
      2026-02-11 20:42:45
      地點:內蒙古!“拍蠅打虎”一晚四連擊!

      地點:內蒙古!“拍蠅打虎”一晚四連擊!

      看看新聞Knews
      2026-02-11 17:52:04
      罪有應得!官方徹查后,閆學晶再迎噩耗,她最擔心的事還是發生了

      罪有應得!官方徹查后,閆學晶再迎噩耗,她最擔心的事還是發生了

      來科點譜
      2026-01-23 11:08:02
      王晶談萬梓良晚年凄涼!稱其不懂江湖規矩,演戲夸張對手很難接

      王晶談萬梓良晚年凄涼!稱其不懂江湖規矩,演戲夸張對手很難接

      小徐講八卦
      2026-02-11 11:40:12
      光速打臉,弗蘭克賽后說自己1000%會繼續帶隊,不到24h就下課

      光速打臉,弗蘭克賽后說自己1000%會繼續帶隊,不到24h就下課

      懂球帝
      2026-02-11 19:25:06
      拓媒:楊瀚森在場上太笨拙,這樣很難在NBA生存

      拓媒:楊瀚森在場上太笨拙,這樣很難在NBA生存

      懂球帝
      2026-02-11 17:37:02
      已婚也逃不過!在愛潑斯坦的安排下,比爾蓋茨和安妮·海瑟薇會面

      已婚也逃不過!在愛潑斯坦的安排下,比爾蓋茨和安妮·海瑟薇會面

      全球風情大揭秘
      2026-02-09 18:41:27
      加拿大2000人小鎮唯一中學突發槍案10死,女槍手穿連衣裙作案,疑自殺身亡

      加拿大2000人小鎮唯一中學突發槍案10死,女槍手穿連衣裙作案,疑自殺身亡

      紅星新聞
      2026-02-11 12:09:14
      直線拉升!黃金、白銀 再度爆發!倫敦金現 COMEX黃金 均重回5100美元/盎司上方

      直線拉升!黃金、白銀 再度爆發!倫敦金現 COMEX黃金 均重回5100美元/盎司上方

      每日經濟新聞
      2026-02-12 00:07:14
      被無數人吐槽的“反人類設計”,知道正確用法后我集體破防了……

      被無數人吐槽的“反人類設計”,知道正確用法后我集體破防了……

      暢談裝修
      2026-02-10 18:08:05
      和謝賢分手7年后,40歲Coco胖到認不出,拿著巨額分手費周游世界

      和謝賢分手7年后,40歲Coco胖到認不出,拿著巨額分手費周游世界

      小熊侃史
      2026-02-11 12:57:49
      2026-02-12 08:39:01
      機器學習與Python社區 incentive-icons
      機器學習與Python社區
      機器學習算法與Python
      3247文章數 11085關注度
      往期回顧 全部

      科技要聞

      傳蘋果新Siri再遇挫 多項AI功能或推遲發布

      頭條要聞

      牛彈琴:德國真急了要學習中國好榜樣 中國要防幺蛾子

      頭條要聞

      牛彈琴:德國真急了要學習中國好榜樣 中國要防幺蛾子

      體育要聞

      搞垮一個冬奧選手,只需要一首歌?

      娛樂要聞

      大孤山風波愈演愈烈 超50位明星扎堆

      財經要聞

      這個春節,中美AI“隔空開打”

      汽車要聞

      比亞迪最美B級SUV? 宋Ultra這腰線美翻了

      態度原創

      本地
      時尚
      教育
      手機
      公開課

      本地新聞

      下一站是嘉禾望崗,請各位乘客做好哭泣準備

      這些才是適合普通人的冬天穿搭!不露腿、不露腰,得體又大方

      教育要聞

      教育部1號文件定調:2026高考革命來襲!刷題時代正式終結

      手機要聞

      請更新:蘋果iOS / iPadOS 26.3已修復37個安全漏洞

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版