<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

DeepSeek 新模型震撼 AI 圈：用視覺模型讀文檔，壓縮率高達 90%，信息保真 97%！

2025-10-21 18:48:15　來源: 大數據文摘

北京舉報

0

分享至

大數據文摘出品

最近，DeepSeek 推出了一種全新的 OCR 系統，能讓 AI 在不超出內存限制的情況下，處理更長的文檔。

地址： https://github.com/deepseek-ai/DeepSeek-OCR?tab=readme-ov-file

這套系統的關鍵，是把文字當作圖像來壓縮。DeepSeek 發現，處理圖片反而比處理純文本更節省算力。

據其技術論文，系統在保留97% 信息量的前提下，可將文檔壓縮至原來的十分之一。

換句話說，一本上百頁的 PDF，經 DeepSeek 處理后，只需原來十分之一的 token 數量，就能被 AI 完整閱讀。

DeepSeek OCR 的核心由兩部分組成：一是圖像處理模塊，DeepEncoder，二是基于Deepseek-3B-MoE的文本生成器。.

DeepEncoder 擁有 3.8 億參數，負責將文檔圖片分析為壓縮后的視覺 token；文本生成器在此基礎上恢復文字與結構。

在技術上，它融合了 Meta 的SAM（Segment Anything Model）與 OpenAI 的CLIP 模型。

SAM 擔任局部視覺分析，CLIP 則提供全局語義關聯。兩者之間，嵌入了一個16 倍壓縮器，大幅減少圖像 token 數量。

一張 1024×1024 像素的圖片，起初被分為 4096 個 token；經壓縮后，只剩 256 個。這一過程的算力節省是數量級的：CLIP 的計算負擔因此顯著下降。

在低分辨率下，DeepSeek OCR 每張圖僅需 64 個視覺 token；高分辨率時也不超過 400。

相比之下，傳統 OCR 系統往往需要數千 token 才能完成同樣的任務。

DeepSeek 并不僅僅識別文字。它能識別圖表、化學式、幾何圖形等多種復雜結構。

研究團隊稱，系統可直接從財報圖表中提取結構化數據，并自動生成 Markdown 表格。

在“深度解析模式”下，它能將金融圖表、幾何圖形重新繪制成矢量圖，并同時保留說明文字。

測試結果顯示，DeepSeek OCR 在OmniDocBench 基準上超過了 GOT-OCR 2.0。

在僅使用 100 個視覺 token 的情況下，它的表現優于 GOT-OCR 2.0 使用 256 token 的結果。

即使在 800 token 以下，DeepSeek 也擊敗了MinerU 2.0，后者每頁需超過 6000 token。

根據對比數據，DeepSeek OCR 的Gundam-M 模式在中英文混合識別上取得了最佳編輯距離分數。

系統根據文檔復雜度自動選擇模式：簡單演示文檔用 64 token；普通報告約 100；復雜報紙需啟用“Gundam 模式”，上限 800 token。

此外，它還提供Resize、Padding、Multi-page、Sliding 四種策略，在多頁文檔中平衡壓縮率與準確性。

DeepSeek OCR 的訓練規模同樣罕見。研究團隊使用了三千萬頁 PDF 語料，覆蓋約一百種語言。

其中包括2500 萬頁中英文文檔，以及一千萬張合成圖表、五百萬化學公式、一百萬幾何圖形。

這些數據讓模型具備了跨領域、跨語言的泛化能力。

它不僅能保持原始排版，還能在輸出中附帶文字描述和圖像內容說明。

在多模態大模型中，文本上下文的限制一直是瓶頸。DeepSeek 的方法繞開了傳統 token 計數邏輯，用視覺 token 替代文本 token。

這使得語言模型能在“看圖”的同時完成“讀文”。

對研究者而言，這是一種近似“外接硬盤”的解決方案：通過視覺壓縮，AI 的上下文長度幾乎無上限。

這種方式也預示著未來的模型架構可能不再區分“文本理解”和“圖像理解”。

注：頭圖AI生成

作者長期關注 AI 產業與學術，歡迎對這些方向感興趣的朋友添加微信Q1yezi，共同交流行業動態與技術趨勢！

GPU 訓練特惠！

H100/H200 GPU算力按秒計費，平均節省開支30%以上！

掃碼了解詳情?

點「贊」的人都變好看了哦！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Claude最新Sonnet：Opus級智能，性價比王炸，OpenClaw天選API

量子位 2026-02-18 16:13:32
5 跟貼 5
外文翻譯老大難被國產工具治了？三大翻譯神器橫評后這家穩得離譜

量子位 2025-11-19 14:33:02
1 跟貼 1

懂人性更懂執行，螞蟻這個萬億開源模型把情商和戰斗力都給拉滿了

量子位 2026-02-19 12:45:37
2 跟貼 2

Codeforces難題不夠刷？謝賽寧等造了AI出題機，能生成原創編程題

機器之心Pro 2025-10-20 14:17:05
0 跟貼 0
Claude最強Sonnet模型4.6來了，百萬token上下文

機器之心Pro 2026-02-18 21:11:29
2 跟貼 2

大模型碰到真難題了，測了500道，o3 Pro僅通過15%

機器之心Pro 2025-09-15 10:45:10
0 跟貼 0

英偉達參與合作，華人團隊打造AI芯片算法HeaRT，推理準確率超97%

DeepTech深科技 2026-02-18 19:46:01
3 跟貼 3
10億美金！李飛飛驚爆硅谷：英偉達AMD入局，3D空間革命開戰

新智元 2026-02-19 12:39:27
1 跟貼 1

誰在決定AI手機的未來：模型、系統，還是生態？

DeepTech深科技 2026-01-13 16:16:47
0 跟貼 0
近日，青海。車主自駕青海遇男子招手搭車，男子去快遞站給孩子們取過冬物資，車主好心送男子去學校，車主：

中安在線 2026-02-18 22:00:26
122 跟貼 122
內蒙古草原名場面！狼偷不著羊，就跟藏獒貼貼，網友：前狼假寐，蓋以誘敵

BRTV新聞 2026-02-19 07:15:56
148 跟貼 148
媒體：馬克龍真魔怔了在印度還暗戳戳提中國

澎湃新聞 2026-02-18 22:58:24
1733 跟貼 1733
匈牙利、斯洛伐克宣布暫停向烏克蘭出口柴油

財聯社 2026-02-18 23:58:05
2367 跟貼 2367
霸主邏輯：美國如何“鎖死”日本三十年？

雅兒姐游世界 2026-02-18 01:26:18
0 跟貼 0
印度一大學拿中國機器狗冒充自研

環球時報 2026-02-18 16:09:05
2162 跟貼 2162
六年級數學求面積，等高模型

天天數理學習分享 2026-02-15 17:19:33
3 跟貼 3
國產大模型“春節檔”混戰，一文看懂豆包是怎么打這仗的

鈦媒體APP 2026-02-18 20:49:39
0 跟貼 0
反向過年新潮流：老外扎堆來中國，單日飛三亞外國游客大增3倍

每日經濟新聞 2026-02-15 11:30:33
2624 跟貼 2624
預測下一個像素還需要幾年？谷歌：五年夠了

機器之心Pro 2025-11-26 15:48:35
0 跟貼 0
小伙徒手搓出一輛考斯特汽車模型，真的是太牛了

宸宸愛發明V 2026-02-15 13:44:08
4 跟貼 4
美國火星車傳來圖像，火星夜空是什么樣的，比地球清晰一萬倍！

逗比歡樂營 2026-02-18 10:03:59
16 跟貼 16
大烏黑客設陷阱，假聊天機器人竊數據，俄2400星鏈終端遭殃

倔強的毛驢 2026-02-17 18:52:23
0 跟貼 0
谷歌Gemini上線AI音樂創作，一夜革了Suno的命！

新智元 2026-02-19 12:39:23
2 跟貼 2
衛星圖像證實：美國向伊朗附近增派軍艦和戰斗機

掛肚逍遙心 2026-02-19 02:48:19
0 跟貼 0
“爸媽來后冰箱都變老了！”網友：原來全國都這樣

都市快報橙柿互動 2026-02-18 00:22:49
1032 跟貼 1032
利用模型制作水泥柱子！

焦點視訊 2026-02-15 12:05:20
0 跟貼 0
2026年，從大國博弈到區域沖突，輸贏的核心邏輯是什么？

忠誠TALK 2026-02-18 08:00:53
1 跟貼 1
有游客在胖東來買到搬不動了：買了5000多元的年貨，還花了500多元的快遞費

極目新聞 2026-02-15 14:37:25
1294 跟貼 1294
初中數學水桶模型求面積

天天數理學習分享 2026-02-16 10:16:41
4 跟貼 4
美軍開打前夕，俄交武器中方出手，殲20模型抵伊朗

戰武科普 2026-02-19 11:39:39
0 跟貼 0
法國1萬人村莊連續10年自費過春節

極目新聞 2026-02-19 11:18:51
670 跟貼 670
春晚之后，AI和機器人為啥都去了一個地方？

量子位 2026-02-19 12:40:49
5 跟貼 5
東北夫妻爆笑邏輯解生活難題

星光墜落r 2026-02-18 09:15:10
0 跟貼 0
上海市人民政府關于同意《上海崇明江南造船（集團）有限責任公司“9·4”較大中毒和窒息事故調查報告》的批復

上海市人民政府網站 2026-02-19 09:36:00
0 跟貼 0
日韓股市集體高開日經225指數漲0.57%

證券時報 2026-02-19 08:31:03
719 跟貼 719
深圳花市現“反向拍賣”，蝴蝶蘭從250元喊到120元成交，店家：最便宜的時候不要錢，但要靠搶

極目新聞 2026-02-18 18:29:21
211 跟貼 211
實錘Switch2版本？《怪獵荒野》最新數據挖掘

游民星空 2026-02-19 10:46:14
3 跟貼 3
大年初三不拜年？這些老規矩，你可要注意！

大象新聞 2026-02-19 06:12:09
215 跟貼 215
45億紅包打響AI入口大戰，百度給出另一種回應

量子位 2026-02-19 17:54:22
0 跟貼 0
用硅膠制作的美人魚模型，長得真是太恐怖了

樂活捕手 2026-02-19 08:18:06
5 跟貼 5

伊朗國防部隊：進入全面備戰狀態

伊朗國防部隊：進入全面備戰狀態

每日經濟新聞

2026-02-19 16:07:49

意大利知名地標“愛情拱門”突然崩塌，永久消失，當地市長：曾有成千上萬的情侶來打卡，旅游業遭“毀滅性打擊”

意大利知名地標“愛情拱門”突然崩塌，永久消失，當地市長：曾有成千上萬的情侶來打卡，旅游業遭“毀滅性打擊”

大風新聞

2026-02-17 19:26:03

南京一商場晚上突發火災，看電影的觀眾緊急逃生，應急部門：火已撲滅，無人傷亡

南京一商場晚上突發火災，看電影的觀眾緊急逃生，應急部門：火已撲滅，無人傷亡

極目新聞

2026-02-19 12:49:48

浙江一地通知：即日起全域禁止銷售

浙江一地通知：即日起全域禁止銷售

都市快報橙柿互動

2026-02-19 17:58:37

后續，江蘇一家人吃飯父親酒后掀桌，兒子透露更多，以后不回家了

后續，江蘇一家人吃飯父親酒后掀桌，兒子透露更多，以后不回家了

離離言幾許

2026-02-18 23:24:35

第3金還要耐心等待！天公不作美，中國隊冬奧熱門沖金項再次延期

第3金還要耐心等待！天公不作美，中國隊冬奧熱門沖金項再次延期

全景體育V

2026-02-19 10:10:31

南方大米產量第一，為啥超市里大部分還是東北米？南方米去哪了？

南方大米產量第一，為啥超市里大部分還是東北米？南方米去哪了？

天下十三洲獵奇

2026-02-18 23:53:55

突發！美國出手封殺多家中國機構

突發！美國出手封殺多家中國機構

芯火相承

2026-02-19 10:02:18

42歲王濛再破天花板！退役12年，再次讓李琰和整個冰壇“沉默”了

42歲王濛再破天花板！退役12年，再次讓李琰和整個冰壇“沉默”了

翰飛觀事

2026-02-16 11:29:39

林丹在西班牙過年，別墅內景曝光，全家人與朋友除夕吃海鮮大餐

林丹在西班牙過年，別墅內景曝光，全家人與朋友除夕吃海鮮大餐

手工制作阿殲

2026-02-19 11:58:33

再立新功！俄價值超1.2億美元的S-300VM與道爾防空系統遭摧毀

再立新功！俄價值超1.2億美元的S-300VM與道爾防空系統遭摧毀

軍迷戰情室

2026-02-18 23:58:09

2018年，張扣扣向王家復仇，唯獨不殺王自新妻子：她有不死的理由

2018年，張扣扣向王家復仇，唯獨不殺王自新妻子：她有不死的理由

米果說識

2026-02-19 09:32:34

凌晨發送恐嚇信息？桔子酒店涉事門店：已報警，非員工發送

凌晨發送恐嚇信息？桔子酒店涉事門店：已報警，非員工發送

大風新聞

2026-02-19 09:46:23

12死！湖北煙花店爆炸：店主身份被扒，大量內幕披露，知情者發聲

12死！湖北煙花店爆炸：店主身份被扒，大量內幕披露，知情者發聲

博士觀察

2026-02-19 00:06:41

2月17日俄烏最新： 2.5 年來的最大戰果

2月17日俄烏最新： 2.5 年來的最大戰果

西樓飲月

2026-02-17 20:49:47

湖北12死煙花爆燃：死者身份公布，大量內部照流出，責任人被控制

湖北12死煙花爆燃：死者身份公布，大量內部照流出，責任人被控制

博士觀察

2026-02-19 11:41:09

尹錫悅庭審細節曝光：被判無期只瞥了一眼法官，離庭時與律師相視一笑！法官闡述為何不判死刑

尹錫悅庭審細節曝光：被判無期只瞥了一眼法官，離庭時與律師相視一笑！法官闡述為何不判死刑

紅星新聞

2026-02-19 17:28:30

太尷尬了！大年初一，上海網友哭訴稱大門被鄰居貼兩張“大字報”

太尷尬了！大年初一，上海網友哭訴稱大門被鄰居貼兩張“大字報”

火山詩話

2026-02-19 15:05:12

襄陽宜城煙花店才50多平米，要了12條人命！最害人的，或是防盜網

襄陽宜城煙花店才50多平米，要了12條人命！最害人的，或是防盜網

火山詩話

2026-02-19 13:50:13

坐3.6億飛機，戴1000萬名表，拿5000萬炒股的秦奮究竟什么背景

坐3.6億飛機，戴1000萬名表，拿5000萬炒股的秦奮究竟什么背景

涵豆說娛

2026-01-19 17:21:55

大數據文摘

專注大數據，每日有分享！

6825文章數 94529關注度

往期回顧全部

科技要聞

怒燒45億，騰訊字節阿里決戰春節

頭條要聞

媒體：高市2.0 日本政局發生了意料之中的變動

頭條要聞

媒體：高市2.0 日本政局發生了意料之中的變動

體育要聞

中國隊第二金！徐夢桃贏女子空中技巧兩連冠邵琪銅牌

娛樂要聞

明星過年百態！黃曉明等現身三亞

財經要聞

面條火腿香菇醬！上市公司這些年請你吃

汽車要聞

量產甲醇插混吉利銀河星耀6甲醇插混版申報圖

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

健康

親子

教育

藝術

旅游要聞

“分段式過年”火爆，汕頭領跑全國“特色年味游”熱門目的地

轉頭就暈的耳石癥，能開車上班嗎？

親子要聞

過年期間這幾樣東西，一口都不要給孩子吃！

教育要聞

聽懂這5點，下學期教書，哪還有什么不幸福的？

藝術要聞

震驚！安徒生竟是畫家，他的田園生活太美了！

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版