<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek新論文被稱“硅基生命進化論”,海量文字壓縮成圖,模仿人腦重塑AI視覺記憶邊界,贏硅谷大佬力挺

      0
      分享至



      出品|搜狐科技

      作者|鄭松毅

      DeepSeek再次“低調”震驚世界!

      他們新發布并開源的OCR模型,從根本上改變了AI游戲規則。Github開源項目DeepSeek-OCR,一夜收獲超4k星。相關論文(《DeepSeek OCR:上下文光學壓縮》)解釋了這一研究成果。

      很多人好奇,什么是OCR?

      傳統OCR如同“文字掃描儀”,通過光學技術將圖像中的文字提取轉換為計算機和人都能理解的格式。比如,在將大量票據、證件、表單等數據電子化時,OCR發揮關鍵作用。

      但DeepSeek卻反其道而行之——將文本信息“繪制”為視覺圖像,再通過視覺模型實現高效理解。如此創新嘗試就是為了解決大模型的核心痛點——處理長文本時面臨的計算挑戰。

      效果有多驚艷?10頁密密麻麻的文本報告,被壓縮成一張圖片,AI能夠一眼讀懂它。這樣的信息處理效率意味著大幅降低了計算復雜度,用最直接的方式節約成本。

      論文發布后,意料之內的好評如潮,有網友直接將其稱為“硅基生命進化論”。

      最近還在銳評AI發展的OpenAI創始團隊成員、特斯拉前AI總監Karpathy,對DeepSeek新成果直言喜愛,并指出“早就該讓視覺成為AI核心,而非依賴爛透了的文本分詞器。”

      更有業內大佬感嘆,“當文本能被轉化為視覺可理解的結構,語言與視覺的統一或許不再是理論。這可能是通往 AGI(通用人工智能)的關鍵一步。”


      DeepSeek新研究:

      把大量文字壓縮到圖片,讓模型直接看圖理解

      本質上來說,DeepSeek-OCR是將視覺與語言模態深度融合,通過“視覺-文本壓縮”建立自然映射關系,為多模態大模型提供了新的技術路徑。

      之前的大模型可以說是“帶著腳銬的舞者”,雖有強大的語言理解能力,卻被低效的信息輸入方式嚴重束縛。

      拿模型閱讀長篇文本來說,每頁財報、論文都包含數千個token,傳統方式下只能逐字逐句識別,導致計算量爆炸。這種低效作業讓大模型在法律、金融等領域的應用舉步維艱。

      而DeepSeek這次用到了一個巧妙思維——既然一張圖片能裝下成千上萬的文字,那是不是大量文字信息也能被壓縮到一張圖片里,讓模型直接看圖理解就好了。

      為實現這一設想,DeepSeek為OCR模型配備了三件套——圖像編碼器、映射層和文本解碼器。其中,圖像編碼器DeepEncoder(負責把圖片轉成高度壓縮的視覺token)參數為380M,文本解碼器(負責從壓縮的視覺token里重建文字)是一個deepseekv2-3b的模型,參數為3B。

      整體訓練數據由4部分組成,包括OCR1.0數據(傳統OCR任務,如圖像OCR和文檔OCR)、OCR2.0數據(復雜圖像解析任務,如幾何、圖表等)、通用視覺數據(用于注入通用圖像理解能力)、及純文本數據(用于確保模型的語言能力)。

      別看模型參數不大,但就研究結果發現,當文本壓縮率小于10倍時,模型OCR解碼準確率高達97%,及時壓縮率高達20倍時,準確率依舊能保持在60%。在A100-40G顯卡環境下,單日可生成超過20萬頁的模型訓練數據。

      也就是說,如果普通 OCR 需要 10,000 個 token 才能讀完整篇文檔,這個模型可能只用 1,000 個就能搞定,且能高準確度地理解信息。

      受益于訓練數據多樣性,論文提到DeepSeek-OCR不僅能識別文字,還能理解文檔布局、圖表結構。從某種角度說,這已經不是傳統的OCR,而更接近“文檔理解引擎”。

      論文中提到的一個基準叫OmniDocBench,就是專門用來測試復雜文檔理解能力的。DeepSeek-OCR 在這個基準上,用更少的視覺 token 數量就超過了 GOT-OCR 2.0 和 MinerU 2.0,這倆都是目前較頂尖的開源 OCR 模型,可謂十分能打。



      讓AI記憶模式更像人類

      在論文中,DeepSeek還談到了一直困擾業界的AI“記憶”和“遺忘”機制。

      深度學習模型的記憶以分布式參數形式存儲,這種非結構化存儲導致傳統神經網絡在學習新任務時,舊知識的參數空間會被新知識覆蓋,模型無法做到像人類一樣進行連貫推理。

      而DeepSeek的想法是,通過視覺-文本壓縮范式和動態分層遺忘機制,讓AI“記住該記住的,忘記該忘記的”。

      其核心思路是將文本信息轉化為視覺token,通過光學壓縮實現高效記憶管理,同時模擬人類遺忘曲線動態調整信息留存。


      在這個過程中,核心組件DeepEncoder發揮關鍵作用,50-100個視覺tokens即可還原1000字文本,實現近 10 倍的計算量節省。

      這種壓縮并非簡單的信息降維,而是通過“注意力機制+結構化訓練”,優先保留對模型推理最關鍵的信息。類似人類閱讀時“先抓標題再看細節”的認知模式,去除不重要的信息噪聲。

      關于如何讓模型的記憶模式更像人類,研究者做了進一步解釋:對于近期記憶,可以將其渲染成高分辨率圖像,用多token數量保留高保真信息。而對于遠期記憶,可以縮放成更小、更模糊的圖像,用少量token來保留信息,從而實現信息的自然遺忘和壓縮。

      雖然當前還僅是研究前期探索階段,但DeepSeek的創新思路,確實讓AI越來越像人類了。


      三名作者

      本篇論文共有3名作者:Haoran Wei、Yaofeng Sun、Yukun Li。

      論文一作Haoran Wei曾主導開發爆火項目GOT-OCR2.0,此次的DeepSeek-OCR也可以說是延續了此前項目的創新技術路徑。根據此前論文信息顯示,Haoran Wei還曾就職于階躍星辰。


      Yaofeng Sun畢業于北京大學圖靈班計算機科學專業,于2023年加入DeepSeek,先后參與DeepSeek-r1、DeepSeek-v3、DeepSeek-v2等模型的研究。


      Yukun Li也參與了包括DeepSeek-v2/v3在內的多款模型研究,谷歌學術論文引用量近萬。




      運營編輯 |曹倩審核|孟莎莎




      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      告別“秒射”尷尬!讓你“爽”得更久的3個鍛煉法,親測有效

      告別“秒射”尷尬!讓你“爽”得更久的3個鍛煉法,親測有效

      精彩分享快樂
      2025-12-16 12:00:06
      印媒:梅西因大霧被滯留在孟買機場,新德里站活動被迫推遲

      印媒:梅西因大霧被滯留在孟買機場,新德里站活動被迫推遲

      懂球帝
      2025-12-15 15:55:04
      柬軍不給洪森家族拼命?丟棄上百萬美元我國第五代導彈:成群逃跑

      柬軍不給洪森家族拼命?丟棄上百萬美元我國第五代導彈:成群逃跑

      動漫里的童話
      2025-12-16 06:59:54
      郵報揭秘曼聯衰落10年細節:范加爾一上任就手把手教魯尼點球

      郵報揭秘曼聯衰落10年細節:范加爾一上任就手把手教魯尼點球

      懂球帝
      2025-12-16 01:12:21
      仗打了1000多天,美國終于發現不對勁:原來中國三年前就選對了!

      仗打了1000多天,美國終于發現不對勁:原來中國三年前就選對了!

      霽寒飄雪
      2025-12-12 21:13:37
      西方學者:漢字是全球唯一超越時空的文字,這一優勢碾壓英語!

      西方學者:漢字是全球唯一超越時空的文字,這一優勢碾壓英語!

      鯨探所長
      2025-12-14 21:35:28
      摧毀多座電詐園區,繳獲大批中式導彈!泰國為什么死磕柬埔寨?

      摧毀多座電詐園區,繳獲大批中式導彈!泰國為什么死磕柬埔寨?

      聞識
      2025-12-16 14:51:50
      上海一重組家庭遺產訴訟糾紛:360萬元賣房款失蹤?兩繼承人均稱未拿到錢

      上海一重組家庭遺產訴訟糾紛:360萬元賣房款失蹤?兩繼承人均稱未拿到錢

      紅星新聞
      2025-12-16 14:37:31
      股債雙殺,發生什么了?

      股債雙殺,發生什么了?

      睿知睿見
      2025-12-16 07:53:17
      超模卡門:77歲被騙光積蓄,83歲仍有性生活,91歲雙腿依舊迷人

      超??ㄩT:77歲被騙光積蓄,83歲仍有性生活,91歲雙腿依舊迷人

      豐譚筆錄
      2025-12-11 11:41:19
      媒報徐正源和蓉城談判終止;名記:崔康熙用剩下的招數

      媒報徐正源和蓉城談判終止;名記:崔康熙用剩下的招數

      糗糗球事
      2025-12-16 14:16:24
      韓媒:金與正手持最新款折疊手機,疑似中國品牌

      韓媒:金與正手持最新款折疊手機,疑似中國品牌

      隨波蕩漾的漂流瓶
      2025-12-15 10:49:46
      只因長得太美就被導演潛規則,多年后無戲可拍的她,靠胡歌才走紅

      只因長得太美就被導演潛規則,多年后無戲可拍的她,靠胡歌才走紅

      一娛三分地
      2025-12-14 22:21:38
      泰柬沖突進一步升級,柬埔寨首相不找中國,居然又去找美國調停!

      泰柬沖突進一步升級,柬埔寨首相不找中國,居然又去找美國調停!

      阿龍聊軍事
      2025-12-16 05:32:58
      頭部若出現4個特征,可能是肺癌來臨的信號,盡快做檢查!

      頭部若出現4個特征,可能是肺癌來臨的信號,盡快做檢查!

      風信子的花
      2025-12-16 13:00:58
      準備開搶!美媒曬3方9人大交易方案:熱火拿下字母哥勇士接手特納

      準備開搶!美媒曬3方9人大交易方案:熱火拿下字母哥勇士接手特納

      鍋子籃球
      2025-12-15 21:00:14
      塔吊距樓18米、安全出口減半……中央安全生產考核巡查組明察暗訪細節披露

      塔吊距樓18米、安全出口減半……中央安全生產考核巡查組明察暗訪細節披露

      中國能源網
      2025-12-15 17:34:11
      您有洗屁股的習慣嗎?提醒:天天洗肛門的人,能收獲4個驚人好處

      您有洗屁股的習慣嗎?提醒:天天洗肛門的人,能收獲4個驚人好處

      39健康網
      2025-12-13 20:50:34
      拜仁剎車,他的輪換正在傷害球隊?

      拜仁剎車,他的輪換正在傷害球隊?

      西哇體育
      2025-12-16 14:19:26
      這也叫外援? 焦點戰0分0板0助,連續2場正負值倒數第1,球迷:滾

      這也叫外援? 焦點戰0分0板0助,連續2場正負值倒數第1,球迷:滾

      金山話體育
      2025-12-16 08:12:06
      2025-12-16 15:56:49
      搜狐科技 incentive-icons
      搜狐科技
      搜狐科技官方賬號
      4602文章數 9173關注度
      往期回顧 全部

      科技要聞

      馬斯克徹底放手!特斯拉股價一夜狂歡

      頭條要聞

      戴琳在球迷去世當天還5千:不計較他之前的話 救命要緊

      頭條要聞

      戴琳在球迷去世當天還5千:不計較他之前的話 救命要緊

      體育要聞

      楊瀚森18+10首次兩雙 關鍵攻防統治G聯賽

      娛樂要聞

      溫崢嶸回應賣面膜爭議,已報警刑事立案

      財經要聞

      浙金中心暴雷始末:祥源控股設計的騙局?

      汽車要聞

      智聯網功能升級 方程豹鈦3迎第四次OTA升級

      態度原創

      本地
      教育
      數碼
      家居
      藝術

      本地新聞

      云游安徽|尋跡六安,三處舊址回望烽火歲月

      教育要聞

      一個殘酷的教育真相:你所謂的富養,其實是在培養廢物

      數碼要聞

      蘋果首款智能眼鏡或搭載SiP芯片,瞄準輕量化AI穿戴

      家居要聞

      溫馨獨棟 駝色與淺色碰撞

      藝術要聞

      16位畫家17幅靜物花卉,你喜歡哪位的呢?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国内综合精品午夜久久资源| 婷婷综合亚洲| 国产v片在线播放| 亚洲AV一二三| 精品人妻大屁股白浆无码| 老司机午夜福利视频| 国产精品成人av电影不卡| 国产丝袜AV| 中文字幕人妻系列人妻?无码| 成人无号精品一区二区三区| 伊人色色| 91探花国产综合在线精品| 永久免费无码| 亚洲乱妇老熟女爽到高潮的片| 日韩丰满少妇无吗视频激情内射 | 性欧美丰满熟妇xxxx性| 无码av最新无码av专区 | 中文字幕在线高清| 佳木斯市| 中文字幕丰满乱子无码视频| 国产美女被遭强高潮免费网站| 中文字幕久久精品波多野结| 91青青草原| 久久亚洲人妻| 瑜伽裤国产一区二区三区| 四虎永久在线精品无码视频| 超碰在线观看91| 久久精品夜夜夜夜夜久久| 亚洲人成无码区在线观看| 色欧美片视频在线观看| 太白县| 国产一区二区三区内射高清| 伊人在线视频| jizz免费| 大香蕉欧美| 日韩人妻无码精品久久 | 日本一区二区三区四区黄色| 91性爱视频| 95在线一区| 囯产精品久久久久久久久久妞妞| 国产一区二区午夜福利久久|