<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek與智譜同日出手,將語言壓縮成視覺是下一個擴展方向

      0
      分享至

      就在硅谷還在為大模型像不像松鼠爭論不休時,來自中國的DeepSeek與智譜,只干不說,幾乎同時拋出了自己如何教會大模型,像人類一樣“看懂”文本的模型與論文。

      “松鼠”是強化學習之父薩頓對大模型是否具備真實的感知與理解能力的隱喻。讓大模型“看懂文本”,已經有點類似意味了。人類感知與理解世界,一條重要的路徑,就是通過大腦視覺皮層處理通過眼睛傳遞進來的視覺信號。

      無論是DeepSeek還是智譜的方案,核心都在于用少量的視覺token,表達原本需要大量文本token才能覆蓋的信息。前者提出了DeepSeek-OCR模型,概念核心是“上下文光學壓縮”(Context Optical Compression);后者的Glyph框架,則以“視覺–文本壓縮”(Visual–Text Compression)為中心思想。

      兩者都在重新審視“視覺模型”在自然語言壓縮與解壓映射中的角色,讓傳統的OCR(光學字符識別)不再只是識別文字的工具,而成為連接大型語言模型(LLM)與視覺語言模型(VLM)之間的關鍵中間模態。

      這顯著提高了信息密度與計算效率。如果能順利將壓縮成圖像的文本信息重新解碼出來,就能大幅降低內存與算力成本。參數規模僅為3B的DeepSeek-OCR,在文本token數量不超過視覺token數量的10倍(即壓縮比<10)時,仍可實現不低于97%的解碼精度;智譜的Glyph框架則實現了3至4倍的上下文壓縮,同時保持與同規模領先語言模型(如Qwen3-8B)相當的性能。

      具體而言,DeepSeek-OCR是一個全新的端到端統一架構,由兩個核心組件構成:負責將圖像轉換為高度壓縮視覺 token的編碼器DeepEncoder,以及從這些視覺token中重建文字的解碼器DeepSeek-3B-MoE-A570M。其設計目標是在保持高分辨率輸入的同時,生成盡可能少的視覺token,將激活內存消耗控制在較低水平。相比之下,現有的三類主流視覺語言模型(各自以Vary、InternVL2.0與Qwen2-VL為代表)都無法一一滿足上述要求。


      模型首先利用僅包含“窗口注意力”機制的SAM-base(約8000萬參數),在高分辨率圖像上執行細粒度的局部特征提取,生成約4096個token;隨后通過一個16倍卷積壓縮器,將這些局部特征進一步降維至256個token;最后引入具備“全局注意力”機制的CLIP-large(約3億參數),在低分辨率語義空間中整合全局信息。整個編碼過程完成后,解碼器DeepSeek-3B-MoE負責順序重建上下文,精確復述。

      值得注意的是,同一個模型可以根據任務需求靈活調整其“壓縮強度”。為此,DeepSeek人為設定了四種原生分辨率(Native Resolutions),用于平衡精度與計算效率。最低精度的Tiny模式使用約64個token來表示一張512×512的圖像;最高精度的Large模式則需要約400個token來表示1280×1280的圖像。此外,團隊還設計了一種 “高達模式”(Gundam Mode),由兩種原生分辨率組合而成,用于特定的超高分辨率應用場景。

      智譜的Glyph框架也是類似的思路,但在策略上有所不同。它的整個訓練流程分為三個緊密耦合的階段:持續預訓練、渲染搜索與后期的監督微調和強化學習。所謂大型語言模型驅動的渲染搜索機制(LLM-driven Rendering Search),就是不再依賴人工設計,而是利用遺傳算法(Genetic Algorithm),讓系統在不斷的進化迭代中,自動發現最優渲染配置,實現壓縮率與視覺清晰度之間的動態平衡。


      在硅谷大神卡帕西(Andrej Karpathy)看來,也許DeepSeek-OCR算不上最好的OCR工具,但這并不重要。他提到了dots,也許指的是同為中國團隊小紅書發布的開源工具dots.ocr,它的文檔解析準確率接近100%。對于DeepSeek-OCR來說,重要的是,它是否揭示了大模型研發的新路徑:像素是否比文本更適合大型語言模型的輸入。

      這種方式對信息的壓縮更高效,信息流也更為通用,可以包括不同的空間語義與異構符號體系,比如粗體文本與彩色文本,以及化學符號等等??ㄅ廖鬟€認為,它能夠輕松使用雙向注意力機制,并最終讓模型擺脫那套“糟糕的、割裂的”分詞體系。傳統的自回歸語言建模是單向的,而分詞器(tokenizer)則阻礙了模型走向端到端的統一表示。

      也許文本并非信息的最佳載體,像素才是更高效、更統一的輸入形式。自稱“骨子里的計算機視覺研究者”的卡帕西,甚至更激進地認為,所有向大型語言模型的輸入,都應該先被渲染成圖像。同樣來自視覺領域、提出了擴散Transformer(DiT)的謝賽寧,也給予了DeepSeek高度評價。

      讓大模型像生物一樣“看懂”文本,不是DeepSeek與智譜的突發奇想。幾年前,學界就提出過“基于像素的語言建?!保↙anguage Modelling with Pixels)的設想。

      但是,中國的開源模型團隊率先將它工程化與實用化。也許,這樣的團隊不只是DeepSeek或智譜。DeepSeek-OCR核心作者Haoran Wei,此前在以多模態模型見長的階躍星辰,就已經和他的同事們,嘗試過對“通用OCR理論”(General OCR Theory)的初步探索。

      全球都缺算力,中國尤其如此。同時,隨著多智能體協同的逐步到來,上下文將越來越長,如何合理與高效的記憶與遺忘,是大模型研究的前沿課題。以往,中國團隊的努力主要集中在對傳統注意力機制的優化,試圖引入稀疏或線性注意力,降低計算復雜度。這一次,它們終于越過了文本token的表示瓶頸。

      DeepSeek還有更大的野心。它的DeepSeek-OCR不僅關乎“看懂”,還關乎“記憶”與“遺忘”。

      當我們回憶一本讀過的書時,往往會依靠視覺印象來定位記憶:時間越近的內容,在腦海中的“分辨率”越高;而那些久遠的記憶,則會被逐漸“壓縮”為關鍵信息,成為再次檢索時的視覺錨點。DeepSeek-OCR的不同分辨率的設計,正好契合了這一思路。也許,它可以通過逐級壓縮信息,直至邊際遺忘,或內化為更深層的表征。


      “記憶”與“遺忘”,意味著更高效的計算、通信與儲存,對于智能體完成多輪對話的長程任務,甚至未來大模型自進化,都至關重要。如果說,現在的大模型更像卡帕西所說的“幽靈”而不是“松鼠”,也正是缺少感知與理解、記憶與遺忘的關鍵循環。

      在論文的最后,DeepSeek團隊致辭說,這一思路“為構建一種理論上無限上下文長度的模型架構(unlimited context architectures)提供了新的可能”,是一個很有前景的新方向;智譜團隊致辭說,這是一種很有前景的“擴展長上下文大模型(scaling long-context LLMs)”的新范式,在深度方面仍有很大的探索空間。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      1月25日周日:13家公司發重大利好,8公司集體暴增翻倍 最高超300%

      1月25日周日:13家公司發重大利好,8公司集體暴增翻倍 最高超300%

      股市皆大事
      2026-01-25 08:19:27
      向中國要1250億,中方拒絕西方急了,COP30上我們沒義務當冤大頭

      向中國要1250億,中方拒絕西方急了,COP30上我們沒義務當冤大頭

      愛吃醋的貓咪
      2026-01-03 20:24:16
      俄羅斯沒想到,美國更沒想到,中國幾乎所有“關鍵”技術遙遙領先

      俄羅斯沒想到,美國更沒想到,中國幾乎所有“關鍵”技術遙遙領先

      流史歲月
      2026-01-18 17:20:06
      陳建斌曝李亞鵬大學宿舍趣事!30年前的頂流李亞鵬,曾是盛世美顏

      陳建斌曝李亞鵬大學宿舍趣事!30年前的頂流李亞鵬,曾是盛世美顏

      露珠聊影視
      2026-01-25 12:32:00
      2噸原材料煉出191克黃金!對話當代“煉金客”:只能賺到10克金,普通人沒有資質根本做不了

      2噸原材料煉出191克黃金!對話當代“煉金客”:只能賺到10克金,普通人沒有資質根本做不了

      每日經濟新聞
      2026-01-25 15:11:08
      開始清算!逃英兩年的許家印前妻,迎兩大噩耗,兒子也徹底被牽連

      開始清算!逃英兩年的許家印前妻,迎兩大噩耗,兒子也徹底被牽連

      阿芒娛樂說
      2026-01-25 10:13:17
      壞消息,猛龍隊中鋒珀爾特爾的“持續背傷”仍未見好轉跡象

      壞消息,猛龍隊中鋒珀爾特爾的“持續背傷”仍未見好轉跡象

      好火子
      2026-01-26 01:05:12
      李瑋鋒談王鈺棟:球迷都在捧殺他,日本后衛都扛不住能去德甲和英超踢?

      李瑋鋒談王鈺棟:球迷都在捧殺他,日本后衛都扛不住能去德甲和英超踢?

      懂球帝
      2026-01-26 00:09:46
      大跳水!暴跌40%,又土又貴還開遍機場,中產的標配,賣不動了

      大跳水!暴跌40%,又土又貴還開遍機場,中產的標配,賣不動了

      毒sir財經
      2025-11-16 23:08:08
      英超三隊全取三分:切爾西進歐冠區,維拉追平曼城

      英超三隊全取三分:切爾西進歐冠區,維拉追平曼城

      格斗聯盟有話說
      2026-01-26 00:50:04
      婚姻里的“哄”,是最高級的浪漫

      婚姻里的“哄”,是最高級的浪漫

      青蘋果sht
      2025-12-27 05:12:18
      廣州一出租車司機機場排隊時提前1小時開始計費,收取乘客車費267元,被立案查處

      廣州一出租車司機機場排隊時提前1小時開始計費,收取乘客車費267元,被立案查處

      極目新聞
      2026-01-24 21:00:48
      口碑反轉!王菲沒想到,負債累累的李亞鵬,如今卻讓自己“難堪”

      口碑反轉!王菲沒想到,負債累累的李亞鵬,如今卻讓自己“難堪”

      白面書誏
      2026-01-19 17:22:22
      韓國人知道自己是個小國家嗎?網友:小小的韓國包含了整個宇宙

      韓國人知道自己是個小國家嗎?網友:小小的韓國包含了整個宇宙

      帶你感受人間冷暖
      2026-01-26 00:15:05
      李賽鳳趁丈夫出差,和體格壯碩的干兒子發生了親密接觸

      李賽鳳趁丈夫出差,和體格壯碩的干兒子發生了親密接觸

      西樓知趣雜談
      2026-01-20 17:11:19
      “一坐高鐵就犯困”?12306回應車廂二氧化碳濃度超標

      “一坐高鐵就犯困”?12306回應車廂二氧化碳濃度超標

      中國日報
      2026-01-24 16:19:19
      毛主席在電視前看莊則棟打球,突然大喊:我的小祖宗,快拿下來吧

      毛主席在電視前看莊則棟打球,突然大喊:我的小祖宗,快拿下來吧

      蔣南強讀歷史
      2026-01-13 06:00:03
      炸裂!利物浦 1 億歐死磕皇馬巨星,熱刺雙線截胡太狠了

      炸裂!利物浦 1 億歐死磕皇馬巨星,熱刺雙線截胡太狠了

      瀾歸序
      2026-01-25 05:20:06
      印度與歐盟達成協議 將汽車進口關稅從最高110%下調至40%

      印度與歐盟達成協議 將汽車進口關稅從最高110%下調至40%

      財聯社
      2026-01-25 20:42:06
      羅云峰已赴安徽省政協任職

      羅云峰已赴安徽省政協任職

      鳳凰網安徽
      2026-01-25 10:14:50
      2026-01-26 01:43:00
      未盡研究 incentive-icons
      未盡研究
      新能源、人工智能、合成生物、地緣X
      292文章數 61關注度
      往期回顧 全部

      科技要聞

      黃仁勛在上海逛菜市場,可能惦記著三件事

      頭條要聞

      男孩打碎電視屏為"還債"在小區創業 不到2個月賺了6千

      頭條要聞

      男孩打碎電視屏為"還債"在小區創業 不到2個月賺了6千

      體育要聞

      中國足球不會一夜變強,但他們已經創造歷史

      娛樂要聞

      央八開播 楊紫胡歌主演的40集大劇來了

      財經要聞

      隋廣義等80人被公訴 千億騙局進入末路

      汽車要聞

      別克至境E7內飾圖曝光 新車將于一季度正式發布

      態度原創

      教育
      時尚
      親子
      數碼
      公開課

      教育要聞

      孩子為何愛電子游戲

      看了魯豫對章小蕙的采訪,最大感觸是這一點

      親子要聞

      女子腹痛送醫才知道自己懷孕,23分鐘后......生了一個男孩

      數碼要聞

      AMD最強APU更新!銳龍AI Max+ 400詳細規格曝光:5.2GHz CPU、3.0GHz GPU

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品久久久久久福利69堂| 成人丝袜激情一区二区| 第一色网| 色香色欲综合网| 69国产| 欧美freesex10一|3| 一本之道高清无码视频| 丰满少妇被猛烈进入| 免费观看18禁无遮挡真人网站| 成熟女人特级毛片www免费| 人妻少妇久久| 亚洲成av人在线视猫咪| 国产亚洲制服免视频| 久操视频在线免费观看| 熟妇人妻无乱码中文字幕真矢织江| 亚洲中文综合字幕在线| 丰满爆乳一区二区三区| jizz日本人妻| 中文字幕无码免费久久99| 九九三级影视| 九九精品在线看| 国产区成人精品视频| 桃子视频在线播放WWW| 成年午夜性影院| 91??蝌蚪老熟女偷拍| 加勒比无码av中文字幕| 国产精品va无码一区二区| 最新亚洲人成无码WWW| 顶级少妇做爰视频在线观看| 国产精品视频中文字幕| 亚洲国产精品无码久久一区二区| 久久永久免费人妻精品| 成人品视频观看在线| 深夜释放自己在线观看| 精品国产一区二区三区四区阿崩 | 亚洲欧美另类小说| 日本久久中文字幕| 无码2区| 俺来也俺去啦最新在线| 一本久久a精品一区二区| 免费视频爱爱太爽了激情|