不管大家關不關注,AI 行業仍然再瘋狂的發展中,幾乎每一個重磅級玩家都再默默深耕自己的領域。
DeepSeek 團隊每次出手都會讓行業震驚,就在這兩天 DeepSeek 剛發布了一個新模型,在國內外的AI圈都炸鍋了!
DeepSeek-OCR!
![]()
什么意思呢?
OCR?不是你理解的圖像文字識別那套技術,而是想從另外一個角度來解決 AI 的記憶問題。
DeepSeek-OCR 想做的事很簡單:先把一大段文字“變成圖”,再用少量圖像 Token 編碼內容,實現了比文本 Token 更高的“信息壓縮率”。
比如 1 萬字≈5,000 文本 Token,用圖像表示或許僅需 ~512 個 Token。
它用“視覺表示”來壓縮文本(把整頁當圖來編碼),能把需要的 Token 數量減少7~20 倍。
這意味著同樣的篇幅,用更少的“格子”裝下,長上下文更便宜、更穩定。
以前 1 萬字很快就把上下文塞滿;現在先“光學壓縮”成少量視覺 Token,再交給 LLM 處理,單次可處理的材料長度顯著提升,長文摘要、跨文檔問答不再動不動超限。
DeepSeek-OCR 的意義不在“又做了個 OCR”,而在于用視覺把文本高效打包:
同樣的信息更省 Token、更快處理、更易被大模型長距離理解——這對“長文檔 + LLM”的所有應用,都是實實在在的降本增效。
大家有沒有發現。
當所有的大廠都再卷應用的時候,DeepSeek 團隊一直再深耕底層的技術,做 AI 大模型最基礎的研發。
可以讓 AI 以更低的成本,更高效的方式,變革的更聰明,并且他們研究出來后就開源了,可以讓整個行業受益。
有武俠小說中掃地僧的感覺,不管外界如何紛紛擾擾,我就專心去做我應該去做的事情。
當大家都快遺忘的時候,偶爾出來震驚大家一把!
同時間, OpenAI 已正式發布 AI 瀏覽器「ChatGPT Atlas」!
Atlas 不只是一個能聊天的瀏覽器,而是能直接理解網頁內容、幫你完成任務的 AI 瀏覽器。
例如,它能讀取你正在瀏覽的網站內容,幫你總結、回答問題,甚至在“Agent 模式”下自動執行操作,比如幫你訂餐、查資料、或整理網頁信息。
![]()
更厲害的是,它支持“瀏覽記憶”(Browser Memories),能記住你瀏覽過的內容并在未來使用。
比如可以問:“總結一下我上周看過的招聘網站趨勢。”同時這些記憶是可控的,可以隨時刪除或關閉。
目前已發布 MacOS 版本,Windows / iOS / Android 在路上。
行業真的是越來越熱鬧,真的很好奇再過 10 年, 很期待 我們的世界會被 AI 改造成什么樣子。
想象一下:你在國內花 10 塊拿貨,在海外能賣 X 美金,這就是跨境電商,不是噱頭,是趨勢。
出海有35倍理論,國外用戶付費率比國內多5倍,匯率有7倍的差距,5*7=35倍紅利。
我們做了6個店,每月營收都在高速增長;合作伙伴一個員工負責十幾個店單人單月營收十幾萬,關鍵利潤率在30-50%+。
出海跨境,做了,你才知道世界有多大。
我最近在做這個項目,如果你想了解怎么入局、怎么找貨、怎么賺美刀,加我注里微信,通過后回復關鍵字【跨境】,給你發資料。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.