1月27日消息,臨近春節,DeepSeek團隊今日在HuggingFace和GitHub平臺正式開源其新一代視覺語言模型——DeepSeek-OCR 2,并同步發布論文《DeepSeek-OCR 2: Visual Causal Flow》,揭示其在視覺編碼邏輯上的重大突破。
![]()
與初代模型主打“視覺壓縮”不同,OCR 2的核心在于通過引入DeepEncoder V2,賦予AI處理二維圖像時的“因果推理”能力,使其能夠像人類一樣,根據圖像內容動態重排信息,解決了傳統模型在處理復雜文檔布局時的局限性。(袁寧)
本文來自網易科技報道,更多資訊和深度內容,關注我們。
