DeepSeek V4 的細節,正在陸續浮出水面。
科技賬號 Legit 率先披露,V4 的輕量版本代號為「sealion-lite(海獅輕量版)」,目前已在至少一家推理服務商處展開內測,相關方均簽署了嚴格的保密協議。
據悉,該版本支持 100 萬 token 上下文窗口,原生具備多模態能力,性能明顯優于現有網頁及應用端模型。另有用戶同期展示了 V4 生成的 SVG 樣本,直言效果相當亮眼。
在參數疑似泄露的同期,今天凌晨,路透社援引知情人士消息稱,DeepSeek 計劃最快于下周發布 DeepSeek V4。
結合此前南華早報透露的消息,DeepSeek 下一代旗艦模型預計將是一款萬億參數級別的基礎模型。且正是由于模型規模大幅增長,訓練速度明顯放緩,導致發布時間被推遲。
但路透社報道中還提到,在發布 V4 之前,DeepSeek 并未按行業慣例向英偉達、AMD 等美國芯片廠商提供模型預覽,轉而提前數周向包括華為在內的中國芯片供應商開放訪問權限,以便完成適配和優化工作。
截至發稿前,英偉達與 AMD 均拒絕置評,DeepSeek 和華為亦未作出回應。
網友本周也發現,DeepSeek 的 GitHub 倉庫迎來密集更新,大量積壓的 PR 被集中合并處理。
此次更新主要集中在與 DeepSeek API 集成相關的代碼庫,內容涵蓋 AI 客戶端應用、開發運維工具及企業級解決方案等第三方集成項目,更像是工程師節后返工的例行整理。
從 Hugging Face 上超過 7500 萬次的累計下載量來看,DeepSeek 依然是全球開源 AI 領域最受矚目的存在之一。
這只「海獅」究竟何時正式亮相,所有人都在翹首以待。
![]()
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.