PChome 4月10日消息,據《創智記》從多位知情人士處獲悉,DeepSeek創始人梁文鋒近日在內部溝通中透露,DeepSeek新一代旗艦大模型DeepSeek V4將于本月下旬正式發布。
![]()
近期網頁端上線“快速模式”與“專家模式”,支持簡潔搜索與長程復雜任務處理,被視為V4能力的預演。“專家模式”實測在代碼生成、數學推理等復雜任務中表現突出,但高峰時仍需排隊。
據悉,新模型將實現重大技術突破,包括萬億參數規模、百萬級上下文窗口,并在推理階段首次全面適配華為昇騰等國產AI芯片,成為國內首個在全鏈路算力上徹底擺脫英偉達依賴的萬億級大模型,推理速度較V3提升35倍,能耗降低40%。
![]()
3月29日 DeepSeek經歷了13 小時服務中斷,恢復后開發者實測模型邏輯嚴謹性、代碼生成能力均顯著提升,疑似為V4灰度測試。同時,新版本通過“存算分離”機制搭建創新架構,將靜態知識存儲與動態推理解綁,實現降低算力消耗并提升長文本連貫性。
![]()
DeepSeek V4預計將以Apache 2.0協議開源,支持企業自主部署,并已被阿里、騰訊、字節等科技巨頭提前預訂算力資源,計劃集成至其云服務與AI產品中。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.