PChome 4月24日消息,深度求索公司正式推出全新系列模型DeepSeek-V4的預覽版本,并同步開源,標志著大模型正式邁入百萬上下文普惠時代。
![]()
DeepSeek-V4采用創新的注意力機制,在Token維度進行壓縮,結合DSA稀疏注意力技術,實現了全球領先的百萬字超長上下文處理能力,同時大幅降低了對計算和顯存的需求。模型分為兩個版本:DeepSeek-V4-Pro擁有1.6萬億參數,在Agent能力、世界知識和推理性能上均達到國內與開源領域的領先水平;DeepSeek-V4-Flash則以更小的參數量提供接近的推理能力,成為更快捷、經濟的選擇。
![]()
在性能表現上,DeepSeek-V4-Pro在Agentic Coding評測中已達到當前開源模型最佳水平,使用體驗優于Sonnet 4.5,交付質量接近Opus 4.6非思考模式。在世界知識測評中大幅領先其他開源模型,在數學、STEM、競賽型代碼等推理任務中超越所有已公開評測的開源模型,比肩世界頂級閉源模型。
![]()
API服務已同步更新,支持OpenAI ChatCompletions與Anthropic接口。V4-Pro和V4-Flash均支持1M上下文長度,提供非思考模式與思考模式。值得注意的是,舊有API接口的deepseek-chat與deepseek-reasoner模型名將于2026年7月24日停止使用。
此次開源包括模型權重和技術報告,開發者可通過Hugging Face和ModelScope平臺獲取。DeepSeek-V4的推出不僅展示了中國在AI大模型領域的技術實力,更為開發者社區提供了強大的工具,有望推動AI應用向更復雜、更專業的場景拓展。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.