![]()
4月24日,深度求索公司正式上線并開源DeepSeek-V4預覽版。該模型具備百萬字超長上下文能力,在智能體、世界知識和推理性能上實現國內與開源領域領先,標志大模型長文本處理進入新紀元。
DeepSeek-V4系列包含兩個版本:參數1.6萬億的DeepSeek-V4-Pro和參數2840億的DeepSeek-V4-Flash。兩者均基于超大規模預訓練數據,并將百萬上下文作為標準配置。
性能方面,DeepSeek-V4-Pro展現出世界頂級水平。官方評測顯示,其在Agentic Coding評測中達開源模型最佳水平,使用體驗優于Claude 3.5 Sonnet,交付質量接近GPT-4o Opus非思考模式。在知識推理、數學、STEM和競賽型代碼測評中,V4-Pro超越所有已公開評測的開源模型,成績比肩頂級閉源模型。
技術突破在于全新注意力機制,通過token維度壓縮結合DSA稀疏注意力,實現全球領先的長上下文處理能力,同時大幅降低計算資源和顯存需求。
模型針對Agent能力專項優化,深度適配Claude Code、OpenClaw等主流產品,在代碼任務、文檔生成方面表現顯著提升。官方示例顯示,V4-Pro能生成包含復雜數據表格、營銷策略和排期規劃的完整PPT方案。
DeepSeek API已同步支持V4-Pro與V4-Flash,兼容OpenAI ChatCompletions和Anthropic接口。定價為:V4-Pro輸入每百萬token 12元,輸出24元;V4-Flash輸入每百萬token 1元,輸出2元。受限于高端算力,Pro版本服務吞吐量有限,預計下半年昇騰950超節點批量上市后價格將大幅下調。
深度求索已在Hugging Face和ModelScope平臺開源DeepSeek-V4模型權重并發布技術報告。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.