來源:市場資訊
![]()
作者 | 張弛
來源 | 創智記
在歷經數次“跳票”傳聞后,備受關注的DeepSeek V4即將登場。
據《創智記》從多位知情人士處獲悉,DeepSeek創始人梁文鋒近日在內部溝通中透露,DeepSeek新一代旗艦大模型DeepSeek V4將于4月下旬正式發布。
此前有相關消息顯示,DeepSeek V4不僅將帶來萬億參數規模和百萬級上下文窗口,更首次實現與華為昇騰等國產芯片的深度適配,標志著中國AI產業在“去CUDA化”道路上邁出關鍵一步。
值得關注的是,3月29日晚,DeepSeek經歷了整整13小時服務中斷。當時官方僅稱“服務器故障”,但多位開發者在恢復后發現,模型輸出邏輯發生顯著變化:編碼結構更清晰,邏輯嚴謹度飛躍式提升,SVG圖形生成能力明顯增強。
業內普遍猜測,這次“停擺”實為V4的灰度測試或全量部署。
據悉,V4將以Apache 2.0協議開源,企業可自主部署。據最新外媒報道,為迎接V4發布,阿里巴巴、字節跳動、騰訊等國內科技巨頭已預訂數十萬片新一代AI算力芯片,計劃通過云服務提供DeepSeek新模型,并將其集成到自身AI產品中。受此影響,新AI芯片產品近期價格已上漲約 20%。
此前,DeepSeek發布時間已多次延期。原計劃于 2 月中旬春節前后推出大參數版本,后因國產算力深度適配、架構重構與穩定性打磨等原因推遲。
從量化投資跨界AI的梁文鋒,正在經歷屬于他的“蛻變”。
《晚點》報道,過去一年,DeepSeek團隊雖有核心骨干離職(包括R1核心作者郭達雅等),但“有人離開,更多人留下”,團隊并未成建制流失。
2025年下半年以來,梁文鋒開始更多提及產品化和商業化,組建產品團隊,招聘Agent方向“模型策略產品經理”,并從純模型研發向應用層延伸。同時,他正在為公司進行估值,以明確員工期權價值,給予團隊更確定的預期。
面對豆包、千問、智譜、Kimi、MiniMax等對手的強力競爭,遲到數月的V4承載著巨大的期待壓力——梁文鋒能否再次打造全世界最出色的開源大模型?
據了解,V4最大的技術亮點在于LTM(Long Term Memory,長期記憶)能力的突破。
但多位和DeepSeek深入接觸合作的AI創業者告訴《創智記》,業界不應抱太高期待,V4很難再復制去年DeepSeek-V3的影響力。
除了DeepSeek V4,混元 3.0 大模型也將于4月正式發布。這是騰訊自 2025 年下半年完成團隊架構重組、姚順雨出任首席 AI 科學家后,推出的首個重磅大模型產品。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.