4月24日,國產AI公司DeepSeek正式發布下一代大模型DeepSeek-V4預覽版并全面開源,推出性能旗艦V4-Pro(1.6T總參數、49B激活參數)與高性價比V4-Flash(284B總參數、13B激活參數)雙版本,全系標配百萬token(約70萬漢字)上下文能力。從技術破壁到資本熱捧,從開源普惠到國產算力適配,DeepSeekV4的發布不僅是一次產品迭代,更標志著中國大模型在技術性能、商業化落地、生態卡位上進入全新階段。
![]()
技術硬核:三大創新實現百萬上下文,效率顛覆行業
長期以來,長上下文能力是大模型的“高端選配”,主流開源模型多停留在128K–256K區間,且計算成本高昂。DeepSeekV4通過**自研DSA稀疏注意力、token壓縮、流形約束超連接(mHC)**三大核心技術,將百萬上下文從“奢侈品”變為“普惠品”,同時大幅降低算力門檻。
其一,**混合注意力機制(CSA+HCA)**重構長文本處理邏輯。傳統注意力機制需對所有token逐一計算,成本隨長度呈平方級增長。DeepSeekV4采用壓縮稀疏注意力(CSA)與重度壓縮注意力(HCA)結合的設計:CSA將4個連續token編為一組并生成摘要,僅篩選最相關小組計算;HCA則進一步壓縮注意力信息,適配極長文本場景。數據顯示,V4-Pro在百萬token上下文下,單token計算量僅為前代V3.2的27%,KVCache顯存占用降至10%,徹底解決長文本“顯存爆炸、推理緩慢”的痛點。
![]()
其二,混合專家(MoE)架構實現高效推理。V4-Pro總參數達1.6萬億,但通過MoE架構,推理時僅激活49B參數,在保證性能的同時將計算需求壓縮至可控范圍。這種“大參數、小激活”的設計,讓萬億級模型在普通算力集群上即可運行,為行業提供了低成本高性能的技術路徑。
其三,**流形約束超連接(mHC)**提升長文本穩定性。深層網絡中,傳統殘差連接易出現信號衰減,導致長文本理解失真。mHC替代傳統殘差連接,增強信號在深層網絡的傳播穩定性,確保百萬token下邏輯連貫、信息不丟失。此外,模型采用Muon優化器,訓練收斂速度與穩定性同步提升。
![]()
性能層面,V4-Pro在Agent編程、數學推理、STEM競賽等評測中比肩頂級閉源模型,編程能力超越GPT-5.2,世界知識儲備大幅領先開源模型,僅稍遜于Gemini-Pro-3.1。更關鍵的是,V4全面適配華為昇騰芯片,成為首個脫離英偉達生態的頂級大模型,為國產算力自主可控提供核心支撐。
![]()
商業化破局:開源+極致性價比,重構行業定價體系
如果說技術創新是DeepSeekV4的“硬實力”,那么開源策略+極致性價比定價則是其攪動行業格局的“殺手锏”。
此次V4全系采用MIT協議完全開源,在HuggingFace與ModelScope雙平臺同步開放權重,支持本地部署與二次開發。開源意味著中小企業、開發者可免費使用百萬上下文能力,無需支付高額授權費,直接降低AI應用開發門檻。網友直呼:“百萬上下文1塊錢真香”,精準道出普惠價值。
![]()
定價方面,V4-FlashAPI輸入定價低至0.2元/百萬token,輸出定價2元/百萬token,折合不到0.3美元,而同期OpenAIGPT-5.5輸出定價達30美元/百萬token,價格差距達100倍。即便在百萬上下文場景下,V4的處理成本也僅為GPT-4的1/70,徹底打破海外巨頭的高價壟斷,推動AI服務從“昂貴訂閱”向“普惠工具”轉變。
市場反應直接印證其沖擊力:V4發布當日,國產算力概念股大漲,寒武紀完成Day0適配并開源代碼;而智譜AI、MiniMax等競品則出現下跌,行業格局重構信號明顯。海外社區也熱議“鯨魚回來了”,認可其“便宜又強大”的核心優勢。
資本狂歡:一周估值翻倍至200億美元,稀缺性成核心溢價
就在V4發布前一周,DeepSeek的融資消息已引爆行業:4月17日被曝以100億美元估值尋求至少3億美元融資;5天后,估值飆升至200億美元,阿里、騰訊爭相洽談投資,創造中國AI創投史罕見的“一周翻倍”紀錄。
高估值的核心邏輯,在于DeepSeek的三重稀缺性。其一,技術獨立性稀缺:過去一年,DeepSeek堅持“不融資、不上市、專注技術”,完全依賴幻方量化利潤支撐,未被任何巨頭收編,是“最后一張沒被巨頭收編的王牌”。在人才爭奪戰白熱化的當下,能保持技術純粹性、持續突破的團隊鳳毛麟角。
![]()
其二,技術壁壘稀缺:DeepSeek是全球少數同時掌握萬億參數模型訓練、百萬上下文處理、國產算力適配三大核心能力的團隊。其R1模型以557萬美元訓練成本(不足GPT-4的1%)實現頂級推理能力,重構行業成本標準;V4的技術突破進一步鞏固領先地位,形成難以復制的技術護城河。
其三,生態位稀缺:中美AI發展路徑差異顯著,海外巨頭主導閉源生態,而中國市場更需要“開源+低成本+自主可控”的模型。DeepSeekV4精準契合這一需求,成為連接國產算力、中小企業應用、開發者生態的關鍵節點,戰略價值凸顯。
需要明確的是,DeepSeek尚未產生可觀收入,200億美元估值更多是對其技術潛力、生態價值與稀缺性的預判。有觀點認為估值存在泡沫,但對標智譜AI(500億美元)、MiniMax(300億美元)的市值,DeepSeek的估值仍有“性價比”。此次融資核心目的并非“缺錢”,而是為員工期權建立市場化估值錨點,留住核心團隊——過去一年,已有核心人員被競品高薪挖走。
行業啟示:從技術突破到生態卡位,中國AI進入新階段
DeepSeekV4的發布與高估值,折射出中國AI競爭邏輯的根本轉變:從單一技術參數比拼,轉向技術、算力、生態、資本的綜合卡位。
一方面,長文本能力普惠化成為必然趨勢。DeepSeek將百萬上下文從高端能力變為標配,將推動法律、金融、科研、代碼開發等領域的應用革新——律師可一鍵解析全套卷宗,程序員能處理完整代碼庫,科研人員可高效分析海量文獻。長文本不再是“炫技參數”,而是解決實際問題的核心能力。
另一方面,國產算力+自主模型的組合正在形成合力。V4全面適配昇騰芯片,打破英偉達的算力壟斷,為中國AI產業鏈自主可控提供示范。未來,隨著更多模型適配國產算力,將形成“算力-模型-應用”的正向循環,降低對海外技術的依賴。
![]()
更深層次的思考在于資本與技術的平衡。網友熱議“資本入場后能否保持技術純粹性”,這也是所有技術驅動型公司的共同挑戰。DeepSeek的選擇,將決定其未來是成為“巨頭生態的附庸”,還是“堅持獨立的技術標桿”——而這,也將影響中國AI行業的創新活力與發展方向。
![]()
從技術破壁到資本熱捧,從開源普惠到生態重構,DeepSeekV4的意義早已超越一款模型的發布。它標志著中國大模型在性能、成本、自主可控三大維度實現全面突破,也預示著全球AI格局中,中國力量正從“追隨者”向“引領者”轉變。未來,隨著技術迭代加速與生態不斷完善,DeepSeek能否守住技術初心、兌現商業潛力,值得持續關注。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.