![]()
新智元報(bào)道
編輯:犀牛
【新智元導(dǎo)讀】DeepSeek V4下周登場(chǎng):原生多模態(tài),繞過英偉達(dá),針對(duì)國(guó)產(chǎn)芯片深度優(yōu)化。華爾街最怕的那條邏輯可能又要重演:算力霸權(quán)松動(dòng),美股先顫抖。
朋友們,見證歷史的時(shí)刻又要到了!
《金融時(shí)報(bào)》報(bào)道,DeepSeek V4,下周正式登場(chǎng)!
![]()
距離上一次DeepSeek發(fā)布重大模型R1,已經(jīng)過去了整整一年多。
這一年里,AI行業(yè)風(fēng)起云涌,OpenAI連推數(shù)代GPT,Anthropic的Claude殺入頂級(jí)陣營(yíng),谷歌Gemini瘋狂迭代。
整個(gè)硅谷都在用數(shù)百億美元甚至數(shù)千億美元瘋狂「燒錢」。
而DeepSeek呢?
它安安靜靜地待在杭州,沒有發(fā)布會(huì),不路演,不炒作。
只做一件事:磨刀。
預(yù)計(jì)下周發(fā)布的V4將是一款支持圖片、視頻和文本生成的原生多模態(tài)大模型。
更炸裂的是,V4并沒有選擇跟英偉達(dá)做優(yōu)化適配,而是優(yōu)先與國(guó)產(chǎn)芯片廠商合作,針對(duì)國(guó)產(chǎn)AI芯片進(jìn)行了深度調(diào)優(yōu)。
這意味著,DeepSeek V4將不只是一次模型升級(jí),也是一次底層架構(gòu)的戰(zhàn)略轉(zhuǎn)向。
是中國(guó)AI從「用別人的芯片跑自己的模型」走向「用自己的芯片跑自己的模型」的歷史性一步。
DeepSeek選擇國(guó)內(nèi)重磅會(huì)議前夕發(fā)布V4,無疑發(fā)出了一個(gè)信號(hào):中國(guó)AI,不只是在追趕,還在定義新的游戲規(guī)則。
網(wǎng)友稱,「V4 將對(duì) OpenAI 和 Google 形成巨大壓力。中國(guó)沒有放緩,而是在加速。」
「人工智能競(jìng)賽又提升了一個(gè)檔次。」
![]()
![]()
有網(wǎng)友爆料,DeepSeek V4的API成本將比對(duì)手便宜50多倍。
![]()
更有網(wǎng)友豪言,美股已經(jīng)瑟瑟發(fā)抖。
![]()
![]()
![]()
V4強(qiáng)在哪?
第一個(gè)關(guān)鍵詞:多模態(tài)。
過去的DeepSeek模型主要是「文字選手」——寫代碼一流,做推理一絕,但圖像和視頻能力一直是短板。
V4徹底補(bǔ)齊了這塊拼圖。
據(jù)目前泄露的信息,V4是一個(gè)原生多模態(tài)模型,能夠同時(shí)理解和生成圖片、視頻和文本。
而且,V4 Lite已經(jīng)在至少一家推理服務(wù)商處進(jìn)行內(nèi)測(cè),據(jù)稱擁有高達(dá)100萬token的上下文窗口,表現(xiàn)遠(yuǎn)超網(wǎng)頁版和應(yīng)用版模型。
目前已經(jīng)在外網(wǎng)瘋傳的一張對(duì)比圖顯示,DeepSeek V4 Lite(代號(hào)「Sealion-lite」)在不開啟思考模式的情況下,生成的SVG圖像質(zhì)量已經(jīng)明顯超越了當(dāng)前的DeepSeek V3.2思考模型。
![]()
有大V發(fā)帖稱,V4的編碼性能甚至比當(dāng)前的GPT和Claude更強(qiáng)。
![]()
第二個(gè)關(guān)鍵詞:國(guó)產(chǎn)芯片適配。
這是V4最具戰(zhàn)略意義的突破。
據(jù)路透社和《金融時(shí)報(bào)》報(bào)道,DeepSeek這次繞開了英偉達(dá),沒有向這家美國(guó)芯片巨頭提供V4的早期接入權(quán)限。
這打破了AI行業(yè)長(zhǎng)期以來的慣例——過去,任何一個(gè)頂級(jí)大模型發(fā)布前,都會(huì)先跟英偉達(dá)做性能優(yōu)化。
這一次,DeepSeek選擇了「反向操作」。
DeepSeek用V4告訴全世界:我們不挑芯片,也能跑出世界一流的模型。
當(dāng)然,客觀地說,英偉達(dá)在訓(xùn)練階段的芯片上依然占據(jù)主導(dǎo)地位,尤其是在計(jì)算密集型的預(yù)訓(xùn)練環(huán)節(jié)。
但在推理階段,V4可能已經(jīng)實(shí)現(xiàn)了國(guó)產(chǎn)芯片的全面適配。
推理環(huán)節(jié)是大模型商業(yè)化落地最核心的一環(huán),這一步的突破意義不可估量。
第三個(gè)關(guān)鍵詞:開源。
據(jù)知情人士透露,DeepSeek將在V4發(fā)布時(shí)同步放出一份簡(jiǎn)短的技術(shù)說明,并在大約一個(gè)月后發(fā)布一份更全面的技術(shù)報(bào)告。
這延續(xù)了DeepSeek一貫的「開放精神」。
去年R1發(fā)布時(shí)附帶的那份詳盡技術(shù)報(bào)告,曾讓全球AI研究者受益匪淺,被視為推理模型領(lǐng)域最重要的開源貢獻(xiàn)之一。
回顧R1
那一天,硅谷真的慌了
要理解V4的分量,必須先回看去年DeepSeek R1發(fā)布時(shí)的那場(chǎng)「地震」。
2025年1月20日,DeepSeek悄然上線了R1推理模型。
沒有發(fā)布會(huì),沒有媒體吹風(fēng)會(huì),沒有CEO站在臺(tái)上揮手致意——就是簡(jiǎn)簡(jiǎn)單單地把模型放了出來,附帶一份技術(shù)報(bào)告。
然后,全世界炸了。
R1在多項(xiàng)基準(zhǔn)測(cè)試上達(dá)到了與OpenAI最強(qiáng)模型o1相當(dāng)甚至超越的水平,而DeepSeek聲稱其訓(xùn)練成本僅為約560萬美元——這個(gè)數(shù)字不到GPT-4訓(xùn)練成本的十分之一。
更要命的是,R1是開源的!
2025年1月27日——這是一個(gè)將被載入AI史冊(cè)的日子,DeepSeek的手機(jī)App超越ChatGPT,成為蘋果App Store下載量第一的免費(fèi)應(yīng)用。
同一天,英偉達(dá)股價(jià)暴跌近17%,單日市值蒸發(fā)約5890億美元,創(chuàng)下美國(guó)股市單家公司歷史最大單日跌幅紀(jì)錄。
博通下跌超過17%,微軟下跌2.1%,整個(gè)納斯達(dá)克血流成河。
![]()
知名風(fēng)投家馬克·安德森稱DeepSeek為「我見過的最令人驚嘆和印象深刻的突破之一」。
多位美國(guó)科技界人士將其比作「斯普特尼克時(shí)刻」——1957年蘇聯(lián)先于美國(guó)將衛(wèi)星送入太空的那一刻,象征著中國(guó)AI實(shí)力的強(qiáng)勢(shì)崛起。
而華爾街投資人最恐懼的問題浮出水面:如果一家中國(guó)公司用十分之一的成本就能做出同等水平的模型,那美國(guó)科技巨頭每年砸下的數(shù)百億美元基礎(chǔ)設(shè)施投資,還值得嗎?
英偉達(dá)的高端GPU還會(huì)有那么大的需求嗎?
蟄伏一年,DeepSeek都干了什么?
R1之后,DeepSeek進(jìn)入了長(zhǎng)達(dá)一年多的「靜默模式」。
沒有新的旗艦?zāi)P停挥袧u進(jìn)式更新。
但這并不意味著他們無所作為——恰恰相反,DeepSeek一直在為V4鋪路。
來看看這份更新時(shí)間線:
2025年3月:DeepSeek-V3-0324發(fā)布。這是V3的一次重要升級(jí),通過吸收R1的強(qiáng)化學(xué)習(xí)技術(shù)改進(jìn)了后訓(xùn)練流程,在數(shù)學(xué)和編程評(píng)測(cè)上甚至超過了GPT-4.5。
2025年5月:DeepSeek-R1-0528發(fā)布。R1的大幅升級(jí)版,推理能力顯著增強(qiáng),代碼生成質(zhì)量提升,被認(rèn)為是開源推理模型的新標(biāo)桿。
2025年8月:DeepSeek-V3.1發(fā)布。這是一個(gè)里程碑式的更新——V3.1首次將V3和R1的能力融合到一個(gè)模型中,支持「思考模式」和「非思考模式」的自由切換,在SWE-bench等基準(zhǔn)上比前代提升超40%。此后更新至V3.1-Terminus版本,進(jìn)一步修復(fù)了多語言混合、Agent能力等問題。
2025年9月:DeepSeek-V3.2-Exp發(fā)布。引入了全新的稀疏注意力機(jī)制(DeepSeek Sparse Attention),為更長(zhǎng)上下文和更高效率的推理奠定了架構(gòu)基礎(chǔ)。
2025年11月:DeepSeekMath V2發(fā)布,基于V3.2-Exp-Base構(gòu)建,在多項(xiàng)數(shù)學(xué)競(jìng)賽中達(dá)到金牌水平,并驗(yàn)證了自驗(yàn)證(self-verification)技術(shù)的有效性。
2025年12月:DeepSeek-V3.2正式發(fā)布。V3.2-Speciale版本在2025年國(guó)際數(shù)學(xué)奧林匹克(IMO)和國(guó)際信息學(xué)奧林匹克(IOI)中取得金牌級(jí)表現(xiàn),首次將思考能力整合到工具調(diào)用中。
2026年1月:DeepSeek先后發(fā)布了關(guān)于Manifold-Constrained Hyper-Connections(mHC)和Engram條件記憶技術(shù)的研究論文,被業(yè)界普遍視為V4的架構(gòu)基石。mHC改變了信息在模型層間的流動(dòng)方式,Engram則讓模型能夠選擇性地記憶和調(diào)用上下文信息,支持超過100萬token的上下文處理。
![]()
每一步,都在為V4的最終亮相做準(zhǔn)備。
一場(chǎng)精心策劃的輿論戰(zhàn)?
就在V4即將發(fā)布的節(jié)骨眼上,美國(guó)那邊也沒閑著。
2月24日,Anthropic在X上高調(diào)發(fā)帖,指控DeepSeek等3家對(duì)其Claude模型發(fā)動(dòng)了「工業(yè)級(jí)蒸餾攻擊」,聲稱這三家中國(guó)實(shí)驗(yàn)室創(chuàng)與Claude進(jìn)行了超過1600萬次對(duì)話,以此提取能力來訓(xùn)練自己的模型。
![]()
但諷刺的一幕緊隨其后。
就在Anthropic高調(diào)指責(zé)「蒸餾」的同一周,網(wǎng)友發(fā)現(xiàn)了一個(gè)令人瞠目的bug:當(dāng)你用中文問Claude「你是什么模型」時(shí),它竟然回復(fù):「我是DeepSeek V3。」
甚至通過Anthropic官方API測(cè)試,結(jié)果還是一樣。
用法語提問時(shí),Claude則回答「我是ChatGPT」。
這一幕的戲劇性實(shí)在太強(qiáng)了。
你剛指控別人「蒸餾你」,轉(zhuǎn)頭自己的模型就在中文環(huán)境下認(rèn)了別人當(dāng)「爹」。
Anthropic那條推文下面6000多條評(píng)論,超過70%都在嘲諷。
![]()
Reddit上的討論更加一針見血。
有用戶總結(jié)道:這是一場(chǎng)有組織的FUD(恐懼、不確定性和懷疑)營(yíng)銷。
目的很明確——在V4發(fā)布前搶占敘事高地,預(yù)先埋下「他們只會(huì)作弊抄襲」的框架,無論V4表現(xiàn)多驚艷,公眾的第一反應(yīng)都會(huì)被引導(dǎo)到負(fù)面解讀上。
同時(shí)通過輿論手段稀釋V4發(fā)布的媒體關(guān)注度,防止美國(guó)科技股再次出現(xiàn)去年R1發(fā)布時(shí)那樣的兩位數(shù)暴跌。
美股再次顫抖?
去年R1發(fā)布時(shí),英偉達(dá)單日跌去17%,5890億美元灰飛煙滅。
![]()
如今V4不僅在模型能力上更進(jìn)一步(多模態(tài)、百萬上下文、原生國(guó)產(chǎn)芯片適配),更在戰(zhàn)略層面發(fā)出了優(yōu)先適配國(guó)產(chǎn)芯片的明確信號(hào)。
如果V4發(fā)布后的基準(zhǔn)測(cè)試再次驗(yàn)證了DeepSeek的效率優(yōu)勢(shì)——用更少的計(jì)算資源達(dá)到世界一流水平——那華爾街的投資者勢(shì)必要再次面對(duì)那個(gè)令人不安的問題:AI基礎(chǔ)設(shè)施的天量投資,真的有必要嗎?
更值得關(guān)注的是,即便是競(jìng)爭(zhēng)對(duì)手陣營(yíng)的研究人員也在私下承認(rèn),DeepSeek V4不可小視。
「可能發(fā)布就登頂開源第一」。
DeepSeek V4的發(fā)布,不會(huì)是一個(gè)平靜的事件。
從蠻力到結(jié)構(gòu)
中國(guó)AI的進(jìn)化之路
2023年7月成立,2024年12月發(fā)布V3,2025年1月R1震撼全球,一整年持續(xù)迭代打磨。
2026年3月V4攜多模態(tài)能力與國(guó)產(chǎn)芯片適配強(qiáng)勢(shì)回歸。
這條路徑揭示了一個(gè)深刻的趨勢(shì):中國(guó)AI正在從依賴硬件蠻力走向依靠架構(gòu)創(chuàng)新和工程效率的道路。
美國(guó)的出口管制試圖用「卡脖子」的方式遏制中國(guó)AI的發(fā)展,但DeepSeek的存在本身就是對(duì)這種策略最有力的回應(yīng)。
當(dāng)你無法獲得最頂級(jí)的芯片時(shí),被迫去思考更聰明的方法——更高效的訓(xùn)練策略、更精妙的架構(gòu)設(shè)計(jì)、更極致的資源優(yōu)化。
而這些創(chuàng)新一旦形成,價(jià)值遠(yuǎn)超任何一款芯片。
下周,我們拭目以待。
全世界都在看。
參考資料:
https://x.com/koltregaskes/status/2027675290735182007
https://www.ft.com/content/e3366881-0622-40a7-9c34-a0d82e3d573e
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.