網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

DeepSeek V4下周登場(chǎng)，美股再次顫抖！「跳過」英偉達(dá)，便宜50倍

2026-03-01 12:34:03　來源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：犀牛

【新智元導(dǎo)讀】DeepSeek V4下周登場(chǎng)：原生多模態(tài)，繞過英偉達(dá)，針對(duì)國(guó)產(chǎn)芯片深度優(yōu)化。華爾街最怕的那條邏輯可能又要重演：算力霸權(quán)松動(dòng)，美股先顫抖。

朋友們，見證歷史的時(shí)刻又要到了！

《金融時(shí)報(bào)》報(bào)道，DeepSeek V4，下周正式登場(chǎng)！

距離上一次DeepSeek發(fā)布重大模型R1，已經(jīng)過去了整整一年多。

這一年里，AI行業(yè)風(fēng)起云涌，OpenAI連推數(shù)代GPT，Anthropic的Claude殺入頂級(jí)陣營(yíng)，谷歌Gemini瘋狂迭代。

整個(gè)硅谷都在用數(shù)百億美元甚至數(shù)千億美元瘋狂「燒錢」。

而DeepSeek呢？

它安安靜靜地待在杭州，沒有發(fā)布會(huì)，不路演，不炒作。

只做一件事：磨刀。

預(yù)計(jì)下周發(fā)布的V4將是一款支持圖片、視頻和文本生成的原生多模態(tài)大模型。

更炸裂的是，V4并沒有選擇跟英偉達(dá)做優(yōu)化適配，而是優(yōu)先與國(guó)產(chǎn)芯片廠商合作，針對(duì)國(guó)產(chǎn)AI芯片進(jìn)行了深度調(diào)優(yōu)。

這意味著，DeepSeek V4將不只是一次模型升級(jí)，也是一次底層架構(gòu)的戰(zhàn)略轉(zhuǎn)向。

是中國(guó)AI從「用別人的芯片跑自己的模型」走向「用自己的芯片跑自己的模型」的歷史性一步。

DeepSeek選擇國(guó)內(nèi)重磅會(huì)議前夕發(fā)布V4，無疑發(fā)出了一個(gè)信號(hào)：中國(guó)AI，不只是在追趕，還在定義新的游戲規(guī)則。

網(wǎng)友稱，「V4 將對(duì) OpenAI 和 Google 形成巨大壓力。中國(guó)沒有放緩，而是在加速。」

「人工智能競(jìng)賽又提升了一個(gè)檔次。」

有網(wǎng)友爆料，DeepSeek V4的API成本將比對(duì)手便宜50多倍。

更有網(wǎng)友豪言，美股已經(jīng)瑟瑟發(fā)抖。

V4強(qiáng)在哪？

第一個(gè)關(guān)鍵詞：多模態(tài)。

過去的DeepSeek模型主要是「文字選手」——寫代碼一流，做推理一絕，但圖像和視頻能力一直是短板。

V4徹底補(bǔ)齊了這塊拼圖。

據(jù)目前泄露的信息，V4是一個(gè)原生多模態(tài)模型，能夠同時(shí)理解和生成圖片、視頻和文本。

而且，V4 Lite已經(jīng)在至少一家推理服務(wù)商處進(jìn)行內(nèi)測(cè)，據(jù)稱擁有高達(dá)100萬token的上下文窗口，表現(xiàn)遠(yuǎn)超網(wǎng)頁版和應(yīng)用版模型。

目前已經(jīng)在外網(wǎng)瘋傳的一張對(duì)比圖顯示，DeepSeek V4 Lite（代號(hào)「Sealion-lite」）在不開啟思考模式的情況下，生成的SVG圖像質(zhì)量已經(jīng)明顯超越了當(dāng)前的DeepSeek V3.2思考模型。

有大V發(fā)帖稱，V4的編碼性能甚至比當(dāng)前的GPT和Claude更強(qiáng)。

第二個(gè)關(guān)鍵詞：國(guó)產(chǎn)芯片適配。

這是V4最具戰(zhàn)略意義的突破。

據(jù)路透社和《金融時(shí)報(bào)》報(bào)道，DeepSeek這次繞開了英偉達(dá)，沒有向這家美國(guó)芯片巨頭提供V4的早期接入權(quán)限。

這打破了AI行業(yè)長(zhǎng)期以來的慣例——過去，任何一個(gè)頂級(jí)大模型發(fā)布前，都會(huì)先跟英偉達(dá)做性能優(yōu)化。

這一次，DeepSeek選擇了「反向操作」。

DeepSeek用V4告訴全世界：我們不挑芯片，也能跑出世界一流的模型。

當(dāng)然，客觀地說，英偉達(dá)在訓(xùn)練階段的芯片上依然占據(jù)主導(dǎo)地位，尤其是在計(jì)算密集型的預(yù)訓(xùn)練環(huán)節(jié)。

但在推理階段，V4可能已經(jīng)實(shí)現(xiàn)了國(guó)產(chǎn)芯片的全面適配。

推理環(huán)節(jié)是大模型商業(yè)化落地最核心的一環(huán)，這一步的突破意義不可估量。

第三個(gè)關(guān)鍵詞：開源。

據(jù)知情人士透露，DeepSeek將在V4發(fā)布時(shí)同步放出一份簡(jiǎn)短的技術(shù)說明，并在大約一個(gè)月后發(fā)布一份更全面的技術(shù)報(bào)告。

這延續(xù)了DeepSeek一貫的「開放精神」。

去年R1發(fā)布時(shí)附帶的那份詳盡技術(shù)報(bào)告，曾讓全球AI研究者受益匪淺，被視為推理模型領(lǐng)域最重要的開源貢獻(xiàn)之一。

回顧R1

那一天，硅谷真的慌了

要理解V4的分量，必須先回看去年DeepSeek R1發(fā)布時(shí)的那場(chǎng)「地震」。

2025年1月20日，DeepSeek悄然上線了R1推理模型。

沒有發(fā)布會(huì)，沒有媒體吹風(fēng)會(huì)，沒有CEO站在臺(tái)上揮手致意——就是簡(jiǎn)簡(jiǎn)單單地把模型放了出來，附帶一份技術(shù)報(bào)告。

然后，全世界炸了。

R1在多項(xiàng)基準(zhǔn)測(cè)試上達(dá)到了與OpenAI最強(qiáng)模型o1相當(dāng)甚至超越的水平，而DeepSeek聲稱其訓(xùn)練成本僅為約560萬美元——這個(gè)數(shù)字不到GPT-4訓(xùn)練成本的十分之一。

更要命的是，R1是開源的！

2025年1月27日——這是一個(gè)將被載入AI史冊(cè)的日子，DeepSeek的手機(jī)App超越ChatGPT，成為蘋果App Store下載量第一的免費(fèi)應(yīng)用。

同一天，英偉達(dá)股價(jià)暴跌近17%，單日市值蒸發(fā)約5890億美元，創(chuàng)下美國(guó)股市單家公司歷史最大單日跌幅紀(jì)錄。

博通下跌超過17%，微軟下跌2.1%，整個(gè)納斯達(dá)克血流成河。

知名風(fēng)投家馬克·安德森稱DeepSeek為「我見過的最令人驚嘆和印象深刻的突破之一」。

多位美國(guó)科技界人士將其比作「斯普特尼克時(shí)刻」——1957年蘇聯(lián)先于美國(guó)將衛(wèi)星送入太空的那一刻，象征著中國(guó)AI實(shí)力的強(qiáng)勢(shì)崛起。

而華爾街投資人最恐懼的問題浮出水面：如果一家中國(guó)公司用十分之一的成本就能做出同等水平的模型，那美國(guó)科技巨頭每年砸下的數(shù)百億美元基礎(chǔ)設(shè)施投資，還值得嗎？

英偉達(dá)的高端GPU還會(huì)有那么大的需求嗎？

蟄伏一年，DeepSeek都干了什么？

R1之后，DeepSeek進(jìn)入了長(zhǎng)達(dá)一年多的「靜默模式」。

沒有新的旗艦?zāi)Ｐ停挥袧u進(jìn)式更新。

但這并不意味著他們無所作為——恰恰相反，DeepSeek一直在為V4鋪路。

來看看這份更新時(shí)間線：

2025年3月：DeepSeek-V3-0324發(fā)布。這是V3的一次重要升級(jí)，通過吸收R1的強(qiáng)化學(xué)習(xí)技術(shù)改進(jìn)了后訓(xùn)練流程，在數(shù)學(xué)和編程評(píng)測(cè)上甚至超過了GPT-4.5。
2025年5月：DeepSeek-R1-0528發(fā)布。R1的大幅升級(jí)版，推理能力顯著增強(qiáng)，代碼生成質(zhì)量提升，被認(rèn)為是開源推理模型的新標(biāo)桿。
2025年8月：DeepSeek-V3.1發(fā)布。這是一個(gè)里程碑式的更新——V3.1首次將V3和R1的能力融合到一個(gè)模型中，支持「思考模式」和「非思考模式」的自由切換，在SWE-bench等基準(zhǔn)上比前代提升超40%。此后更新至V3.1-Terminus版本，進(jìn)一步修復(fù)了多語言混合、Agent能力等問題。
2025年9月：DeepSeek-V3.2-Exp發(fā)布。引入了全新的稀疏注意力機(jī)制（DeepSeek Sparse Attention），為更長(zhǎng)上下文和更高效率的推理奠定了架構(gòu)基礎(chǔ)。
2025年11月：DeepSeekMath V2發(fā)布，基于V3.2-Exp-Base構(gòu)建，在多項(xiàng)數(shù)學(xué)競(jìng)賽中達(dá)到金牌水平，并驗(yàn)證了自驗(yàn)證（self-verification）技術(shù)的有效性。
2025年12月：DeepSeek-V3.2正式發(fā)布。V3.2-Speciale版本在2025年國(guó)際數(shù)學(xué)奧林匹克（IMO）和國(guó)際信息學(xué)奧林匹克（IOI）中取得金牌級(jí)表現(xiàn)，首次將思考能力整合到工具調(diào)用中。
2026年1月：DeepSeek先后發(fā)布了關(guān)于Manifold-Constrained Hyper-Connections（mHC）和Engram條件記憶技術(shù)的研究論文，被業(yè)界普遍視為V4的架構(gòu)基石。mHC改變了信息在模型層間的流動(dòng)方式，Engram則讓模型能夠選擇性地記憶和調(diào)用上下文信息，支持超過100萬token的上下文處理。

每一步，都在為V4的最終亮相做準(zhǔn)備。

一場(chǎng)精心策劃的輿論戰(zhàn)？

就在V4即將發(fā)布的節(jié)骨眼上，美國(guó)那邊也沒閑著。

2月24日，Anthropic在X上高調(diào)發(fā)帖，指控DeepSeek等3家對(duì)其Claude模型發(fā)動(dòng)了「工業(yè)級(jí)蒸餾攻擊」，聲稱這三家中國(guó)實(shí)驗(yàn)室創(chuàng)與Claude進(jìn)行了超過1600萬次對(duì)話，以此提取能力來訓(xùn)練自己的模型。

但諷刺的一幕緊隨其后。

就在Anthropic高調(diào)指責(zé)「蒸餾」的同一周，網(wǎng)友發(fā)現(xiàn)了一個(gè)令人瞠目的bug：當(dāng)你用中文問Claude「你是什么模型」時(shí)，它竟然回復(fù)：「我是DeepSeek V3。」

甚至通過Anthropic官方API測(cè)試，結(jié)果還是一樣。

用法語提問時(shí)，Claude則回答「我是ChatGPT」。

這一幕的戲劇性實(shí)在太強(qiáng)了。

你剛指控別人「蒸餾你」，轉(zhuǎn)頭自己的模型就在中文環(huán)境下認(rèn)了別人當(dāng)「爹」。

Anthropic那條推文下面6000多條評(píng)論，超過70%都在嘲諷。

Reddit上的討論更加一針見血。

有用戶總結(jié)道：這是一場(chǎng)有組織的FUD（恐懼、不確定性和懷疑）營(yíng)銷。

目的很明確——在V4發(fā)布前搶占敘事高地，預(yù)先埋下「他們只會(huì)作弊抄襲」的框架，無論V4表現(xiàn)多驚艷，公眾的第一反應(yīng)都會(huì)被引導(dǎo)到負(fù)面解讀上。

同時(shí)通過輿論手段稀釋V4發(fā)布的媒體關(guān)注度，防止美國(guó)科技股再次出現(xiàn)去年R1發(fā)布時(shí)那樣的兩位數(shù)暴跌。

美股再次顫抖？

去年R1發(fā)布時(shí)，英偉達(dá)單日跌去17%，5890億美元灰飛煙滅。

如今V4不僅在模型能力上更進(jìn)一步（多模態(tài)、百萬上下文、原生國(guó)產(chǎn)芯片適配），更在戰(zhàn)略層面發(fā)出了優(yōu)先適配國(guó)產(chǎn)芯片的明確信號(hào)。

如果V4發(fā)布后的基準(zhǔn)測(cè)試再次驗(yàn)證了DeepSeek的效率優(yōu)勢(shì)——用更少的計(jì)算資源達(dá)到世界一流水平——那華爾街的投資者勢(shì)必要再次面對(duì)那個(gè)令人不安的問題：AI基礎(chǔ)設(shè)施的天量投資，真的有必要嗎？

更值得關(guān)注的是，即便是競(jìng)爭(zhēng)對(duì)手陣營(yíng)的研究人員也在私下承認(rèn)，DeepSeek V4不可小視。

「可能發(fā)布就登頂開源第一」。

DeepSeek V4的發(fā)布，不會(huì)是一個(gè)平靜的事件。

從蠻力到結(jié)構(gòu)

中國(guó)AI的進(jìn)化之路

2023年7月成立，2024年12月發(fā)布V3，2025年1月R1震撼全球，一整年持續(xù)迭代打磨。

2026年3月V4攜多模態(tài)能力與國(guó)產(chǎn)芯片適配強(qiáng)勢(shì)回歸。

這條路徑揭示了一個(gè)深刻的趨勢(shì)：中國(guó)AI正在從依賴硬件蠻力走向依靠架構(gòu)創(chuàng)新和工程效率的道路。

美國(guó)的出口管制試圖用「卡脖子」的方式遏制中國(guó)AI的發(fā)展，但DeepSeek的存在本身就是對(duì)這種策略最有力的回應(yīng)。

當(dāng)你無法獲得最頂級(jí)的芯片時(shí)，被迫去思考更聰明的方法——更高效的訓(xùn)練策略、更精妙的架構(gòu)設(shè)計(jì)、更極致的資源優(yōu)化。

而這些創(chuàng)新一旦形成，價(jià)值遠(yuǎn)超任何一款芯片。

下周，我們拭目以待。

全世界都在看。

參考資料：

https://x.com/koltregaskes/status/2027675290735182007

https://www.ft.com/content/e3366881-0622-40a7-9c34-a0d82e3d573e

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.