網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

模型大戰(zhàn)紅包之后：DeepSeek上新，AI小龍們座次已變

2026-02-12 22:15:24　來(lái)源: 雷科技

廣東舉報(bào)

分享至

2026 年的馬年春節(jié)，AI 的火藥味甚至蓋過(guò)了紅包味。

字節(jié)、阿里、騰訊幾乎同時(shí)把 AI 大規(guī)模推向臺(tái)前：紅包、免單、春晚互動(dòng)、本地生活接入……都在爭(zhēng)入口。與此同時(shí)，BAT 三家也在基礎(chǔ)模型上連續(xù)出牌，視頻生成(Seedance 2.0)、圖像（Qwen-IMAGE-2.0)、多模態(tài)、語(yǔ)音模型密集更新，幾乎沒(méi)有空檔。

不過(guò)，基礎(chǔ)模型的對(duì)抗也從字節(jié)、阿里、騰訊等巨頭迅速蔓延到了 DeepSeek 和「AI 小龍」們。

2 月 11 日晚，DeepSeek 新模型版本全面上線(xiàn)，繼續(xù)把長(zhǎng)上下文與復(fù)雜任務(wù)能力往前推；幾乎同一時(shí)間，智譜推出新一代旗艦 GLM-5，強(qiáng)調(diào) Agent 與編程能力；MiniMax 也帶來(lái)了 MiniMax M2.5，延續(xù)多模態(tài)與應(yīng)用導(dǎo)向路線(xiàn)。

三家?guī)缀踉谕粫r(shí)間點(diǎn)出手，讓這場(chǎng)春節(jié) AI 大戰(zhàn)的「模型交鋒」又升級(jí)了一個(gè)檔位。

巨頭雙線(xiàn)推進(jìn)，既搶入口也搶模型；創(chuàng)業(yè)公司聚焦底層能力，把籌碼壓在基礎(chǔ)模型上。真正決定 2026 年甚至未來(lái)幾年的競(jìng)爭(zhēng)，正在這里展開(kāi)。

春節(jié) AI 大戰(zhàn)：前線(xiàn)發(fā)紅包，后端拼模型

2 月 12 日，阿里千問(wèn)宣布「春節(jié) 30 億大免單」上線(xiàn) 6 天完成 1.2 億筆 AI 下單，用戶(hù)說(shuō)了 41 億次。稍早前，騰訊元寶則宣布春節(jié)活動(dòng)啟動(dòng) 5 天，元寶 AI 生圖功能日均調(diào)用增長(zhǎng) 30 倍，時(shí)長(zhǎng)增長(zhǎng)超 80%。

圖片來(lái)源：千問(wèn)、元寶

如果說(shuō)今年春節(jié) AI 大戰(zhàn)前半段是純粹的入口之爭(zhēng)，后半段則是更為復(fù)雜，從巨頭到初創(chuàng)大模型公司，都在集中發(fā)力基礎(chǔ)模型的迭代。

這一點(diǎn)其實(shí)雷科技在之前的報(bào)道《一切為了Agent：千問(wèn)、階躍、Gemini打響「3.5模型大戰(zhàn)」，春節(jié)將成關(guān)鍵節(jié)點(diǎn)？》就有提到，包括：

- 海外的 GPT-5.3-Codex 和 Claude Opus 4.6；
- 國(guó)內(nèi)已經(jīng)發(fā)布的 Kimi 2.5、Step 3.5 Flash、SeedDance 2.0、Seedream 5.0；
- 剛剛發(fā)布的 GLM-5、MiniMax M2.5、DeepSeek V3 系列更新；
- 還有箭在弦上的 Doubao 2.0、Qwen 3.5、Gemin 3.5。

DeepSeek V4大招還沒(méi)發(fā)，把「長(zhǎng)上下文」做深是亮點(diǎn)

考慮到 DeepSeek 并沒(méi)有發(fā)布官方博文，這一次更新的 DeepSeek 新模型大概率不是 V4，而是 V3.2 系列的更新（或?yàn)?V3.5）。

不過(guò)這也可以看作 V4 發(fā)布前的「灰度版」，因?yàn)榘凑?The Information 的最新爆料，DeepSeek V4 內(nèi)部初步測(cè)試顯示，其在模型的編程能力了已經(jīng)超越了 Claude（沒(méi)有指出具體模型）。

而從網(wǎng)友們統(tǒng)一收到的 DeepSeek 回復(fù)來(lái)看，DeepSeek 新模型的變化集中在兩點(diǎn)：百萬(wàn)級(jí)長(zhǎng)上下文和知識(shí)庫(kù)更新。

首先是上下文窗口從之前的 128K 直接拉升到了 1M（100 萬(wàn) Token），你可以一次性把《三體》全集或者一整個(gè)項(xiàng)目的代碼倉(cāng)庫(kù)塞給它。測(cè)試顯示，它處理這類(lèi)長(zhǎng)文檔的響應(yīng)速度非常快，不再需要手動(dòng)拆分文件。

另外，DeepSeek 新模型的知識(shí)庫(kù)也更新到了 2025 年 5 月，但依然不支持多模態(tài)——無(wú)法理解圖片（文字內(nèi)容除外）和視頻，也符合 DeepSeek 一直堅(jiān)持的「語(yǔ)言模型」路線(xiàn)：

不追求炫目的多模態(tài)，而是把文本推理、工程任務(wù)這些高頻剛需做到極致。

而上下文長(zhǎng)度的大幅提升，不僅長(zhǎng)文檔處理與多輪推理能力更穩(wěn)定，理論上也會(huì)改善長(zhǎng)代碼理解、多步驟分析等復(fù)雜場(chǎng)景執(zhí)行表現(xiàn)。

時(shí)隔 1 個(gè)多月迭代，智譜 GLM-5 把 Agent 推到臺(tái)前

相比之下，GLM-5 作為原生 Agent 基座模型的升級(jí)更具「代際感」。雖然距離去年底發(fā)布 GLM-4.7 僅僅過(guò)去 1 個(gè)多月，但智譜年初上市時(shí)候預(yù)告的新一代模型，確實(shí)升級(jí)不小。

這一代模型的核心關(guān)鍵詞不再是對(duì)話(huà)，而是 Agent 與編程能力，也規(guī)格已經(jīng)明顯向「Agent 基礎(chǔ)模型」靠攏：上下文達(dá)到 200K 級(jí)別，最大輸出可達(dá) 128K，模型規(guī)模進(jìn)一步擴(kuò)大，訓(xùn)練體系也做了重構(gòu)。

但真正的變化還是發(fā)生在能力結(jié)構(gòu)上。

GLM-5.0 被直接設(shè)計(jì)為可執(zhí)行任務(wù)的 Agent 模型，強(qiáng)調(diào)編程能力、工具調(diào)用與長(zhǎng)流程執(zhí)行。在編程測(cè)試中，它已經(jīng)能處理項(xiàng)目級(jí)代碼與調(diào)試問(wèn)題，模型可以拆解需求、調(diào)用接口、持續(xù)執(zhí)行任務(wù)，并在多階段過(guò)程中保持目標(biāo)一致。

繼續(xù)押注多模態(tài)，MiniMax M2.5依然堅(jiān)持生產(chǎn)至上

MiniMax 從模型到應(yīng)用的垂直路線(xiàn)，依舊與前兩者拉開(kāi)距離。

MiniMax M2.5 的升級(jí)重點(diǎn)仍然放在多模態(tài)與內(nèi)容生成能力，但強(qiáng)調(diào)的一整套多模態(tài)能力的推進(jìn)，包括語(yǔ)音生成、音樂(lè)生成與文本能力同步提升，強(qiáng)調(diào)可直接進(jìn)入創(chuàng)作與產(chǎn)品流程。

模型繼續(xù)采用 MoE 架構(gòu)，在保持規(guī)模的同時(shí)控制推理成本，更適合部署在應(yīng)用側(cè)。語(yǔ)音克隆、情緒表達(dá)、音樂(lè)生成質(zhì)量的提升，使它更接近「生產(chǎn)工具」，而不是推理模型。

MiniMax 的定位因此也很清晰——不是去比誰(shuí)最聰明，而是更偏向讓模型在內(nèi)容生產(chǎn)環(huán)節(jié)真正可用，生成內(nèi)容、參與創(chuàng)作、進(jìn)入產(chǎn)品流程。

這條路徑也決定了 MiniMax 的目標(biāo)不是 benchmark，而是可落地的生產(chǎn)能力。

三家模型的路徑差異由此變得非常具體：DeepSeek 把長(zhǎng)推理能力做到極致，智譜把模型推向 Agent 工程形態(tài)，MiniMax 則把多模態(tài)生產(chǎn)能力做成基礎(chǔ)設(shè)施。它們不再?lài)@同一套指標(biāo)競(jìng)爭(zhēng)，而是在不同能力方向上構(gòu)建各自的模型形態(tài)。

但共性同樣明顯。參數(shù)規(guī)模不再是核心賣(mài)點(diǎn)，聊天體驗(yàn)也不再是主要目標(biāo)，所有升級(jí)都在指向一件事——模型要能參與真實(shí)任務(wù)，而不僅是給出答案。

DeepSeek 炸場(chǎng)一年后，「AI 小龍」位次已劇變

把時(shí)間撥回到去年春節(jié)，DeepSeek-V3 和 R1 的開(kāi)源發(fā)布，沖擊了全球 AI 格局，也成為「AI 小龍」陣營(yíng)的分水嶺。

關(guān)鍵不只是「模型很強(qiáng)」，更在于成本被重新定義。低成本、高性能的推理模型開(kāi)始出現(xiàn)后，行業(yè)對(duì)基礎(chǔ)模型的預(yù)期突然變了——不只是要求嚴(yán)格訓(xùn)練出一個(gè)模型，而是要求更低成本的更強(qiáng)模型。

劇烈的模型競(jìng)爭(zhēng)加速，再加之訓(xùn)練算力的匱乏，直接引發(fā)了「AI 小龍」陣營(yíng)的明顯分化。百川和零一幾乎已經(jīng)退出「前沿基礎(chǔ)模型」的主戰(zhàn)場(chǎng)：前者轉(zhuǎn)向醫(yī)療等垂直方向，后者更多走企業(yè)與行業(yè)場(chǎng)景路線(xiàn)，更新節(jié)奏明顯放緩。

當(dāng)基礎(chǔ)模型進(jìn)入高投入、高密度迭代階段，只有極少數(shù)團(tuán)隊(duì)還能長(zhǎng)期承受算力與研發(fā)壓力。

不過(guò)今年的情況又有些不一樣，最直接的一點(diǎn)就是 DeepSeek V4 至今沒(méi)有發(fā)布。從外部看，可能有兩種解釋。

一種是技術(shù)層面的現(xiàn)實(shí)：推理能力、長(zhǎng)上下文、工程穩(wěn)定性這些方向本身難度更高，模型要跨出一整代的差距，需要更長(zhǎng)周期，而且之前也傳出過(guò) DeepSeek 在訓(xùn)練過(guò)程遇到難題。另一種則是更偏策略性，不只是跟著友商一起發(fā)布，而是作為壓軸登場(chǎng)，形成宣發(fā)上的優(yōu)勢(shì)。

還有一個(gè)更容易被忽略的變化是：今年春節(jié)，DeepSeek 要面對(duì)字節(jié)、阿里、騰訊在模型上的高強(qiáng)度投入，以及全球模型的快速迭代，最直觀的例子就是最近引爆全球的字節(jié) Seedance 5.0 視頻模型。

Seedance 5.0 生成，圖片來(lái)源：bilibili

當(dāng)然，還在活躍的「AI 小龍」也在第一線(xiàn)持續(xù)推進(jìn)基礎(chǔ)模型的迭代，智譜 GLM 和階躍星辰 Step 更多還是集中在模型，面向行業(yè)提供更創(chuàng)新、更實(shí)用的基礎(chǔ)模型。

MiniMax 和月之暗面 Kimi 則更多主打「模型即應(yīng)用」，不只打造模型，也在發(fā)力自己的原生 AI 應(yīng)用，MiniMax 更是形成了一定的產(chǎn)品矩陣，但二者都在從基礎(chǔ)模型到應(yīng)用進(jìn)行垂直整合。

這不是簡(jiǎn)單的「誰(shuí)強(qiáng)誰(shuí)弱」，而是一種更現(xiàn)實(shí)的分化。

寫(xiě)在最后

2026 年的春節(jié)還沒(méi)正式開(kāi)始，但大模型下半場(chǎng)的發(fā)令槍已經(jīng)響得震耳欲聾。

從巨頭們的「撒幣」入口戰(zhàn)，到 DeepSeek、智譜、MiniMax 在初四晚上的模型突襲，這場(chǎng)仗的打法變了。大家不再執(zhí)著于在 Benchmark 上刷分，而是開(kāi)始比誰(shuí)能更深地嵌入真實(shí)生產(chǎn)力：是吞下百萬(wàn)行代碼的胃口，是自主跑通工程的雙手，還是理解人類(lèi)情緒的耳朵。

DeepSeek 這次雖然沒(méi)祭出傳說(shuō)中的 V4，但這記「1M 上下文」的長(zhǎng)拳，依然也讓不少空談 Agent 卻解決不了長(zhǎng)程記憶的對(duì)手感到脊背發(fā)涼。而智譜和 MiniMax 的如期對(duì)壘，則證明了「AI 小龍」們已經(jīng)從去年的防守反擊，轉(zhuǎn)向了更有底氣的差異化進(jìn)攻。

懸念依然存在。DeepSeek 憋了許久的 V4 究竟是在等一個(gè)「一力降十會(huì)」的壓軸時(shí)刻，還是在攻克某種未知的技術(shù)天花板？在大廠與小龍的混戰(zhàn)中，誰(shuí)能率先把「模型能力」真正轉(zhuǎn)化為「商業(yè)護(hù)城河」？

但有一點(diǎn)是肯定的：2026 年，單純靠「會(huì)聊天」已經(jīng)拿不到門(mén)票了。煙花散去，留在牌桌上的，只能是那些能真正卷入工作流的狠角色。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.