![]()
2026 年的馬年春節(jié),AI 的火藥味甚至蓋過(guò)了紅包味。
字節(jié)、阿里、騰訊幾乎同時(shí)把 AI 大規(guī)模推向臺(tái)前:紅包、免單、春晚互動(dòng)、本地生活接入……都在爭(zhēng)入口。與此同時(shí),BAT 三家也在基礎(chǔ)模型上連續(xù)出牌,視頻生成(Seedance 2.0)、圖像(Qwen-IMAGE-2.0)、多模態(tài)、語(yǔ)音模型密集更新,幾乎沒(méi)有空檔。
不過(guò),基礎(chǔ)模型的對(duì)抗也從字節(jié)、阿里、騰訊等巨頭迅速蔓延到了 DeepSeek 和「AI 小龍」們。
2 月 11 日晚,DeepSeek 新模型版本全面上線(xiàn),繼續(xù)把長(zhǎng)上下文與復(fù)雜任務(wù)能力往前推;幾乎同一時(shí)間,智譜推出新一代旗艦 GLM-5,強(qiáng)調(diào) Agent 與編程能力;MiniMax 也帶來(lái)了 MiniMax M2.5,延續(xù)多模態(tài)與應(yīng)用導(dǎo)向路線(xiàn)。
三家?guī)缀踉谕粫r(shí)間點(diǎn)出手,讓這場(chǎng)春節(jié) AI 大戰(zhàn)的「模型交鋒」又升級(jí)了一個(gè)檔位。
巨頭雙線(xiàn)推進(jìn),既搶入口也搶模型;創(chuàng)業(yè)公司聚焦底層能力,把籌碼壓在基礎(chǔ)模型上。真正決定 2026 年甚至未來(lái)幾年的競(jìng)爭(zhēng),正在這里展開(kāi)。
春節(jié) AI 大戰(zhàn):前線(xiàn)發(fā)紅包,后端拼模型
2 月 12 日,阿里千問(wèn)宣布「春節(jié) 30 億大免單」上線(xiàn) 6 天完成 1.2 億筆 AI 下單,用戶(hù)說(shuō)了 41 億次。稍早前,騰訊元寶則宣布春節(jié)活動(dòng)啟動(dòng) 5 天,元寶 AI 生圖功能日均調(diào)用增長(zhǎng) 30 倍,時(shí)長(zhǎng)增長(zhǎng)超 80%。
![]()
圖片來(lái)源:千問(wèn)、元寶
如果說(shuō)今年春節(jié) AI 大戰(zhàn)前半段是純粹的入口之爭(zhēng),后半段則是更為復(fù)雜,從巨頭到初創(chuàng)大模型公司,都在集中發(fā)力基礎(chǔ)模型的迭代。
這一點(diǎn)其實(shí)雷科技在之前的報(bào)道《一切為了Agent:千問(wèn)、階躍、Gemini打響「3.5模型大戰(zhàn)」,春節(jié)將成關(guān)鍵節(jié)點(diǎn)?》就有提到,包括:
- 海外的 GPT-5.3-Codex 和 Claude Opus 4.6;
- 國(guó)內(nèi)已經(jīng)發(fā)布的 Kimi 2.5、Step 3.5 Flash、SeedDance 2.0、Seedream 5.0;
- 剛剛發(fā)布的 GLM-5、MiniMax M2.5、DeepSeek V3 系列更新;
- 還有箭在弦上的 Doubao 2.0、Qwen 3.5、Gemin 3.5。
DeepSeek V4大招還沒(méi)發(fā),把「長(zhǎng)上下文」做深是亮點(diǎn)
考慮到 DeepSeek 并沒(méi)有發(fā)布官方博文,這一次更新的 DeepSeek 新模型大概率不是 V4,而是 V3.2 系列的更新(或?yàn)?V3.5)。
不過(guò)這也可以看作 V4 發(fā)布前的「灰度版」,因?yàn)榘凑?The Information 的最新爆料,DeepSeek V4 內(nèi)部初步測(cè)試顯示,其在模型的編程能力了已經(jīng)超越了 Claude(沒(méi)有指出具體模型)。
而從網(wǎng)友們統(tǒng)一收到的 DeepSeek 回復(fù)來(lái)看,DeepSeek 新模型的變化集中在兩點(diǎn):百萬(wàn)級(jí)長(zhǎng)上下文和知識(shí)庫(kù)更新。
![]()
首先是上下文窗口從之前的 128K 直接拉升到了 1M(100 萬(wàn) Token),你可以一次性把《三體》全集或者一整個(gè)項(xiàng)目的代碼倉(cāng)庫(kù)塞給它。測(cè)試顯示,它處理這類(lèi)長(zhǎng)文檔的響應(yīng)速度非常快,不再需要手動(dòng)拆分文件。
另外,DeepSeek 新模型的知識(shí)庫(kù)也更新到了 2025 年 5 月,但依然不支持多模態(tài)——無(wú)法理解圖片(文字內(nèi)容除外)和視頻,也符合 DeepSeek 一直堅(jiān)持的「語(yǔ)言模型」路線(xiàn):
不追求炫目的多模態(tài),而是把文本推理、工程任務(wù)這些高頻剛需做到極致。
而上下文長(zhǎng)度的大幅提升,不僅長(zhǎng)文檔處理與多輪推理能力更穩(wěn)定,理論上也會(huì)改善長(zhǎng)代碼理解、多步驟分析等復(fù)雜場(chǎng)景執(zhí)行表現(xiàn)。
時(shí)隔 1 個(gè)多月迭代,智譜 GLM-5 把 Agent 推到臺(tái)前
![]()
相比之下,GLM-5 作為原生 Agent 基座模型的升級(jí)更具「代際感」。雖然距離去年底發(fā)布 GLM-4.7 僅僅過(guò)去 1 個(gè)多月,但智譜年初上市時(shí)候預(yù)告的新一代模型,確實(shí)升級(jí)不小。
這一代模型的核心關(guān)鍵詞不再是對(duì)話(huà),而是 Agent 與編程能力,也規(guī)格已經(jīng)明顯向「Agent 基礎(chǔ)模型」靠攏:上下文達(dá)到 200K 級(jí)別,最大輸出可達(dá) 128K,模型規(guī)模進(jìn)一步擴(kuò)大,訓(xùn)練體系也做了重構(gòu)。
但真正的變化還是發(fā)生在能力結(jié)構(gòu)上。
GLM-5.0 被直接設(shè)計(jì)為可執(zhí)行任務(wù)的 Agent 模型,強(qiáng)調(diào)編程能力、工具調(diào)用與長(zhǎng)流程執(zhí)行。在編程測(cè)試中,它已經(jīng)能處理項(xiàng)目級(jí)代碼與調(diào)試問(wèn)題,模型可以拆解需求、調(diào)用接口、持續(xù)執(zhí)行任務(wù),并在多階段過(guò)程中保持目標(biāo)一致。
繼續(xù)押注多模態(tài),MiniMax M2.5依然堅(jiān)持生產(chǎn)至上
![]()
MiniMax 從模型到應(yīng)用的垂直路線(xiàn),依舊與前兩者拉開(kāi)距離。
MiniMax M2.5 的升級(jí)重點(diǎn)仍然放在多模態(tài)與內(nèi)容生成能力,但強(qiáng)調(diào)的一整套多模態(tài)能力的推進(jìn),包括語(yǔ)音生成、音樂(lè)生成與文本能力同步提升,強(qiáng)調(diào)可直接進(jìn)入創(chuàng)作與產(chǎn)品流程。
模型繼續(xù)采用 MoE 架構(gòu),在保持規(guī)模的同時(shí)控制推理成本,更適合部署在應(yīng)用側(cè)。語(yǔ)音克隆、情緒表達(dá)、音樂(lè)生成質(zhì)量的提升,使它更接近「生產(chǎn)工具」,而不是推理模型。
MiniMax 的定位因此也很清晰——不是去比誰(shuí)最聰明,而是更偏向讓模型在內(nèi)容生產(chǎn)環(huán)節(jié)真正可用,生成內(nèi)容、參與創(chuàng)作、進(jìn)入產(chǎn)品流程。
這條路徑也決定了 MiniMax 的目標(biāo)不是 benchmark,而是可落地的生產(chǎn)能力。
三家模型的路徑差異由此變得非常具體:DeepSeek 把長(zhǎng)推理能力做到極致,智譜把模型推向 Agent 工程形態(tài),MiniMax 則把多模態(tài)生產(chǎn)能力做成基礎(chǔ)設(shè)施。它們不再?lài)@同一套指標(biāo)競(jìng)爭(zhēng),而是在不同能力方向上構(gòu)建各自的模型形態(tài)。
但共性同樣明顯。參數(shù)規(guī)模不再是核心賣(mài)點(diǎn),聊天體驗(yàn)也不再是主要目標(biāo),所有升級(jí)都在指向一件事——模型要能參與真實(shí)任務(wù),而不僅是給出答案。
DeepSeek 炸場(chǎng)一年后,「AI 小龍」位次已劇變
把時(shí)間撥回到去年春節(jié),DeepSeek-V3 和 R1 的開(kāi)源發(fā)布,沖擊了全球 AI 格局,也成為「AI 小龍」陣營(yíng)的分水嶺。
關(guān)鍵不只是「模型很強(qiáng)」,更在于成本被重新定義。低成本、高性能的推理模型開(kāi)始出現(xiàn)后,行業(yè)對(duì)基礎(chǔ)模型的預(yù)期突然變了——不只是要求嚴(yán)格訓(xùn)練出一個(gè)模型,而是要求更低成本的更強(qiáng)模型。
![]()
劇烈的模型競(jìng)爭(zhēng)加速,再加之訓(xùn)練算力的匱乏,直接引發(fā)了「AI 小龍」陣營(yíng)的明顯分化。百川和零一幾乎已經(jīng)退出「前沿基礎(chǔ)模型」的主戰(zhàn)場(chǎng):前者轉(zhuǎn)向醫(yī)療等垂直方向,后者更多走企業(yè)與行業(yè)場(chǎng)景路線(xiàn),更新節(jié)奏明顯放緩。
當(dāng)基礎(chǔ)模型進(jìn)入高投入、高密度迭代階段,只有極少數(shù)團(tuán)隊(duì)還能長(zhǎng)期承受算力與研發(fā)壓力。
不過(guò)今年的情況又有些不一樣,最直接的一點(diǎn)就是 DeepSeek V4 至今沒(méi)有發(fā)布。從外部看,可能有兩種解釋。
一種是技術(shù)層面的現(xiàn)實(shí):推理能力、長(zhǎng)上下文、工程穩(wěn)定性這些方向本身難度更高,模型要跨出一整代的差距,需要更長(zhǎng)周期,而且之前也傳出過(guò) DeepSeek 在訓(xùn)練過(guò)程遇到難題。另一種則是更偏策略性,不只是跟著友商一起發(fā)布,而是作為壓軸登場(chǎng),形成宣發(fā)上的優(yōu)勢(shì)。
還有一個(gè)更容易被忽略的變化是:今年春節(jié),DeepSeek 要面對(duì)字節(jié)、阿里、騰訊在模型上的高強(qiáng)度投入,以及全球模型的快速迭代,最直觀的例子就是最近引爆全球的字節(jié) Seedance 5.0 視頻模型。

Seedance 5.0 生成,圖片來(lái)源:bilibili
當(dāng)然,還在活躍的「AI 小龍」也在第一線(xiàn)持續(xù)推進(jìn)基礎(chǔ)模型的迭代,智譜 GLM 和階躍星辰 Step 更多還是集中在模型,面向行業(yè)提供更創(chuàng)新、更實(shí)用的基礎(chǔ)模型。
MiniMax 和月之暗面 Kimi 則更多主打「模型即應(yīng)用」,不只打造模型,也在發(fā)力自己的原生 AI 應(yīng)用,MiniMax 更是形成了一定的產(chǎn)品矩陣,但二者都在從基礎(chǔ)模型到應(yīng)用進(jìn)行垂直整合。
這不是簡(jiǎn)單的「誰(shuí)強(qiáng)誰(shuí)弱」,而是一種更現(xiàn)實(shí)的分化。
寫(xiě)在最后
2026 年的春節(jié)還沒(méi)正式開(kāi)始,但大模型下半場(chǎng)的發(fā)令槍已經(jīng)響得震耳欲聾。
從巨頭們的「撒幣」入口戰(zhàn),到 DeepSeek、智譜、MiniMax 在初四晚上的模型突襲,這場(chǎng)仗的打法變了。大家不再執(zhí)著于在 Benchmark 上刷分,而是開(kāi)始比誰(shuí)能更深地嵌入真實(shí)生產(chǎn)力:是吞下百萬(wàn)行代碼的胃口,是自主跑通工程的雙手,還是理解人類(lèi)情緒的耳朵。
DeepSeek 這次雖然沒(méi)祭出傳說(shuō)中的 V4,但這記「1M 上下文」的長(zhǎng)拳,依然也讓不少空談 Agent 卻解決不了長(zhǎng)程記憶的對(duì)手感到脊背發(fā)涼。而智譜和 MiniMax 的如期對(duì)壘,則證明了「AI 小龍」們已經(jīng)從去年的防守反擊,轉(zhuǎn)向了更有底氣的差異化進(jìn)攻。
懸念依然存在。DeepSeek 憋了許久的 V4 究竟是在等一個(gè)「一力降十會(huì)」的壓軸時(shí)刻,還是在攻克某種未知的技術(shù)天花板?在大廠與小龍的混戰(zhàn)中,誰(shuí)能率先把「模型能力」真正轉(zhuǎn)化為「商業(yè)護(hù)城河」?
但有一點(diǎn)是肯定的:2026 年,單純靠「會(huì)聊天」已經(jīng)拿不到門(mén)票了。煙花散去,留在牌桌上的,只能是那些能真正卷入工作流的狠角色。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.