網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

王興一鳴驚人，美團(tuán)大模型突然發(fā)布，速度是DeepSeek的1.5倍

2025-09-03 15:17:40　來(lái)源: 科技頭版Pro

廣東舉報(bào)

分享至

美團(tuán)殺入開(kāi)源大模型混戰(zhàn)

外賣的拼音“waimai”中有兩個(gè)“ai”，所以，大模型混戰(zhàn)，“外賣一哥”沒(méi)有不跟的道理。

近日，美團(tuán)發(fā)布并開(kāi)源了首個(gè)混合專家（MoE）模型——LongCat-Flash（龍貓），一個(gè)擁有5600億參數(shù)，還很便宜的模型。

圖源：LongCat

圖源：LongCat官網(wǎng)截圖

不過(guò)，目前LongCat只有推出了聯(lián)網(wǎng)搜索生成功能，其“深度思考”按鈕為灰色，點(diǎn)擊后顯示“敬請(qǐng)期待”。鏈接放在這里，大家可以取用：https://longcat.ai

圖源：LongCat官網(wǎng)截圖

在價(jià)格上，美團(tuán)宣布，將推出“龍貓開(kāi)發(fā)者計(jì)劃”，為優(yōu)質(zhì)項(xiàng)目提供算力補(bǔ)貼。此外還將推出企業(yè)版API服務(wù)，定價(jià)較市場(chǎng)平均水平低30%，野心很大，直指DeepSeek、阿里云等老玩家。

值得一提的是，在美團(tuán)官方的技術(shù)報(bào)告中，強(qiáng)調(diào)了LongCat-Flash是在一個(gè)包含數(shù)萬(wàn)個(gè)加速器（tens of thousands of accelerators）的大規(guī)模集群上完成訓(xùn)練的。“加速器”是一個(gè)籠統(tǒng)的概念，不單獨(dú)指代目前常用的GPU。

還有消息稱，LongCat-Flash的訓(xùn)練擺脫了英偉達(dá)GPU，那么則不排除是國(guó)產(chǎn)芯片，當(dāng)然，對(duì)此美團(tuán)方面并未做出回應(yīng)。

倘若美團(tuán)大模型同國(guó)產(chǎn)硬件供應(yīng)商合作屬實(shí)，那么則是為近期熱議的“AI芯片國(guó)產(chǎn)替代”提供了關(guān)鍵驗(yàn)證。

接下來(lái)，我們來(lái)看看這個(gè)LongCat-Flash。

首先，LongCat-Flash極具創(chuàng)新性的設(shè)計(jì)之一是“零計(jì)算”專家機(jī)制 (Zero-computation Experts)。

所謂“零計(jì)算”專家機(jī)制，就是通過(guò)動(dòng)態(tài)分配算力資源，將簡(jiǎn)單的token直接原樣輸出，僅對(duì)復(fù)雜token（如邏輯推理部分）調(diào)用完整算力，從而極大地節(jié)省算力。

圖源：微博

由此，龍貓可以實(shí)現(xiàn)計(jì)算效率與性能的雙重提升。相比同行其他模型，美團(tuán)大模型在訓(xùn)練和推理速度上優(yōu)勢(shì)明顯，能在 H800 上實(shí)現(xiàn)單用戶每秒 100+ tokens 的推理速度，理論上每token輸出時(shí)間相比DeepSeek-V3了降低近50%。

宋輝也用免費(fèi)版進(jìn)行了測(cè)試，速度確實(shí)快，堪比搜索引擎的程度，輸出指令后幾乎2秒內(nèi)立刻便給出了答案。鏈接放置在此，大家可以直接取用：https://longcat.ai

其次，是快捷連接架構(gòu)（ScMoE）在層與層間引入跨層捷徑，使稠密計(jì)算與專家并行通信完全重疊。實(shí)測(cè)中，該架構(gòu)使理論每token輸出時(shí)間縮短至0.01秒，較DeepSeek-V3降低了50%，達(dá)到每秒100token的業(yè)界頂尖水平。

最后，為了更詳細(xì)直觀地展現(xiàn)其性能，下面給出LongCat-Flash和主流大模型的對(duì)比。

值得注意的是，LongCat-Flash在ArenaHard-V2基準(zhǔn)測(cè)試中取得86.50的優(yōu)異成績(jī)，位列所有評(píng)估模型中的第二名，超過(guò)了DeepSeek-V3.1。

編程能力方面，在TerminalBench（終端命令行任務(wù)基準(zhǔn)）中，以39.51的得分位列第二，僅次于閉源的“編程之王”Claude4 Sonnet（40.7分）。

此外還有指令遵循方面，在IFEval中，LongCat-Flash力壓一眾對(duì)手，以89.65分的成績(jī)拿下了第一。

圖源：微博

綜上，從官方報(bào)告來(lái)看，LongCat-Flash-Chat性能的確比肩當(dāng)下領(lǐng)先的主流模型。

事實(shí)上，今年以來(lái)，美團(tuán)在AI領(lǐng)域的發(fā)力十分明顯，先是連續(xù)發(fā)布AI Coding Agent工具NoCode，再是經(jīng)營(yíng)決策助手袋鼠參謀，再到酒店垂類AI Agent美團(tuán)既白等多款垂直場(chǎng)景應(yīng)用，如今又開(kāi)源了自研大模型。

看來(lái)，“外賣一哥”美團(tuán)并不打算缺席業(yè)界這場(chǎng)AI混戰(zhàn)。

不過(guò)，開(kāi)源模型消息發(fā)布后，美團(tuán)的股價(jià)沒(méi)有出現(xiàn)較大的波動(dòng)，看來(lái)資本市場(chǎng)仍對(duì)這個(gè)外賣巨頭的大模型動(dòng)作持觀望態(tài)度。

AI，美團(tuán)必須要打的仗

值得玩味的是，幾天前美團(tuán)二季度財(cái)報(bào)剛出，利潤(rùn)虧損九成，外界一片嘩然。如此關(guān)頭，美團(tuán)選擇放出了大模型，很難不引發(fā)聯(lián)想。

根據(jù)財(cái)報(bào)，美團(tuán)二季度的經(jīng)營(yíng)利潤(rùn)下滑至2.26億人民幣，同比大幅下降98%，經(jīng)營(yíng)利潤(rùn)率也由13.7%降至0.2%。

圖源：美團(tuán)

具體來(lái)看，受外賣競(jìng)爭(zhēng)影響，二季度核心本地商業(yè)分部經(jīng)營(yíng)利潤(rùn)僅為37億人民幣，同比下降75.6%。同時(shí)，由于海外擴(kuò)張，新業(yè)務(wù)分部的經(jīng)營(yíng)虧損同比擴(kuò)大至19億人民幣。

此前，伴隨著京東、淘寶閃購(gòu)紛紛加入這場(chǎng)空前絕后的外賣市場(chǎng)爭(zhēng)奪戰(zhàn)，各家紛紛玩起了“大額補(bǔ)貼”，從“15-15元”“18-18元”“25-20元”不等，在此期間，還出現(xiàn)了不少密集發(fā)券把系統(tǒng)干崩潰的現(xiàn)象。

圖源：美團(tuán)

玩得太大，終歸要降降溫。7月中旬三個(gè)平臺(tái)皆被相關(guān)部門(mén)約談，此后在發(fā)放消費(fèi)者“外賣券”上，都有所收斂。但對(duì)手沒(méi)有消失，戰(zhàn)還是要打的，補(bǔ)貼資源進(jìn)而轉(zhuǎn)向了商家和騎手，比如，美團(tuán)跟團(tuán)京東搞起了品質(zhì)外賣，推出“浣熊食堂”。

換言之，美團(tuán)想要捍衛(wèi)自己“外賣一哥”的地位，錢(qián)是不得不燒的。

當(dāng)然，眾所周知，“外賣市場(chǎng)”如今已然是存量市場(chǎng)，爭(zhēng)破了頭最終也僅僅是“增收不增利”，那么，尋找新的業(yè)務(wù)突破口成了關(guān)鍵，AI大模型就是嘗試方向之一。

今年三月，王興首次披露了美團(tuán)AI戰(zhàn)略三層次，分別是“AI at Work、AI in Products、Building LLM”。

AI at Work意味著內(nèi)部工具全面智能化，將AI運(yùn)用到所有員工的日常工作和業(yè)務(wù)運(yùn)營(yíng)。

AI in Products指用AI升級(jí)現(xiàn)有的2B端（面向企業(yè)）和2C端（面向消費(fèi)者）的產(chǎn)品和服務(wù)，并且將推出全新的AI原生應(yīng)用（AI native products），更好地服務(wù)消費(fèi)者、商家、騎手和商業(yè)合作伙伴。

Building LLM則是投入數(shù)十億美元采購(gòu)GPU資源，自研基座模型，而目前開(kāi)源的大模型，便是Building LLM戰(zhàn)略的其中一環(huán)。

今年6月，美團(tuán)核心本地商業(yè)CEO王莆中還坦言：美團(tuán)每年在AI上投入超百億元，主要因?yàn)镚PU（圖形處理器）很貴。但是我們覺(jué)得這個(gè)投入是值得的。因?yàn)橹挥邪袮I的基礎(chǔ)設(shè)施包括大模型的研發(fā)投入進(jìn)行下去，才能讓美團(tuán)在過(guò)去十幾年在各行各業(yè)積累的大數(shù)據(jù)發(fā)揮新的價(jià)值，否則那些數(shù)據(jù)無(wú)法被鮮活地使用。

不久前發(fā)布的2025年二季度財(cái)報(bào)顯示，美團(tuán)研發(fā)投入達(dá)到 63 億元，同比增長(zhǎng) 17.2%，占營(yíng)收比例約 6.8%，用于加大 AI 和無(wú)人配送技術(shù)布局。

以上美團(tuán)在AI側(cè)的一系列動(dòng)作，可以用王興的一句話總結(jié)：“AI將顛覆所有行業(yè)，我們（美團(tuán)）的策略是主動(dòng)進(jìn)攻而非被動(dòng)防御。”

話是這么說(shuō)，從業(yè)務(wù)層面來(lái)看，美團(tuán)搞大模型顯然更偏向于“必須要做的選擇”。畢竟美團(tuán)核心業(yè)務(wù)涉及的物流、服務(wù)業(yè)，都正在被AI深刻重塑，AI+本地生活也已經(jīng)被不少頭部企業(yè)盯上。此外王興押注的人形機(jī)器人，也離不開(kāi)大模型的底層邏輯。

此時(shí)不跟牌，要等何時(shí)跟？

作者 | 宋輝

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.