![]()
美團(tuán)殺入開(kāi)源大模型混戰(zhàn)
外賣的拼音“waimai”中有兩個(gè)“ai”,所以,大模型混戰(zhàn),“外賣一哥”沒(méi)有不跟的道理。
近日,美團(tuán)發(fā)布并開(kāi)源了首個(gè)混合專家(MoE)模型——LongCat-Flash(龍貓),一個(gè)擁有5600億參數(shù),還很便宜的模型。
![]()
圖源:LongCat
![]()
圖源:LongCat官網(wǎng)截圖
不過(guò),目前LongCat只有推出了聯(lián)網(wǎng)搜索生成功能,其“深度思考”按鈕為灰色,點(diǎn)擊后顯示“敬請(qǐng)期待”。鏈接放在這里,大家可以取用:https://longcat.ai
![]()
圖源:LongCat官網(wǎng)截圖
在價(jià)格上,美團(tuán)宣布,將推出“龍貓開(kāi)發(fā)者計(jì)劃”,為優(yōu)質(zhì)項(xiàng)目提供算力補(bǔ)貼。此外還將推出企業(yè)版API服務(wù),定價(jià)較市場(chǎng)平均水平低30%,野心很大,直指DeepSeek、阿里云等老玩家。
值得一提的是,在美團(tuán)官方的技術(shù)報(bào)告中,強(qiáng)調(diào)了LongCat-Flash是在一個(gè)包含數(shù)萬(wàn)個(gè)加速器(tens of thousands of accelerators)的大規(guī)模集群上完成訓(xùn)練的。“加速器”是一個(gè)籠統(tǒng)的概念,不單獨(dú)指代目前常用的GPU。
還有消息稱,LongCat-Flash的訓(xùn)練擺脫了英偉達(dá)GPU,那么則不排除是國(guó)產(chǎn)芯片,當(dāng)然,對(duì)此美團(tuán)方面并未做出回應(yīng)。
倘若美團(tuán)大模型同國(guó)產(chǎn)硬件供應(yīng)商合作屬實(shí),那么則是為近期熱議的“AI芯片國(guó)產(chǎn)替代”提供了關(guān)鍵驗(yàn)證。
接下來(lái),我們來(lái)看看這個(gè)LongCat-Flash。
首先,LongCat-Flash極具創(chuàng)新性的設(shè)計(jì)之一是“零計(jì)算”專家機(jī)制 (Zero-computation Experts)。
所謂“零計(jì)算”專家機(jī)制,就是通過(guò)動(dòng)態(tài)分配算力資源,將簡(jiǎn)單的token直接原樣輸出,僅對(duì)復(fù)雜token(如邏輯推理部分)調(diào)用完整算力,從而極大地節(jié)省算力。
![]()
圖源:微博
由此,龍貓可以實(shí)現(xiàn)計(jì)算效率與性能的雙重提升。相比同行其他模型,美團(tuán)大模型在訓(xùn)練和推理速度上優(yōu)勢(shì)明顯,能在 H800 上實(shí)現(xiàn)單用戶每秒 100+ tokens 的推理速度,理論上每token輸出時(shí)間相比DeepSeek-V3了降低近50%。
宋輝也用免費(fèi)版進(jìn)行了測(cè)試,速度確實(shí)快,堪比搜索引擎的程度,輸出指令后幾乎2秒內(nèi)立刻便給出了答案。鏈接放置在此,大家可以直接取用:https://longcat.ai
其次,是快捷連接架構(gòu)(ScMoE)在層與層間引入跨層捷徑,使稠密計(jì)算與專家并行通信完全重疊。實(shí)測(cè)中,該架構(gòu)使理論每token輸出時(shí)間縮短至0.01秒,較DeepSeek-V3降低了50%,達(dá)到每秒100token的業(yè)界頂尖水平。
最后,為了更詳細(xì)直觀地展現(xiàn)其性能,下面給出LongCat-Flash和主流大模型的對(duì)比。
值得注意的是,LongCat-Flash在ArenaHard-V2基準(zhǔn)測(cè)試中取得86.50的優(yōu)異成績(jī),位列所有評(píng)估模型中的第二名,超過(guò)了DeepSeek-V3.1。
編程能力方面,在TerminalBench(終端命令行任務(wù)基準(zhǔn))中,以39.51的得分位列第二,僅次于閉源的“編程之王”Claude4 Sonnet(40.7分)。
此外還有指令遵循方面,在IFEval中,LongCat-Flash力壓一眾對(duì)手,以89.65分的成績(jī)拿下了第一。
![]()
圖源:微博
綜上,從官方報(bào)告來(lái)看,LongCat-Flash-Chat性能的確比肩當(dāng)下領(lǐng)先的主流模型。
事實(shí)上,今年以來(lái),美團(tuán)在AI領(lǐng)域的發(fā)力十分明顯,先是連續(xù)發(fā)布AI Coding Agent工具NoCode,再是經(jīng)營(yíng)決策助手袋鼠參謀,再到酒店垂類AI Agent美團(tuán)既白等多款垂直場(chǎng)景應(yīng)用,如今又開(kāi)源了自研大模型。
看來(lái),“外賣一哥”美團(tuán)并不打算缺席業(yè)界這場(chǎng)AI混戰(zhàn)。
不過(guò),開(kāi)源模型消息發(fā)布后,美團(tuán)的股價(jià)沒(méi)有出現(xiàn)較大的波動(dòng),看來(lái)資本市場(chǎng)仍對(duì)這個(gè)外賣巨頭的大模型動(dòng)作持觀望態(tài)度。
![]()
AI,美團(tuán)必須要打的仗
值得玩味的是,幾天前美團(tuán)二季度財(cái)報(bào)剛出,利潤(rùn)虧損九成,外界一片嘩然。如此關(guān)頭,美團(tuán)選擇放出了大模型,很難不引發(fā)聯(lián)想。
根據(jù)財(cái)報(bào),美團(tuán)二季度的經(jīng)營(yíng)利潤(rùn)下滑至2.26億人民幣,同比大幅下降98%,經(jīng)營(yíng)利潤(rùn)率也由13.7%降至0.2%。
![]()
圖源:美團(tuán)
具體來(lái)看,受外賣競(jìng)爭(zhēng)影響,二季度核心本地商業(yè)分部經(jīng)營(yíng)利潤(rùn)僅為37億人民幣,同比下降75.6%。同時(shí),由于海外擴(kuò)張,新業(yè)務(wù)分部的經(jīng)營(yíng)虧損同比擴(kuò)大至19億人民幣。
此前,伴隨著京東、淘寶閃購(gòu)紛紛加入這場(chǎng)空前絕后的外賣市場(chǎng)爭(zhēng)奪戰(zhàn),各家紛紛玩起了“大額補(bǔ)貼”,從“15-15元”“18-18元”“25-20元”不等,在此期間,還出現(xiàn)了不少密集發(fā)券把系統(tǒng)干崩潰的現(xiàn)象。
![]()
圖源:美團(tuán)
玩得太大,終歸要降降溫。7月中旬三個(gè)平臺(tái)皆被相關(guān)部門(mén)約談,此后在發(fā)放消費(fèi)者“外賣券”上,都有所收斂。但對(duì)手沒(méi)有消失,戰(zhàn)還是要打的,補(bǔ)貼資源進(jìn)而轉(zhuǎn)向了商家和騎手,比如,美團(tuán)跟團(tuán)京東搞起了品質(zhì)外賣,推出“浣熊食堂”。
換言之,美團(tuán)想要捍衛(wèi)自己“外賣一哥”的地位,錢(qián)是不得不燒的。
當(dāng)然,眾所周知,“外賣市場(chǎng)”如今已然是存量市場(chǎng),爭(zhēng)破了頭最終也僅僅是“增收不增利”,那么,尋找新的業(yè)務(wù)突破口成了關(guān)鍵,AI大模型就是嘗試方向之一。
今年三月,王興首次披露了美團(tuán)AI戰(zhàn)略三層次,分別是“AI at Work、AI in Products、Building LLM”。
AI at Work意味著內(nèi)部工具全面智能化,將AI運(yùn)用到所有員工的日常工作和業(yè)務(wù)運(yùn)營(yíng)。
AI in Products指用AI升級(jí)現(xiàn)有的2B端(面向企業(yè))和2C端(面向消費(fèi)者)的產(chǎn)品和服務(wù),并且將推出全新的AI原生應(yīng)用(AI native products),更好地服務(wù)消費(fèi)者、商家、騎手和商業(yè)合作伙伴。
Building LLM則是投入數(shù)十億美元采購(gòu)GPU資源,自研基座模型,而目前開(kāi)源的大模型,便是Building LLM戰(zhàn)略的其中一環(huán)。
今年6月,美團(tuán)核心本地商業(yè)CEO王莆中還坦言:美團(tuán)每年在AI上投入超百億元,主要因?yàn)镚PU(圖形處理器)很貴。但是我們覺(jué)得這個(gè)投入是值得的。因?yàn)橹挥邪袮I的基礎(chǔ)設(shè)施包括大模型的研發(fā)投入進(jìn)行下去,才能讓美團(tuán)在過(guò)去十幾年在各行各業(yè)積累的大數(shù)據(jù)發(fā)揮新的價(jià)值,否則那些數(shù)據(jù)無(wú)法被鮮活地使用。
不久前發(fā)布的2025年二季度財(cái)報(bào)顯示,美團(tuán)研發(fā)投入達(dá)到 63 億元,同比增長(zhǎng) 17.2%,占營(yíng)收比例約 6.8%,用于加大 AI 和無(wú)人配送技術(shù)布局。
以上美團(tuán)在AI側(cè)的一系列動(dòng)作,可以用王興的一句話總結(jié):“AI將顛覆所有行業(yè),我們(美團(tuán))的策略是主動(dòng)進(jìn)攻而非被動(dòng)防御。”
話是這么說(shuō),從業(yè)務(wù)層面來(lái)看,美團(tuán)搞大模型顯然更偏向于“必須要做的選擇”。畢竟美團(tuán)核心業(yè)務(wù)涉及的物流、服務(wù)業(yè),都正在被AI深刻重塑,AI+本地生活也已經(jīng)被不少頭部企業(yè)盯上。此外王興押注的人形機(jī)器人,也離不開(kāi)大模型的底層邏輯。
此時(shí)不跟牌,要等何時(shí)跟?
作者 | 宋輝
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.