起猛了,美團這下真的開始明牌干AI了。
![]()
居然,發布并直接開源了560B參數的MoE模型LongCat-Flash-Chat。
好家伙,WAIMAI里有兩個AI,這次成真的了,美團真發大模型了。
開源地址:https://github.com/meituan-longcat/LongCat-Flash-Chat
也有線上體驗地址:https://longcat.ai
我自己去體驗了一下,整體模型能力,中規中矩,但是快,是真的快,能把560B的模型,在推理的時候搞得這么快,是真的有點牛逼的。
我直接錄了個屏給大家看一下。
這里我們可以直觀對比一下LongCat和DeepSeek V3的輸出速度,API其實更好,但是這里就直接用的網頁版了,更C端用戶一些,能直觀的看到效果,他兩也都是MoE,而且參數量差不太多。
為了更公平的競爭,用了同一個問題,并關閉了聯網搜索來避免搜索干擾。
先來看DeepSeek。
DeepSeek每次還是需要原地轉圈圈思考一會兒,然后才一個一個的往外吐字,挺急的。
耗時整整33秒。
再來看LongCat,這刷新率不用多說了吧。
像機關槍一樣噠噠噠的五六秒就輸出完了。
這是LongCat和DeepSeek的另一個case,DeepSeek思考的功夫,LongCat答案快寫完了。
非常直觀的對比。。。
我又測了一下寫作和代碼。
先是做了一個新的小游戲,彈射線游戲,核心玩法是操作小球來躲避不同方向,不同速度的避彈射線,存活時間越長分數越高。
整體還行,這UI以及彈射線的設計還是很有藝術感,碰壁反彈也遵循了正確的物理規律,甚至在碰撞時會迸發好看的火花。
然后,我讓LongCat寫了篇小說。
![]()
全文比較長,我把完整版貼在這里,大家可以看看。
![]()
![]()
![]()
我還挺喜歡它寫的那句話的:在宇宙的尺度下,孤獨是一種常態。
我還讓它寫了一個北京美食地圖。
![]()
不愧是美食世家出身的大模型,寫的很細。
![]()
但是,我覺得最有趣的東西,其實是他們技術報告里的。
Agent能力。
很多人都在說 LongCat快,確實,它的速度極快,但是,他們的Agent能力,也極強。
![]()
直接登頂了。
我自己一直在說,AI現在很多時候,離我們普通大眾太遠了。
大家都在卷生產力,卷寫報告,卷做PPT,卷科研,這些東西當然很重要,但,它離我們真實的生活,總感覺還隔著一層。
大家都生產屬性了。
但是美團做一個Agent能力如此之高的并且超級快的大模型,我個人覺得,他目標就是為了服務自己的業務去的。
為了服務所有C端用戶的生活場景。
有些事,你得連起來看。
不知道有些人知不知道,你在美團點開搜索框,現在是有AI模式的搜索的。
![]()
它跟你傳統的搜索完全不一樣。
你不再需要去想“火鍋”、“烤肉”這種關鍵詞。
你可以直接跟它說人話,比如:“我想找個適合哥們兒幾個喝酒擼串、人均一百左右、離我最近、現在還開著的燒烤店。”
![]()
你看,它會立刻理解你這個復雜的需求,然后把最符合條件的店鋪,直接推給你。
而且,前段時間,他們也開始內測一個對我們社恐人士非常非常有用的新功能。
AI幫訂座。
你找到一家想去的餐廳,點一下那個“AI幫你訂”的按鈕,然后輸入你的需求,比如“今晚7點,4個人,要個靠窗的座”。然后,就沒你事了。
![]()
美團的AI,會自己打電話給餐廳的前臺。你沒看錯,是真的打電話,點開溝通明細,就能看到它跟前臺是怎么說的。
真的會用一個聽起來幾乎和真人一模一樣的聲音,去跟前臺溝通,幫你預定。
![]()
還有美團里的AI開發票,也是一個邏輯。
你點完外賣,不再需要跟商家打電話,直接讓AI去幫你搞定。
![]()
這些,所有這些已經在美團上落地、或者正在內測的AI功能,它們有一個共同的特點:
全都是為了C端用戶,為了生活場景,為了解決我們這些普通人,在日常生活中那些最具體、最瑣碎的痛點而服務的。
這一切的布局,感覺都像是一塊塊拼圖,正在拼出一個巨大的、清晰的圖景。而這個圖景的目標,就叫:
通用生活Agent。
放眼整個國內,好像確實也沒有比美團更適合來做這個產品的公司了。
AI最缺的是什么?場景和數據。
OpenAI做Agent,它很牛逼,但它能幫你訂一張從北京到上海的、下周二的、靠窗的高鐵票嗎?它能幫你找到你家樓下那家新開的、評價最好的蘭州拉面嗎?
它不能,因為它沒有這個數據,更沒有打通上下游的交易系統。
但這玩意,美團可太擅長了。
它的背后,是全國幾百萬家真實商戶的實時菜單、庫存、營業時間。是幾億C端用戶每天產生的真實交易、真實評價。是幾百萬外賣小哥每天在城市里穿梭,構成的最鮮活的、動態的物理世界數據。
換句話說,別人是拿AI,辛辛苦苦地去找應用場景。而美團,是用無數個真實的應用場景,反過來,去養它的AI。
這是一個正向的、可以無限循環的飛輪。用戶在美團上用AI的次數越多,它的AI就越懂你的需求,推薦就越精準,服務就越貼心。而服務越好,你就越離不開它。
現在,我們再回頭看美團發布的那個560B參數的MoE模型,LongCat。
你就能瞬間明白,這個特點就是快和Agent能力的模型,背后的深意。
為什么要把它做得那么快?
因為生活場景的交互,是即時的。你點外賣,你訂酒店,你打車,你不能等。
古典的交互設計師可能都知道,你設計產品交互時,最接受不了的,就是產品的卡頓和延遲。
一秒鐘的延遲,都可能讓用戶直接關掉App或者放棄這個功能,快,是C端產品能夠被用戶接受的生命線。
只有足夠快,用戶才不用等。
而模型為什么突出Agent能力?
因為生活服務,本質上,就是一連串復雜任務的組合。
訂一頓餐,背后需要理解你的口味、預算、位置,然后調用餐廳信息,規劃外賣路線,最后完成支付。
訂一張票,背后需要理解你的時間、目的地、偏好,然后調用票務系統,完成預定。
這些,都不是簡單的知識問答,這全都是需要理解、規劃、調用工具、執行任務才能完成的Agent行為。
還有一點,就是便宜。
LongCat的輸出成本5元/百萬 token。換句話說,它不希望用戶花幾百塊的成本全網比價,而是只做幾塊錢的生意。
所以,當你把所有的點練成線,就可以看到,美團幾乎就是在明示天下:
我們做大模型,從第一天起,瞄準的就是ToC的通用生活Agent,而不是所謂的,知識問答。
所以啊。
我覺得,別小看一個做本地生活起家的公司,更別小瞧那個每天給你送外賣的平臺。
它可能,比任何人都更懂,人類真實的需求和期待。
它不是要帶我們去火星,也不是劍指AGI。
它是要讓我們,在這個地球上。
活得。
更像一個被照顧得無微不至的人。
以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。
>/ 作者:卡茲克、Qodicat、水杉
>/ 投稿或爆料,請聯系郵箱:wzglyay@virxact.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.