大家好,我是袋鼠帝。
2026年剛開年,AI圈子終于開始稍微安靜一點了,不過各家似乎都在憋大招。
前兩天我刷X的時候,發現美團居然悄悄咪咪又開源了一個新模型:LongCat-Flash-Thinking-2601。
![]()
不得不說,美團這個更新節奏是真滴卷。
我回憶了下,從去年9月發布Chat版本,到后來的Thinking版本,再到Omni全能版,他們的模型路走得非常穩。
這次的2601版本,更是全面提升了Agent和Thinking能力。
不過真正吸引我去深入研究的,其實是 X 上的一條評論:它居然有8位思考者并行推理。
![]()
這一下子就勾起了我的好奇心,我們之前用的深度推理模式,大多是單線程的,就像一個人在走路,哪怕走得再快,也就是那一條路。
但美團這個設計,像是直接開了一個AI專家團。
趁著上周末去北京參加AIGC開發者大會的間隙,我把這個新模型好好研究了一下。
這一試,我發現它還真有點東西。
先給大家總結一下這次新模型更新的核心亮點(省流版):
1.泛化能力極強,在那種混亂的真實環境里表現很穩,在復雜隨機任務中甚至優于Claude。
2.自動構建多個高質量環境;密集依賴關系圖
3.多環境強化學習:擴展的DORA(我們的強化學習基礎設施),支持大規模多環境智能體訓練
4.核心創新叫Heavy Thinking Mode,也就是深度思考模式:
平行思維:通過多個獨立的推理路徑擴展思維廣度
迭代式摘要:通過使用摘要模型來綜合輸出,增強深度,支持迭代推理循環。
在這個模式下,模型會啟動并行思考,相當于你有多個不同領域的大腦在同時幫你琢磨同一件事。
另外,據說1M(100萬)token的上下文版本也快來了。
![]()
光看參數也沒意思,咱們直接上實測。
目前,深度推理模式可在LongCat AI平臺免費體驗
https://longcat.chat/
讓美團AI團隊解決問題
以后遇到問題不用焦慮了,可以試試美團這個AI團隊,團隊8人,效率極高,還有第9人是個小領導,總結發言,是個全方位思考的智囊團。
![]()
團建聚餐,專治眾口難調
來個美團的拿手好戲,點餐
不過有點刁鉆:
prompt:我們在深圳,有8個同事要聚餐,預算只有300元。小張不吃辣,小李對麩質過敏,小王必須喝冰美式,老板想吃地道的本地菜,剩下的4個人里有人在減肥,有人想吃重口味。請尋找最優性價比方案,并給出具體的點單組合和湊單攻略。
這要是讓人來想,估計頭發都得掉一把。
當時打開深度思考后,嚇我一跳,原來這就是重度思考嗎
屏幕上直接冒出來8條并行的思維鏈!直接多出來8個腦子
![]()
有一種從單行道突然變成8車道的開闊感
來看看 LongCat 的 8 位 Thinker 是怎么應對的。
![]()
它們分別給出了不同的策略:有的建議分開點外賣,有的推薦了性價比極高的潮汕套餐,還有的另辟蹊徑建議去吃早茶。
這8個大腦并行工作完之后,還會有一個裁判角色的模型出來做總結,把各個方向的精華提煉出來,形成最終的答案。
俗話說三個臭皮匠頂個諸葛亮,美團這是直接給我安排了三個諸葛亮啊。
最后的綜合方案很不錯,模型經過權衡后發現,在深圳 300 塊錢滿足這么多人的堂食需求幾乎是不可能的,所以最優解是點外賣,并且給出了具體的分店鋪湊滿減攻略。
![]()
最讓我驚訝的是細節:它甚至提醒我,醬油里可能含有麩質,一定要給商家備注小李的過敏情況。
這種細致程度,單靠一條思維鏈是很容易遺漏的。這也體現了并行思考的優勢:既有廣度,又有深度。
而且速度依然很快,這也是我一直比較喜歡美團模型的一點,干活講究效率
假如明天AGI到來?
前端時間,馬斯克的訪談提到,AGI可能很快就會實現
所以我又問了一個稍微宏大一點的問題:假如明天AGI突然到來,世界會變成什么樣?
這回的思維鏈就像是一場高質量的圓桌論壇,類似上周六我參與分享的圓桌會議
有的Thinker在分析對就業市場的沖擊,有的在預測經濟結構的重組,還有的在探討人類認知的顛覆。
![]()
看著這 8 個大腦在屏幕上互搏,非常有意思。
它們各有各的觀點,但最后又能達成某種共識。這和我們人類社會其實很像,真理往往就是在不斷的辯論和碰撞中產生的。
![]()
法律智囊團:隨身攜帶的律師天團
這個場景非常實用,假設我不小心在商場碰碎了一個標價8.8萬的藝術品,商場態度強硬要我全額賠償,那不是完犢子了?
我把情況描述給LongCat,讓它做我的辯護律師。
prompt:我在商場行走時,背包不慎剮蹭到了擺放在轉角處的一個藝術品展架,導致一件標價 8.8 萬元的藝術瓷器摔碎。商場方目前態度強硬,拒絕任何調解,要求我按照標價全額賠償。作為被告,我的抗辯點在于:展架位于人流量大的轉角處,且沒有任何物理防護(如玻璃罩);展架底座極輕,明顯不符合擺放易碎重物的安全標準;我只是正常行走,并無跑跳等過激行為。請你作為我的專業辯護律師。反應速度非常快,幾個 Thinker 迅速從不同角度切入。
有的負責分析商場的過錯,有的提到一些案例參考,還有的側重風險評估和緊急措施。
![]()
它給出的一些答案,我怕是幻覺,還特地去核實了以下思維鏈中提到民法典1198條、1165條、1173條,也是正確的。
![]()
有點可惜的是重度思考暫時還沒接入聯網搜索,所以這塊大家還是要謹慎,出的條款最好都去印證一下,畢竟思考模型普遍都會有幻覺,有出錯的概率。把它當做輔助律師團即可。
最終回答:
![]()
不過對于我們普通人來說,遇到這種突發狀況,能有這么一個智囊團,可以第一時間快速了解一些信息,心里真的會踏實很多。
中西結合的身心健康指導
有一些朋友和我聊起最近莫名不太好入睡,想起來下個月就過年了,
是丙午馬年,丙火和午火雙火疊加,六十年一遇,
部分朋友可能會有水火交戰的情況,明明沒有什么心煩的事情,卻睡不著,趕緊來試試Longcat怎么說。
還有,我從小到大基本上午覺就沒睡著過,可能是過度焦慮的原因?
很好玩的是,居然得到了中西結合的回答,還是那句話,集百家之所長,取其精華,去其糟粕,很好用。
如果是其他大模型,被我引導提問,就只會從中醫的角度回答了。
下面豆包的回答,被我提問之后,只會從中醫角度回答問題:
![]()
但 LongCat的 8 個Thinker 里,有的Thinker提供中醫視角,有的提供現代醫學視角,有的提供改善睡眠建議,真的是面面俱到,中西結合,完美!
![]()
以下是正文回答,有需要的朋友可以參考一下,也可以點贊轉發,說不定你就有朋友也遇到了。
![]()
風格化寫作,絕了
我讓它用最強烈的文學風格描寫一碗螺螄粉,并且讓它自己選擇流派。
prompt:我現在手里端著一碗熱騰騰的、聞起來臭吃起來香的螺螄粉。 我希望看到風格極度強烈的文學描寫。請選擇一個你認為最有趣的文學流派(例如:魯迅的冷峻諷刺、古龍的簡潔蕭殺、王家衛的曖昧破碎、張愛玲的華麗蒼涼等等)。8 位大作家開始吭哧吭哧寫作。最后的評判環節非常有意思。有 5 位 Thinker 選擇了張愛玲風格,2 位選了古龍,1 位選了王家衛。
![]()
按理說,少數服從多數,最后應該是張愛玲風格勝出。因為已經有5位部下都選了張愛玲風格,
畢竟作為領導,最輕松最不用擔責的決策才是最經濟的。
但那個負責總結的裁判模型展現出了驚人的批判性思維,它認為古龍那種簡潔蕭殺的風格,反而更能突出一碗螺螄粉的江湖氣,而且能避免答案的同質化。
最終輸出的古龍風描寫,文筆真的是一絕。
![]()
這也讓我突然意識到,這種多模型并行思考加裁判決策的機制,可能真的代表了未來AI決策的一種新方向。
代碼能力
Prompt:幫我設計一個貓貓狗狗掛飾網站的前端,要可愛風,寫在一個HTML文件里
迅速完成了代碼,購物車邏輯、結算功能都寫了,交互體驗也很流暢。
后來我又試著讓它寫一個大魚吃小魚的游戲。
它通過聯網搜索參考了最佳實踐,還自動給游戲里的魚加上了 AI 判定,大魚會追,小魚會跑,可玩性瞬間提升了一個檔次。
為什么美團這個模型值得關注?
美團這次的 Heavy Thinking Mode,本質上是在解決大模型思考深度不足的問題。
以前我們覺得大模型像個百科全書,問啥知道啥,但一遇到需要推理、規劃的復雜問題就容易掉鏈子。
LongCat的思路是:既然一個腦子不夠用,那就用八個。
通過并行推理(Parallel Thinking),先讓思維發散出去,覆蓋盡可能多的可能性;再通過迭代摘要(Iterative Summarization),把這些發散的思維收斂回來,提煉出最優解。
這就像我們在公司開會解決難題,先大家頭腦風暴,各抒己見,這是廣度。然后項目經理把大家的想法匯總、去重、優化,形成方案,這是深度。
而且美團在訓練這個模型的時候,用了大量的合成環境和抗噪聲訓練,這意味著什么?
意味著這個模型不是溫室里的花朵,它是真的被扔到那種充滿了不確定性、信息不完整的真實環境里去摸爬滾打過的。
所以它在面對我們現實生活中那些亂七八糟的任務時,適應性會特別強。
美團雖然在這一波大模型浪潮里起步不算最早的,但他們追趕的速度真的讓人驚訝。
上周末我們幾個博主聊天還在感慨,像 Meta、微軟這些巨頭,有錢有卡,但在大模型上也逐漸沒啥聲音了。
這也側面反映,做大模型這事兒,門檻真的很高,不是誰都能一直在牌桌上的。
美團能堅持下來,并且不斷有這種高質量的產出,說明他們對 AI 是有自己獨立的思考和戰略定力的。
如果你也對AI Agent感興趣,或者在開發相關的應用,可以去試試這個LongCat-Flash-Thinking-2601。
可能會給你帶來一些意想不到的驚喜。
點擊關注下方賬號,你將感受到一個朋克的靈魂,且每篇文章都有驚喜。
能看到這里的都是鳳毛麟角的存在!
如果覺得不錯,隨手點個贊、在看、轉發三連吧~
如果想第一時間收到推送,也可以給我個星標?
謝謝你耐心看完我的文章~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.