![]()
編輯 | 澤南、楊文
春節(jié)還沒到,「過年的氣氛」已經滲入科技圈每個人的毛孔。單說 AI 大模型這一塊,剛剛發(fā)布的有 kimi 2.5 和 Step 3.5 Flash,即將發(fā)布的據說還有 DeepSeek V4,GPT-5.3、Claude Sonnet 5、Qwen 3.5,GLM-5,說不定一覺醒來,現有的技術就要被顛覆。
再看看千問和元寶發(fā)的紅包,組團上春晚的機器人,所有廠商在春節(jié)期間都擺出一副志在必得的架勢。
正因為如此,我們在這個臨近長假的時間段,又遭遇了很多的變數。很多人的行程調了又調,不到最后一刻不知道哪幾天有空,難不成這場 AI 的革命,反而會讓我們忙到忘了過節(jié)?
或許 AI 的事還是用 AI 來解決,今年春節(jié)的安排,必須得上「深度研究」了。
說來也巧,我們發(fā)現美團大模型 LongCat 剛剛上線了這個功能。
![]()
LongCat(龍貓)系列大模型,最近才火起來的,在 AI 圈里它的口碑主要是速度快,工具調用出色,走「實用主義」路線
作為大模型領域的后來者,美團進度追趕得很快,1 月份的上一次升級已經搞出了「重思考」模式,當時網友們的反響很不錯。
![]()
這一次的 「深度研究」(DeepResearch)上,LongCat 又把實用化推向新的高度。
正好,我們就用它來安排一下春節(jié)的事兒。值得注意的是,該功能每日最多能生成 10 次。
- 體驗鏈接:https://longcat.ai/
大腦放空
讓 AI 去研究
稍微一想,過年要辦的事情還分挺多種:我們要吃好吃的,要走親送禮,要出去玩,要看電影…… 這些需求看似簡單,但需要使用大量信息檢索,且要求深度的本地化理解。
當下 AI 助手遍地開花,大多都在賣力展示自己能回答多少問題、生成多少內容,但真正能解決實際生活難題的,少之又少。此次美團上線的 LongCat 深度研究功能,似乎正在改變這一現狀。
選擇「深度研究」,輸入這樣一段需求:
過年全家要去廣州玩三天,住在天河區(qū),想去體驗最正宗的「老廣」生活。幫我找 3 家隱藏在老城區(qū)巷子里的老字號餐廳(非網紅連鎖店),要求是當地老街坊常去,5 人總預算 1000 元以內,對比這些老字號的招牌菜和價格,對比服務和餐廳環(huán)境等優(yōu)劣勢,并給出參考建議。
https://longcat.chat/share-web/14e876cf-ec2b-490c-aea4-c9699a794125
LongCat 并沒有貿然作答,它先拋出幾個關鍵問題:具體哪幾天去廣州?更偏好哪種類型的老廣美食?對環(huán)境有什么特殊要求?能接受多遠的交通距離?

待信息補充完整后,它才開始真正的信息搜集和分析工作。最終生成的調研報告不僅羅列了三家老字號的招牌菜和價格,還直接給出預算內的配菜方案、交通路線,甚至用代碼寫了個 2026 春節(jié)晚餐時段避峰指南。

LongCat 最大的優(yōu)勢,在于它背靠美團在本地生活領域沉淀的數據。報告中提到的每家餐廳,都有真實的交易數據作為支撐。誰家的招牌有 155 人推薦、誰家環(huán)境評分 4.1、誰家春節(jié)延長營業(yè)時間…… 這些均來自美團真實用戶的消費反饋和商家實際經營數據。
報告末尾羅列的信息來源,點擊即可跳轉至大眾點評,下單或核查信息都很方便。
一到過年,自然少不了走親訪友,帶些什么禮物也是頗為講究。
我們設置這樣一個情景:
過年要回杭州老家走親戚,需要準備三份禮物。父母 50 多歲,爸爸愛喝茶,媽媽血糖高要控糖;姨媽和姨夫身體還不錯但牙口不太好;姑媽 58 歲很注重養(yǎng)生,姑父喜歡書法。每家預算 600 元左右,要求禮品體面有檔次、適合長輩、最好能體現杭州特色,幫我在杭州市區(qū)或周圍商圈找找,每家推薦 1-2 種禮品組合方案,標注購買地點、價格明細,對比實用性和心意表達,給出最優(yōu)搭配建議。
https://longcat.chat/share-web/59811426-763a-48d0-84cc-63f7124d5290
我們來看下 LongCat 整個信息搜集過程。它先從提示詞中提煉關鍵詞進行網頁搜索,再把網頁推薦的杭州特產禮品拿到大眾點評上進行本地搜索,繼而精準定位到具體商家。

在禮物選擇上,它將三組長輩按健康狀況、飲食限制、文化偏好分類,再匹配對應的禮品策略。父母需要控糖就配低糖燕窩,姨媽牙口不好就選軟糯糕點,姑父喜歡書法就推薦邵芝巖毛筆配西泠印社文創(chuàng)。
LongCat 還標注了商家間的距離和步行時間,規(guī)劃出高效采購動線。考慮到春節(jié)期間網紅店會提前關門,建議除夕前完成采購,甚至連軟糯糕點需要冷鏈運輸、龍井要認準防偽標這些容易忽略的細節(jié)也都照顧到了。

「AI + 本地生活」就這樣被重新定義了。「LongCat 深度研究」不僅能夠通過調用真實工具鏈,完成高難度的生活服務搜索與規(guī)劃任務,同時也做到了可信、專業(yè)、量身定制。
據近期一項測試顯示,LongCat 「深度研究」功能在實用性和可靠性得到用戶的廣泛驗證。
該測試邀請全國 36 個城市的 60 名用戶參與吃喝玩樂攻略的橫向盲測,評估各 AI 產品生成的旅游攻略質量。
數據顯示,在「保存分享率」(用戶認為攻略非常有用,愿意直接保存或分享)指標中,LongCat 以 31.1% 的占比位居第一,而 ChatGPT 僅有 16.7%;在「整體可用率」(用戶認為攻略大部分或完全可用)指標中,LongCat 達到 61.1%,高于 ChatGPT 42.8% 等其他主流 AI 產品。
這表明,在這類任務中 LongCat「開箱即用」的程度和整體可用性,已在超越了包括 ChatGPT 在內的通用型 AI 產品。
就給人一種感覺,以后吃喝玩樂這些事,你只管起個念頭,剩下的交給它就行。
不過,別以為 LongCat 只懂吃喝玩樂,它干正事同樣在行。
最近《太平年》上映,不少觀眾對劇中那位「十朝元老」、「政壇不倒翁」馮道褒貶不一。有人說他是忠貞之士,有人罵他是奸臣之尤,那么馮道究竟是怎樣一個人?我們把這個嚴肅的歷史評價問題拋給 LongCat。
https://longcat.chat/share-web/ec2e7dff-0054-4720-baa9-4d77b59e72cd
它沒有簡單地貼上「好人」或「壞人」的標簽,而是將馮道置于五代十國「合法性真空」的大背景下審視:半個世紀里五個王朝輪替,軍閥以武力奪權,「忠君」的對象本身就在不斷變化。接著拆解馮道的政治哲學,他將效忠對象從具體君主轉向文明存續(xù),以「安民」為最高目標。
LongCat 指出,馮道主持刊刻《九經》歷時 22 年,跨越三個朝代從未中斷,這是中國首次由國家主導的大規(guī)模圖書出版工程。它為宋代「文治」奠基,開創(chuàng)了官刻圖書先河。
報告還梳理了歷史評價的流變。歐陽修批判馮道「無廉恥」,司馬光斥為「奸臣之尤」,但蘇轍認為這是「亂世生存」,李贄盛贊他「重民而不重君」。LongCat 把這種分歧放在宋代重建儒家倫理的時代背景下解讀,馮道被符號化為批判靶子,其實是政治建構的產物。

可以看出,LongCat 能夠平衡不同觀點,從政治、文化、道德多維度分析,最終給出「在忠君與仁民沖突中做出艱難抉擇的悲劇性人物」這樣深刻的結論。這種能力,已經接近專業(yè)研究者的水準。
LongCat 的技術方法論
讓大模型「學好理工」
在深度研究能力的背后,是 LongCat 強大的邏輯推理和復雜任務處理能力。
新版本的 LongCat 具備超長程、高并發(fā)的任務處理能力,支持最多 400 輪交互 與 256K 的上下文,這意味著它能夠持續(xù)理解并拆解復雜的個性化需求與長文檔研究。
工程人員為 LongCat 構建了多智能體的自動化工作流,實現了從信息收集(Search Agent)、研究分析(Report Agent)到可視化呈現(Render Agent)的專業(yè)化協作分工,從而交付直接可用的專業(yè)報告。
在權威評測基準 BrowseComp 上,LongCat 的智能體搜索能力達到了 73.1 分,性能已逼近頂級閉源模型,這意味著 LongCat 已經具備行業(yè)領先的復雜任務決策與推理能力。
![]()
再往技術細節(jié)里看,從生成架構、訓練到后訓練,LongCat 都具備一定的獨特之處。
首先,LongCat 模型訓練的過程,強調真實與原生。在訓練過程中,背靠美團在本地生活領域的原生積累,模型搭建了一套覆蓋 POI 搜索、地圖路線規(guī)劃、評論 / 筆記檢索的真實工具集,讓 Agent 一直在與真實環(huán)境的交互中完成訓練。
這正是 LongCat 最具特色的地方,通過圍繞真實場景的訓練,該模型在 Agentic Search(智能體搜索)和工具調用方面表現出色。它非常善于理解復雜的 API,并能準確地調用工具來完成任務(比如查詢庫存、修改訂單等),這就有效提升了其在線上處理實際任務時的表現。
![]()
其次,LongCat 學會了人類寫報告的方式。通過多步驟漸進式生成架構,AI 會先基于全網搜索摘要生成全局 「報告大綱」,確保邏輯框架的嚴密性,隨后通過「遞歸生成」 (Recursive Generation) 的策略,把當前章節(jié)大綱、相關搜索文檔與前序章節(jié)上下文聯合輸入,逐章撰寫。
這種機制有效解決了 AI 在長文本生成中的邏輯斷層與上下文遺忘的問題,讓 LongCat 的文章不會一開始有邏輯,越往后越離譜,同時也能保證你所提需求的每個細分方面都能獲得足夠的信息挖掘。
![]()
再往下,LongCat 通過多種校驗機制,進一步保證了生成內容的準確性。在數據清洗與強化學習階段,LongCat 引入了 Rubrics-as-Reward 機制,建立了包含引用準確率、信息召回率、報告深度、指令遵循度及可讀性在內的多維評分體系,對訓練數據進行高標準的清洗與篩選。
該機制強調資料引用的準確率,大幅減少了大模型幻覺問題,可以確保 LongCat 給出的每一條本地生活建議(如店鋪營業(yè)時間、價格、地址)都有據可查。
最后,LongCat 的 DeepResearch 版還強調了「跨域知識融合的合版訓練策略」,給大模型這個「文科生」補足了「理科」課程,使其變成了一個擁有工程師思維的旅行規(guī)劃師。
在該混合訓練策略下,Report 與 Render 的垂直領域數據,與通用語料、數學、代碼等數據進行了聯合訓練。代碼和數學數據的嚴謹邏輯特征,被用于反向增強生活類報告生成的條理性與任務規(guī)劃能力。
通過「通專結合」的方式,強大的邏輯推理能力被注入到生活決策場景中,使智能體不僅能寫文章,還能有條理地拆解復雜需求。
綜上所述,LongCat 這次解決了很多以往 AI 寫報告、攻略「看起來很美,真去執(zhí)行全是坑」的問題,讓大模型變成了能真正幫你把復雜需求拆解清楚,還能算明白賬的專業(yè)分析師。
結語
真正理解現實世界,能解決問題的 AI 原來是這樣。
不得不說,在大模型技術逐漸成熟的當下,LongCat 面向實用化發(fā)力的方法讓我們看到了一個 AI 落地的新解法:在模型架構之外,把 AI 能力充分嵌入已有生態(tài),能夠產生前所未有的能力。通過連接供給豐富、反饋真實的本地生活網絡,AI 大模型可以精準直連用戶的需求,提供真實、個性化且實時可用的信息。
這兩天,LongCat APP 即將上線「探索本地生活」,讓深度研究能力聚焦于美團業(yè)務上,成為專業(yè)的 AI 地陪。
![]()
這或許會引發(fā)一場真實性的質變。在不遠的未來,我們的生活或許會是這樣子:把腦海中閃過的念頭交給 AI 來實現,看看攻略,就可以一鍵出發(fā)。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.