![]()
智東西
作者 ZeR0
編輯 漠影
智東西2月11日?qǐng)?bào)道,今天,美團(tuán)龍貓LongCat發(fā)布原生“深度研究”智能體了,還是發(fā)揮美團(tuán)的傳統(tǒng)藝能,主打“AI+本地生活”。
![]()
這個(gè)“LongCat深度研究”新功能,目標(biāo)是成為一個(gè)專業(yè)且更懂用戶的吃喝玩樂全攻略AI助手。
它能通過調(diào)用真實(shí)工具鏈,完成復(fù)雜的生活服務(wù)搜索與規(guī)劃任務(wù),生成詳盡報(bào)告。
比如對(duì)比餐廳、做美食攻略、規(guī)劃路線、避坑預(yù)警,乃至制定一份超詳細(xì)的自駕游行程。
我體驗(yàn)后最直接的感受,就生成報(bào)告速度快、對(duì)比直觀,而且比我自己拍腦袋想的周全多了。
一些我自己做計(jì)劃時(shí)可能忽略的細(xì)節(jié),AI都能考慮到位。比如下面這張表,就是“LongCat深度研究”花幾分鐘生成的報(bào)告里自主涵蓋的。
![]()
這背后的底層優(yōu)勢(shì),是美團(tuán)在本地生活領(lǐng)域長(zhǎng)期沉淀的數(shù)據(jù)與行業(yè)積累。
推薦的餐廳,參考美團(tuán)真實(shí)的消費(fèi)熱度和口碑;推薦的酒店,源自真實(shí)的入住評(píng)價(jià);景區(qū)路線規(guī)劃,有真實(shí)票務(wù)數(shù)據(jù)、實(shí)時(shí)客流監(jiān)測(cè)和官方信息做支撐;連充電樁都直連美團(tuán)接入的實(shí)時(shí)樁源。
所以,“LongCat深度研究”通過多源真實(shí)信息進(jìn)行分析,生成的結(jié)果要更加靠譜。
檢驗(yàn)也非常便利。報(bào)告底部的餐廳、酒店、景點(diǎn)鏈接都能點(diǎn)擊,點(diǎn)開就是對(duì)應(yīng)的大眾點(diǎn)評(píng)頁(yè)面或參考攻略頁(yè)面,可以感受到整個(gè)設(shè)計(jì)完全是從用戶體驗(yàn)出發(fā)。
![]()
每次研究都會(huì)告知大概需要的時(shí)長(zhǎng),我每次都只等了幾分鐘。
除了吃喝玩樂外,“LongCat深度研究”也可以用來做學(xué)習(xí)和工作相關(guān)的分析研究,既能分析互聯(lián)網(wǎng)大廠Agent產(chǎn)品,又能整理春節(jié)AI紅包和機(jī)器人登春晚戰(zhàn)況。
![]()
![]()
![]()
“LongCat深度研究”功能在LongCat網(wǎng)頁(yè)端已上線,目前一天能用10次。
Web端指路:longcat.ai/
LongCat App安卓版本已上線“探索本地生活”功能,iOS版本即將上線該功能。
同時(shí),LongCat團(tuán)隊(duì)披露了使其深度研究功能更靠譜、更好用、更專業(yè)的三大核心技術(shù)。其中在權(quán)威評(píng)測(cè)BrowseComp(加上下文管理)中,“LongCat深度研究”的性能已逼近頂級(jí)閉源模型。
![]()
我體驗(yàn)了挑選餐廳、旅游規(guī)劃、自駕攻略、嚴(yán)肅研究等幾種不同日常需求,供參考:
一、挑選餐廳:核心訴求拉表分析,關(guān)鍵信息劃重點(diǎn)
跟多數(shù)深度功能一樣,“LongCat深度研究”在收到指令后,不會(huì)立即開始執(zhí)行任務(wù),而是先通過幾個(gè)問題,再次確認(rèn)用戶需求,然后才開始推理。
![]()
我提出的要求是:
過年留在北京,想要和父母吃一頓清淡又豐盛的跨年晚飯,幫我精選幾家餐廳并詳細(xì)對(duì)比 好吃為主,優(yōu)先海淀,性價(jià)比高,飲食偏好健康,傾向于交通便利、對(duì)菜品的好評(píng)度高
它會(huì)一次性生成文件和網(wǎng)頁(yè)形式的兩份報(bào)告。
![]()
兩種形式均可下載。文件版暫時(shí)只支持下載Markdown格式,下載Word和PDF格式還未開放。
![]()
網(wǎng)頁(yè)形式的交互頁(yè)面非常直觀好用,右側(cè)可以在目錄導(dǎo)航上點(diǎn)選感興趣的內(nèi)容,而且有大量直觀清晰的表格。
![]()
在給我生成的報(bào)告中,內(nèi)容既有一目了然的6家推薦餐廳省流版總結(jié),又有對(duì)不同菜系多家餐廳地理位置、環(huán)境特色、人均消費(fèi)、環(huán)境特色、營(yíng)業(yè)時(shí)間、推薦菜品的劃重點(diǎn),并且貼心地附上預(yù)訂指南和注意事項(xiàng)。
![]()
每一章節(jié)都放上了推薦餐廳橫向?qū)Ρ瓤偨Y(jié):
![]()
各類菜系分析完后,還有個(gè)整體的推薦餐廳對(duì)比:
![]()
它還準(zhǔn)備了停車建議和交通特別提示,并提供了預(yù)訂策略和對(duì)長(zhǎng)輩健康飲食的建議。
![]()
![]()
最后一頁(yè)又是一份直觀的快速?zèng)Q策指南。
![]()
做出這么一份完整的報(bào)告,總共只花了幾分鐘,效率驚人。
報(bào)告最后有攻略參考列表,每一條都能點(diǎn)開跳轉(zhuǎn)到對(duì)應(yīng)的大眾點(diǎn)評(píng)頁(yè)面。
![]()
不過隨后出現(xiàn)了一個(gè)bug。當(dāng)我在同一個(gè)對(duì)話框提出新的要求時(shí),“LongCat深度研究”受前面的上下文影響,規(guī)劃出現(xiàn)了混亂。
我讓它生成一家老少春節(jié)去東北玩的旅游行程規(guī)劃,結(jié)果它生成的報(bào)告主題還是《北京海淀區(qū)跨年晚餐餐廳精選》。
![]()
重新打開一個(gè)對(duì)話窗口,問題就解決了。
好的地方是,新報(bào)告做的更加細(xì)致和豐富,餐廳關(guān)鍵信息的呈現(xiàn)更突出。
![]()
還有單獨(dú)的性價(jià)比分析、適老性評(píng)估、停車建議對(duì)比。
![]()
![]()
![]()
二、旅游規(guī)劃:行程時(shí)間線清晰,還有消費(fèi)避坑指南
我打開了一個(gè)新的對(duì)話窗口,提出旅游規(guī)劃要求:
一家老少計(jì)劃過年去東北玩一周,預(yù)算3萬(wàn),飛機(jī)和或策劃都考慮,想要住對(duì)老人小孩都方便的酒店,想要把東北特色景點(diǎn)或者風(fēng)土人情都體驗(yàn)了 成人4位,包括2位老人,小孩2個(gè),春節(jié)期間出發(fā),只要是當(dāng)?shù)靥厣几信d趣,就是普通老人和小孩的需求和身體狀況
生成的報(bào)告也像模像樣,有種白嫖專業(yè)旅游公司的既視感。
![]()
和挑選餐廳一樣,報(bào)告上來就先給省流版建議,包括目的地、核心景點(diǎn)、推薦活動(dòng)、特色美食、交通方式和最佳季節(jié)。
接著就是針對(duì)旅行策略、預(yù)算分析、穿衣建議、行程規(guī)劃、住宿交通解決方案、特色美食地圖的詳細(xì)分析,還有貼心的消費(fèi)避坑指南與應(yīng)急預(yù)案。
不僅有一張完整形成規(guī)劃圖:
![]()
還細(xì)化到每天的行程規(guī)劃:
![]()
經(jīng)搜官網(wǎng)核查,冰雪大世界的門票價(jià)是對(duì)的。
酒店推薦、美食地圖也非常清晰地標(biāo)出價(jià)位。
![]()
從穿衣建議、電子設(shè)備防寒、消費(fèi)避坑提醒到應(yīng)急預(yù)案信息,都考慮得很周全。
![]()
三、自駕攻略:周密考慮天氣和加油站分布,連怎么做決策都手把手教
針對(duì)自駕場(chǎng)景,我提出的要求是:
下周一和朋友自駕游去北京郊區(qū)自然景點(diǎn)游玩,幫我規(guī)劃三天的游玩路線,景點(diǎn)要各有各的特色,每條路線上要有加油站、餐廳、超市,每日往返開車時(shí)間不超過3小時(shí) 北京郊區(qū),住宿地點(diǎn)兩種方案都考慮,只要是自然景點(diǎn)都行,要有方便停車的地方
報(bào)告上來先總結(jié)了三天天氣預(yù)報(bào),不過把日期搞錯(cuò)了,下周一是2月16日,它寫成了2月17日。
![]()
同樣先給出一個(gè)路線總覽,然后再詳細(xì)規(guī)劃每日行程,包括核心景點(diǎn)的各類門票費(fèi)用和建議時(shí)長(zhǎng)、自駕路況和預(yù)計(jì)通勤時(shí)長(zhǎng)、美食推薦,有的行程還提供多種方案選擇。
![]()
連如何做選擇,都手把手教學(xué)。
![]()
最后還給出多條路線的沿途加油站分布及建議,并附上車輛準(zhǔn)備、旅行裝備的清單。
![]()
四、嚴(yán)肅研究:專業(yè)分析信息豐富,聯(lián)網(wǎng)搜索時(shí)效性強(qiáng)
我還讓“LongCat深度研究”研究現(xiàn)有互聯(lián)網(wǎng)大廠Agent產(chǎn)品/功能及營(yíng)銷方式的共性與區(qū)別,分析這些打法預(yù)計(jì)帶來的收益、成本等影響,要求越全面越好。
它生成的報(bào)告覆蓋戰(zhàn)略布局、營(yíng)銷戰(zhàn)局、商業(yè)影響、未來展望等章節(jié)。
![]()
報(bào)告挑了美團(tuán)、字節(jié)跳動(dòng)、阿里巴巴、騰訊、百度、快手做對(duì)比,并毫不客氣地把美團(tuán)放在最前面。
![]()
營(yíng)銷戰(zhàn)局分析中,數(shù)據(jù)很新,涵蓋了近期的春節(jié)紅包大戰(zhàn)。
![]()
不過在后面分析商業(yè)影響和影響展望時(shí),就完全放在宏觀行業(yè)層面,沒有聚焦這幾家互聯(lián)網(wǎng)大廠去做分析。
![]()
![]()
最后,報(bào)告列出5條結(jié)論,中國(guó)互聯(lián)網(wǎng)巨頭的AI Agent之戰(zhàn)上價(jià)值。
![]()
五、吃喝玩樂攻略靠譜性,超過其它主流AI產(chǎn)品
LongCat組織了來自全國(guó)數(shù)十個(gè)城市的眾多用戶參與吃喝玩樂攻略的橫向盲測(cè)。
題目覆蓋從國(guó)內(nèi)外熱門旅游城市到四五線城市,讓各地用戶對(duì)熟悉的城市攻略進(jìn)行評(píng)價(jià),以獲得真實(shí)判斷。
調(diào)查結(jié)果顯示,在衡量攻略有用性的“保存分享率”指標(biāo)中,LongCat占比達(dá)到31.1%,位居第一,超過ChatGPT的16.7%。
在判斷攻略可用程度的“整體可用率”指標(biāo)中,LongCat占比更是高達(dá)61.1%,高于ChatGPT(42.8%)等其他主流AI產(chǎn)品。
六、怎么做到的?背后三大核心技術(shù)揭秘
“LongCat深度研究”背后有三大核心成果的支撐:
(1)智能體搜索能力卓越:在權(quán)威評(píng)測(cè)BrowseComp(加上下文管理)中達(dá)到73.1分,性能已逼近頂級(jí)閉源模型,具備行業(yè)領(lǐng)先的復(fù)雜任務(wù)決策與推理能力。
![]()
(2)超長(zhǎng)程、高并發(fā)任務(wù)處理能力:支持最多400輪交互與256K上下文,能持續(xù)理解并拆解極端復(fù)雜的個(gè)性化需求與長(zhǎng)文檔研究。
(3)多智能體專業(yè)化分工閉環(huán):實(shí)現(xiàn)從“信息收集(Search Agent)→ 研究分析(Report Agent)→ 可視化呈現(xiàn)(Render Agent)”的全程自動(dòng)化工作流,交付即用型專業(yè)報(bào)告。
1、真實(shí)場(chǎng)景+科學(xué)訓(xùn)練,讓AI更懂生活
(1)真實(shí)原生的本地生活訓(xùn)練環(huán)境:依托美團(tuán)在本地生活領(lǐng)域的原生能力,搭建了一套覆蓋POI搜索、地圖路線規(guī)劃、評(píng)論/筆記檢索的真實(shí)工具集,讓Agent在與真實(shí)環(huán)境的交互中完成訓(xùn)練。
這一方式確保了訓(xùn)推環(huán)境的一致性,使Agent在訓(xùn)練階段即可感知真實(shí)場(chǎng)景的復(fù)雜性與多變性,從而有效提升其在線上處理實(shí)際任務(wù)時(shí)的表現(xiàn)。
(2)基于Rubrics的高質(zhì)量數(shù)據(jù)合成:由專家依據(jù)美團(tuán)本地生活真實(shí)業(yè)務(wù)數(shù)據(jù)提煉餐廳推薦、旅行規(guī)劃等場(chǎng)景及需求點(diǎn),整合為系統(tǒng)的Rubrics(評(píng)價(jià)準(zhǔn)則)體系,再通過LLM生成具體Rubrics組合,反向合成高質(zhì)量Query與Trajectory,最終以Rubrics-as-Reward篩選Trajectory用于SFT與強(qiáng)化訓(xùn)練。
這一方式將美團(tuán)本地生活經(jīng)驗(yàn)注入模型訓(xùn)練,更好地對(duì)齊用戶偏好,讓Agent更懂用戶。
![]()
2、智能生成+自適應(yīng)渲染,交付清晰好用的專業(yè)報(bào)告
(1)“全局規(guī)劃-遞歸生成”的長(zhǎng)文構(gòu)建機(jī)制:采用multi-stage漸進(jìn)式生成架構(gòu),先基于全網(wǎng)搜索摘要生成全局“報(bào)告大綱”,確保邏輯框架的嚴(yán)密性;隨后通過“遞歸生成”(Recursive Generation)策略,將當(dāng)前章節(jié)大綱、相關(guān)搜索文檔與前序章節(jié)上下文聯(lián)合輸入,逐章撰寫。
這一機(jī)制有效解決了長(zhǎng)文本生成中的邏輯斷層與上下文遺忘問題,既保證了報(bào)告的全局連貫性和低幻覺率,又實(shí)現(xiàn)了針對(duì)特定子話題的深度信息挖掘。
![]()
(2)端到端自適應(yīng)網(wǎng)頁(yè)渲染:摒棄傳統(tǒng)的模板填充模式,采用端到端生成技術(shù)直接輸出渲染結(jié)果。Render Agent能夠理解報(bào)告內(nèi)容的語(yǔ)義結(jié)構(gòu),動(dòng)態(tài)決定最佳的視覺呈現(xiàn)形式(如自動(dòng)生成對(duì)比表格,決策流程圖或數(shù)據(jù)可視化圖表),讓本地生活信息的呈現(xiàn)從“靜態(tài)文本”進(jìn)化為“可視化界面”,大幅提升了用戶獲取探店、旅行規(guī)劃等生活決策信息的效率與體驗(yàn)。
3、多維校驗(yàn)+跨域融合,確保精準(zhǔn)可信的解析與規(guī)劃能力
(1)Rubrics-as-Reward的多維價(jià)值對(duì)齊:在數(shù)據(jù)清洗與強(qiáng)化學(xué)習(xí)階段,引入Rubrics-as-Reward機(jī)制,建立了包含引用準(zhǔn)確率、信息召回率、報(bào)告深度、指令遵循度及可讀性在內(nèi)的多維評(píng)分體系,對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行極高標(biāo)準(zhǔn)的清洗與篩選。
這一機(jī)制解決了AI搜索產(chǎn)品常見的“幻覺”問題,特別強(qiáng)調(diào)引用準(zhǔn)確率,確保每一條本地生活建議(如營(yíng)業(yè)時(shí)間、價(jià)格、地址)都有據(jù)可查。
(2)跨域知識(shí)融合的合版訓(xùn)練策略:采用混合訓(xùn)練策略,將Report與Render的垂直領(lǐng)域數(shù)據(jù),與通用語(yǔ)料、數(shù)學(xué)、代碼等數(shù)據(jù)進(jìn)行聯(lián)合訓(xùn)練,利用代碼和數(shù)學(xué)數(shù)據(jù)的嚴(yán)謹(jǐn)邏輯特征,反向增強(qiáng)生活類報(bào)告生成的條理性與任務(wù)規(guī)劃能力。
通過“通專結(jié)合”,該策略將理工科的強(qiáng)大邏輯推理能力注入到生活決策場(chǎng)景中,使Agent能像分析師一樣 “拆解復(fù)雜需求”。
結(jié)語(yǔ):專業(yè)的AI深度研究功能,正逐漸走入尋常百姓家
多家互聯(lián)網(wǎng)大廠正在探索結(jié)合自身優(yōu)勢(shì)的Agent產(chǎn)品。今天上線的“LongCat深度研究”功能,聚焦于如何讓AI真正理解并解決現(xiàn)實(shí)世界的問題,發(fā)揮出美團(tuán)在生活場(chǎng)景中的專長(zhǎng)。
隨著越來越多貼近生活、準(zhǔn)確度高的Agent應(yīng)用上線,AI深度研究的能力將普惠到更多人群,讓工作效率更高,也讓生活更加便利和美好。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.